《信通院-手机人工智能技术与应用白皮书(2019)-2019.6-38页.pdf》由会员分享,可在线阅读,更多相关《信通院-手机人工智能技术与应用白皮书(2019)-2019.6-38页.pdf(38页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 手机人工智能手机人工智能 技术与应用白皮书技术与应用白皮书 (2019 年)年) 中国信息通信研究院中国信息通信研究院 中国人工智能产业发展联盟中国人工智能产业发展联盟 2019年年6月月版权声明版权声明 本白皮书版权属于中国信息通信研究院和中国人工智本白皮书版权属于中国信息通信研究院和中国人工智能产业发展联盟,并受法律保护。转载、摘编或利用其它方能产业发展联盟,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:中国信息式使用本白皮书文字或者观点的,应注明“来源:中国信息通信研究院和中国人工智能产业发展联盟” 。违反上述声明通信研究院和中国人工智能产业发展联盟”
2、 。违反上述声明者,编者将追究其相关法律责任。者,编者将追究其相关法律责任。 前前 言言 随着手机从功能机向智能机的演变逐渐完成,移动互联网与智能手机的创新动力减弱,产业进入了有限创新、有限增长的成熟阶段,已成型的巨大产能迫切寻觅新的增长点; 人工智能是一种引发诸多领域产生颠覆性变革的前沿技术,在视觉、语音、自然语言等应用领域迅速发展,并逐渐向终端延伸。2018年起,各主流终端厂商的旗舰机型均引入人工智能元素,通过触屏、摄像头、语音等多种方式,更直接地满足用户需求,改变其生活方式。人工智能对移动智能终端行业的赋能,或成为引发手机产业下一轮技术和创新变革的源动力。国内外巨头也纷纷看好其融合创新空
3、间广阔, 已争相发力, 加快产业布局。 中国信通院以2019版白皮书为载体, 系统探讨AI在手机上的技术融合与实际应用情况,对产业链的影响,面临的问题挑战,相应解决方案以及对未来发展趋势的展望,向产业界分享已知,共同推动我国人工智能和手机融合技术产业迈向新高度。 目 录 一、 智能手机产业发展基本态势. 1 (一) 智能手机市场趋于饱和 . 1 (二) AI 技术趋于实用化,从云侧向端侧延伸 . 4 (三) AI 与手机融合创新空间广阔,手机企业加快布局 . 5 (四) 明确 AI 手机定义,将促进产业生态良性发展 . 6 二、 AI 在智能手机中的应用趋势 . 7 (一) 端侧异构芯片加速升
4、级,支撑 AI 专用计算力需求 . 7 (二) 智能化传感器件逐步成熟,推动感知交互技术创新 . 10 (三) 端侧 AI 框架和算法迭代创新,提供应用加速能力 . 11 (四) 5G 网络技术逐步走向商用,极大拓展 AI 应用场景. 15 (五) AI 丰富智能手机应用场景,极大繁荣应用生态. 17 三、 AI 对全球智能手机产业链的影响 . 18 (一) 手机芯片产业 . 19 (二) 关键元器件产业 . 20 (三) 手机软件产业 . 22 四、 我国智能手机 AI 技术与应用发展情况. 24 (一) 我国终端产业对 AI 技术的应用已较为成熟 . 24 (二) 手机厂商加快 AI 技术
5、布局 . 25 (三) 算法企业深化手机场景能力 . 26 五、 面临的问题与挑战. 26 (一) 底层技术创新和生态建设布局有所不足 . 27 (二) 手机智能化能力标准与规范尚需完善 . 27 (三) 手机与 AI 的结合带来安全与监管新挑战 . 28 六、 未来发展与展望. 30 (一) AI 芯片开始从高端向中低端普及 . 30 (二) 算力、通信等基础能力提升,打造 AI 终端生态体系 . 30 (三) AI 终端多领域融合,向垂直行业渗透 . 31 (四) 软件框架降低使用者技术门槛,扩展 AI 终端创新群体 . 31 手机人工智能技术与应用白皮书(2019) 一、 智能手机产业发
6、展基本态势 (一)(一) 智能手机智能手机市场趋于饱和市场趋于饱和 从市场规模来看,智能手机市场进入滞涨期。据 IDC 统计数据显示,全球智能手机出货量在 2015 年达到峰值,之后出现放缓趋势。2017 年全球智能手机出货量同比下滑 0.1%,2018 年前三季度出货量达到 10.3 亿部,较 2017 年下滑 2.9%。从国内市场来看,由于 4G 市场趋于饱和,5G、AI 等新技术尚未成熟,新的市场需求刺激不足导致换机周期拉长,我国智能手机出货量连续六个月负增长,市场呈现加速下滑态势。 数据来源:IDC 统计数据 图 1 2012-2018 年全球智能手机市场出货量统计 据中国信通院数据统
7、计, 2019 年第一季度国内智能手机出货量总和达到 7693 万台,较 2018 年同比大幅下滑 11.9%,下滑趋势较全球市场更为明显。Digitimes Research 的数据显示,2019 年第一季度中国手机制造商的智能手机出货量季度环比下降 30.5%,同比下降5.8%,至 1.4 亿台。而 Canalys 的一项研究估计,中国智能手机市场40000 42000 44000 46000 48000 50000 52000 54000 2012Q1 2012Q2 2012Q3 2012Q4 2013Q1 2013Q2 2013Q3 2013Q4 2014Q1 2014Q2 2014Q
8、3 2014Q4 2015Q1 2015Q2 2015Q3 2015Q4 2016Q1 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4 1 手机人工智能技术与应用白皮书(2019) 第一季度同比萎缩 3%。 数据来源:中国信息通信研究院统计数据 图 2 2017-2019 年国内智能手机出货量统计 从技术架构来看,智能手机硬件技术处于微创新阶段。据企鹅智库发布的调研报告,自 2017 年起,用户的换机频率明显下降:从未用过 iPhone 的安卓用户中,至少一年一换的用户比从 34.7%下降
9、到了 23.5%;iPhone 用户每年换机占比则下降至 16%。造成这一现象的主要原因在于 4G 浪潮褪去,智能手机创新势头放缓,性能提升主要围绕硬件规格的升级。纵观 2017 年至 2018 年,智能手机创新依旧主要围绕双 4G、全面屏、FaceID、无线充电等既有技术,双 4G 技术仅针对有双卡需求的部分用户;无线充电技术还在发展过程中,存在充电速度较慢、发热严重、标准不统一等问题;全面屏技术经过多年发展,屏占比已超过 90%关口,继续提升的空间十分有限;而人脸识别技术用户体验褒贬不一,甚至受到部分用户的抵制。不难看出,近两年智能手机在总体技术发展上依旧延续现有构架, 缺乏颠覆性创新技术
10、或设计,创新点主要用于提升用户感受以及使用方便度,难以对消0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 2017年 2018年 2019年 2 手机人工智能技术与应用白皮书(2019) 费者换机形成真正的强驱动力。 从操作系统来看,寡头垄断市场格局已经确定。全球智能手机操作系统市场垄断态势明显,其中安卓占据 86%的市场份额,iOS 占据14%,其余操作系统的市场份额基本为零。纵观 2011 到 2018 年,随着手机产业从功能机到智能机的时代转型, Andro
11、id凭借其开源优势,iOS 凭借极致的用户体验,逐步打造了开放和封闭两种截然不同的生态模式,瓜分了手机操作系统的市场。随着智能机市场进入成熟稳定发展期,操作系统双寡头局面形成并稳固。 数据来源:IDC 统计数据 图 2 2011 至 2018 年几种主流操作系统占比变化 从应用程序来看,数量持续增长,应用场景、应用模式固化。随着智能手机的逐渐普及,其智能化的核心载体移动应用软件(下文简称 app)呈现井喷式的增长,对人们的社会生活方式和经济生产方式产生了深刻的影响,成为推动整个社会变革的重要抓手。例如Whatsapp、微信等即时通信类 app,基本代替了手机原本的运营商短信甚至语音业务,成为智
12、能手机必备的基本功能之一。然而,据0% 10% 20% 30% 40% 50% 60% 70% 80% 2011 2012 2013 2014 2015 2016 2017 2018 Android IOS 塞班 黑莓 windows 3 手机人工智能技术与应用白皮书(2019) Gartner 数据的不完全统计显示,即时通信、搜索引擎和网络视频几类应用分别占据了 90%、80%和 70%以上的使用率,表明移动应用改变人们生活习惯的爆炸式突破后,其新增数量虽然持续上涨,但应用种类和每种类别的头部应用却相对持平, 用户对移动应用的使用情况基本稳定在几种特定的应用上, 应用的使用模式和使用场景也相
13、对固化,缺少突破。 数据来源:IDC 统计数据 图 3 移动互联网用户 app 使用情况 (二)(二) AI 技术趋于实用化,从云侧向端侧延伸技术趋于实用化,从云侧向端侧延伸 人工智能与行业领域深度融合。当前 AI 应用百花齐放,产业化发展由人工智能本身转为人工智能驱动,AI 融合赋能成为趋势。当前 AI 主要与安防、金融、交通、教育、医疗等领域相融合,利用深度学习、语音识别、人脸识别、机器视觉、逻辑推理等人工智能领域关键技术,支撑各行业的快速发展,为互联网创新提速注入能量。 人工智能技术端云一体态势初现。传统而言,很多对神经网络的0.65 0.7 0.75 0.8 0.85 0.9 0.95
14、 2018Q4 2018Q2 2017Q4 2017Q2 即时通信(%) 搜索引擎 (%) 网络新闻 (%) 网络视频 (%) 网络音乐 (%) 网上支付 (%) 网络购物 (%) 4 手机人工智能技术与应用白皮书(2019) 训练和推理都是在云端或者基于服务器完成。 随着移动处理器性能不断提升,连接技术不断演进所带来的完整可靠性,很多人工智能推理工作,如模式匹配、建模检测、分类、识别、检测等逐渐从云端转移到了手机侧,其主要原因可归结为以下三点。 一是用户使用场景所需。 2018年是人工智能大众化应用的开始,而移动手机作为当前互联网服务的主要入口, 对人工智能功能需求也越来越迫切,虚拟助手、图
15、片处理、图像识别、人脸解锁等应用成为主流。二是提升用户体验所需。手机侧人工智能的关键优势包括即时响应、可靠性提升,此外,还能确保在没有网络连接的情况下用户的人工智能体验能得到保障。三是数据隐私保护所需。个人数据隐私问题将成为人工智能领域除了技术、应用之外的一大热点。 尽管在这场迁徙中还面临着异构解决方案的融合、 硬件开发成本、手机算力瓶颈等问题,但人工智能从云到端的演变已经在路上,未来人工智能算力将是端侧、边缘侧和云端的协同发展。 (三)(三) AI 与手机融合创新空间广阔,手机企业加快布局与手机融合创新空间广阔,手机企业加快布局 AI 应用范围不断扩大,极大提升使用体验。一是图像领域,其应用
16、场景聚焦于场景识别、美颜、相册分类、背景虚化、暗光增强、人脸识别和文字识别。二是语音领域,包括智能助手、语音翻译、语音搜索等。其中,智能助手是目前使用最为广泛的功能,其语音识别能力更让人机交互体验达到了前所未有的便捷。三是系统软件领域,终端从系统层面进行自适应优化, 应用场景为内部资源智能感知分配和用户/应用行为预测,用于提升系统流畅度、降低资源消耗(如节5 手机人工智能技术与应用白皮书(2019) 电) 、解决安卓手机卡顿等。四是虚拟/增强现实(VR/AR)类领域,虚拟现实的沉浸式体验给用户带来了全新的使用感受, 而增强现实本身就是一种对周围环境的智能化感知,AI+5G+AR/VR 模式将突
17、破传统应用壁垒,成为 AI 在终端应用的一大亮点。 领先智能手机企业向 AI 战略转型。一是软硬件齐推进:华为在2018 全联接大会上首发 AI 战略,从轮值董事长徐直军的话语不难发现,华为已经 ALL in AI;vivo 于 2018 年 7 月宣布成立 AI 全球研究院,希望打造人工智能软硬件平台,推动手机平台完成从“智能”到“智慧”转型。二是手机+智能硬件的产品生态链转型模式:2018 年9 月上海世界人工智能大会上,小米集团董事长兼首席执行官雷军表示,要把人工智能作为小米最重要的战略。三是科研专利转型路线:OPPO 早在 2016 年就已经开始投入研发,建立了先进的训练集群和数据中心
18、,并积累了超过 300 项人工智能专利。从这些领先的手机企业争相向 AI 转型的动作不难看出,人工智能将是手机产业的下一个风口浪尖。 (四)(四) 明确明确 AI 手机手机定义定义,将促进将促进产业产业生态良性发展生态良性发展 目前智能手机市场,颠覆性创新短期内难以形成突破,同质化竞争是一个大的态势。产业链厂家着力寻求新的增长点,随着人工智能成为热点,智能手机厂家纷纷推出“AI 手机” 。但何谓“AI 手机” ,国内外产业界尚未形成统一的共识,也缺乏统一的评测规范。定义和边界的模糊造成了消费者的困惑,很多宣称的“AI 手机”并不能达到和满足用户的心理期待和使用需求。因此,对“AI 手机”进行规
19、6 手机人工智能技术与应用白皮书(2019) 范和界定,对引导和规范市场行为、促进产业生态良性发展是十分重要且必要的。 本白皮书编写组认为,AI 手机是具有系统结构 AI 化,业务应用AI 化的智能手机。其具体特征可描述为:从系统架构上来看,AI 手机应同时满足在硬件层具备 AI 加速单元,软件层支持专用机器学习框架,交互层支持摄像头、传感器、触屏、语音等多种感知方式;且从业务功能和应用场景来看,AI 手机应搭载基于计算机视觉、自然语言处理等技术的应用,能通过收集和分析各类交互信息、感知用户使用习惯来优化系统资源配置、经云侧或端侧进行学习处理,提升使用效率、降低系统功耗,同时能够结合场景的数据
20、分析和用户行为感知,为使用者提供更“智慧化”和个性化的服务。 二、 AI 在智能手机中的应用趋势 (一)(一) 端侧异构芯片加速升级, 支撑端侧异构芯片加速升级, 支撑 AI 专用计算力需求专用计算力需求 AI 芯片也被称为 AI 处理器,即专门用于处理人工智能应用中涉及的各类算法的加速计算模块 (其他非加速计算任务仍由 CPU 负责) 。AI 芯片算力的高速发展,是工业场景和自动驾驶等高实时性 AI 应用的有力保障。同时,芯片在算力和功耗之间的兼顾和优化,将是端侧手机 AI 芯片未来发展的重要主题。 通用芯片奠定 AI 算力基础。 提供 AI 算力的通用型芯片主要包含CPU、 GPU 和 F
21、PGA 三种, 这三种芯片在传统上分别擅长复杂串行计算、图像处理和可重构电路。在 AI 计算领域,依据不同芯片结构,这几种芯片各有其优缺点。就目前来说,特别在 AI 训练领域,以 GPU 为7 手机人工智能技术与应用白皮书(2019) 代表的传统通用芯片仍是业界 AI 算力的中流砥柱。 图 4 CPU 组成架构示意图 下表对比了 CPU、GPU 和 FPGA 这三种主要通用 AI 芯片的性能特点、适用场景和能耗。通过下表可以看出,GPU 是在智能手机终端上最适合进行 AI 计算的通用芯片类型。事实上,目前主流高端手机处理器的内嵌 GPU 性能都十分强大,执行少量 AI 计算无论是在性能上还是在
22、能效上都是可以接受的。 表 1 通用 AI 芯片间的横向对比 芯片类型芯片类型 性能特点性能特点 CPU 优点:可处理复杂串行计算和大量逻辑操作 缺点: AI 计算性能一般 GPU 优点: 擅长并行线性运算, 提供数千个计算核和大量高 速内存,单元控制逻辑更简单 缺点: 执行复杂串行计算效率低,成本(功耗)也较高 FPGA 优点: 可在电路级重复编程,和 CPU/GPU 相比, 计算 效率高, 门电路直接操作,无指令 缺点: 受设计资源和内存接口限制,峰值性能远低于 GPU 8 手机人工智能技术与应用白皮书(2019) 专用芯片提升端侧 AI 性能。一般来说,AI 专用芯片指的是 ASIC(A
23、pplication Specific Integrated Circuit) ,即专用集成电路,相对 GPU 能提供更好的能耗效率并实现更低的延时。ASIC 需要大量研发投入,且芯片功能流片生产后无法更改,量产数目小或市场方向改变,前期投入都将无法回收,具有较大市场风险;但 ASIC 作为专用芯片性能高于 FPGA,依靠特定优化和效能优势,在成本和能效要求极高的手机终端上大行其道。 随着 AI 应用的爆发, 越来越多的 AI 应用开始在端侧设备上开发和部署。一般终端设备主要执行推断,要求具备足够的推断能力。除了计算性能要求之外, 功耗和成本也对在终端工作的 AI 芯片起到重要约束作用。智能手
24、机作为目前应用较广泛的终端计算设备,苹果、华为等手机芯片厂商纷纷推出或研发适应手机 AI 应用的 ASIC 芯片。 软硬件协同定义突破性的下一代 AI 芯片技术。采用可重构计算技术,允许硬件架构和功能随软件变化而变化,具备传统处理器的灵活性和 AI 专用芯片的高性能和低功耗。通过计算阵列重构、存储带宽重构和数据位宽重构三个层面的可重构计算技术来实现 “软件定义芯片” ,有效提高 AI 芯片自身动态配置能力,实现软硬件协同设计,为 AI 芯片带来了很高的灵活度和适用范围。 目前,大多数手机 AI 芯片厂商采用软硬异构技术方案作为产品技术架构。高通采用 NPE(Neural Processing
25、Engine)软件框架和Hexagon 神经网络库为接口,调动处理器中已有的 CPU、GPU 和 DSP处理器模块,实现面向人工智能任务的异构计算,能够运行通过9 手机人工智能技术与应用白皮书(2019) Caffe/Caffe2 或者 Tensorflow 训练的一个或多个神经网络模型;华为通过 HiAI 异构计算平台来加速神经网络计算,快速转化和迁移已有模型,借助异构调度和 NPU 加速过得最佳性能,目前可以支持Kirin970,Kirin980 等芯片; 联发科的 NeuroPilot 将 CPU,GPU 和 APU(AI 处理单元)等异构运算功能内建到 SoC 中,为人工智能应用提供了
26、所需的性能和功效,支持 TensorFlow,TF Lite,Caffe,Caffe2 Amazon MXNet,Sony NNabla 或其他自定义的第三方通用架构。 (二)(二) 智能化传感器件逐步成熟,推动感知交互技术创新智能化传感器件逐步成熟,推动感知交互技术创新 以 3D 摄像头为代表的新型光学传感器件崭露头角。随着用户对于智能手机图像识别精度和准确度等的需求不断增加,3D 图像传感器开始逐步应用于智能手机。3D 图像传感器通过 3D 成像技术,能够识别视野内空间每个点位的三维坐标信息, 从而得到空间的 3D数据,复原完整的三维世界并实现智能三维定位。目前智能手机主流的 3D 成像技
27、术有结构光、飞行时间和双目测距三种。 结构光(Structure Light)方法是将具有特殊结构的光束投射到物体表面,由摄像头采集后,根据光信号的变化计算物体的位置和深度信息, 进而复原整个三维空间。 飞行时间 (TOF, Time Of Flight)方法通过专用传感器,捕捉近红外光从发射到接收的飞行时间,判断物体距离。双目测距(Stereo System)方法是从两个视点观察同一景物,通过三角测量原理计算图像像素间的位置偏差(视差)来获取景物的三维信息。 10 手机人工智能技术与应用白皮书(2019) 借助人脸识别,3D 传感将成为手机零部件的发展热点。目前市面上大部分手机还属于 2D
28、识别,即通过前置摄像头读取脸部图片,再利用软件进行对比,实现难度和成本较低,但在光线较差的场景下无法识别解锁;3D 传感摄像头除使用摄像头外,还配备结构光发射端、结构光接收端或时差测距/距离传感器,可一定程度进行活体判断,防止被攻击破解。目前,苹果、华为、oppo 等发布的新机型开始逐步配备 3D 摄像头,3D 传感器将会进一步普及,或逐渐成为智能手机的标准配置。 以指纹和人脸为代表的新型生物特征识别技术应用逐渐成熟。 从2018 年开始,部分品牌开始使用人脸识别代替指纹识别,手机指纹识别技术的渗透率出现下降。但由于凭借成本、体验和速度方面的优势,未来一年指纹识别将仍是生物特征识别技术的主流。
29、指纹识别依靠指纹识别传感器,包括传统指纹识别和屏下指纹两种模式。随着智能手机全面屏的发展,传统指纹识别将逐渐被淘汰;未来在生物特征识别领域将是屏下指纹技术与人脸识别技术的较量。 声纹识别的大规模普及还有赖于语音识别技术和体验的提升。 声纹识别依靠手机麦克风捕捉可用电声学仪器显示的携带言语信息的声波频谱模型,根据语音波形实现身份判定。目前市面上已经出现了一些支持声纹解锁的手机,但由于其技术尚未完全成熟,存在复杂环境识别准确率较低,或需要佩戴专用耳机等影响用户体验的问题,因此在手机中的普及度还较低。 (三)(三) 端侧端侧 AI 框架和算法迭代创新, 提供应用加速能力框架和算法迭代创新, 提供应用
30、加速能力 11 手机人工智能技术与应用白皮书(2019) 1AI 计算框架 AI 计算框架从线上为主线下为辅模式,逐渐向线上线下云-端协同转变。移动端 AI 应用主要通过线上(Online)和线下(Offline)两种模式来使用深度学习框架。 线上模式采用在移动端做初步预处理,把数据上传云端服务器执行深度学习运算,其优点是部署过程简单,对现有框架封装即可直接使用,缺点是使用时必须联网。线下模式则采用服务器端训练,手机端推断的过程,部署上有一定工作量,但无网情况下也可进行本地运算。随着移动设备的广泛普及与应用,在移动设备上使用深度学习技术的需求开始涌现。线上与线下并存的 AI计算框架模式逐渐代替
31、单一的线上处理模式,成为终端 AI 计算框架的主流趋势。 图 5 云端训练过程与端侧 AI 系统架构 12 手机人工智能技术与应用白皮书(2019) 图 6 端侧 AI 处理的线上与线下模式比对 终端 AI 计算框架未来发展趋势中的重要一环是解决碎片化问题。人工智能是一个系统的工程,无论是想赋能还是推动产业发展,生态体系的建设必不可少。目前的 AI 训练模型需要经过压缩和优化才能运用到手机上,而且每个平台都有各自模型要求,导致兼容性较差。正如安卓生态的碎片化问题一样,AI 算法框架的碎片化问题降低了开发者的开发效率,影响了用户的使用体验,阻碍了产业的创新与发展进程。因此,解决应用开发平台和模型
32、碎片化将是端侧 AI 框架发展的当务之急和努力方向。 2AI 算法 图像和语音是当前人工智能与手机融合应用的两类主要领域, 本白皮书将从图像算法和语音算法两个层面进行阐述。 图像算法遵从统计(或决策理论)法,结构(或句法)方法和神经网络法三种的演进过程。统计法是较早用于图像识别的一种算法,以数学上的决策理论为基础, 其基本模型是对研究目标进行大量统计13 手机人工智能技术与应用白皮书(2019) 分析,找出规律性认识,提出反应图像本质特点的特征进行识别。统计法忽略了图像中被识别对象的空间关系, 所以当被识别物体的结构特征为主要特征时,会较难识别。句法识别的出现是对统计识别的补充,用符号描述对象
33、特征。其模仿语言学中句法的层次结构,采用分层描述法,把复杂图像分解为单层或多层的简单子图像,主要突出识别对象的结构信息。 随着人工智能的兴起, 近年来的图像算法多采用神经网络方法实现,且将在近几年内继续处于主导地位。神经网络算法是由大量神经元连接形成复杂的网络系统。 如果说传统的符号处理算法侧重模拟人的逻辑思维, 神经网络则侧重模拟和实现人类认知过程中的感知过程、形象思维、分布式记忆和自学习组织,与符号处理为互补关系。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习能力, 非常适用于处理需要同时考虑多因素多条件的不精确和模糊信息处理问题。 端到端语音识别算法崭露头角。 传统语音
34、识别算法多采用多层感知机和隐马尔可夫共用的混合模型算法。2010 年,研究人员用深层神经网络替换掉了浅层神经网络, 在混合模型的基本架构上增加了建模单元的数量,取得了识别效果上的突破。近年来,热度较高的端到端模型采用整体神经网络替换了原有的混合模型, 不仅能改进模型的性能, 也能带来更好的开发速度和简洁性。 但该成果仍处于研究阶段,产品级应用大多依然延续混合模型算法。 14 手机人工智能技术与应用白皮书(2019) 图 7 传统语音识别系统模块示意图 复杂环境下可靠性的提升是语音识别算法待解决的首要问题。 语音识别算法的鲁棒性较差,对环境依赖较为严重。由于语音信号的多样性和复杂性,系统只能在一
35、定限制条件下才能获得满意效果。目前业内普遍宣称的 97%识别准确率,更多的是人工测评结果,只在安静室内的近场识别中才能实现, 一旦进入嘈杂环境, 识别率会下降很多。很多语音识别企业已经开始采用语音增强、 麦克风阵列以及说话人分离等多项技术,进而提升复杂(噪音)环境下的识别准确率。语音识别算法还面临着灵活性较差, 无法适应人类较为多变的语言表达方式、韵律信息、同音词和语音特征等其他问题。 (四)(四) 5G网络技术逐步走向商用,极大拓展网络技术逐步走向商用,极大拓展AI应用场景应用场景 2018 年 6 月 14 日,第一版本(R15)的 5G 核心网标准已在 SA全会上批准冻结。随着 SA 5
36、G 标准正式确立,城市规模组网试验的展开, 5G 商用已经进入倒计时。 2019 年 5G 产业配套将会逐步完备, 2020年开启全球商用。作为第五代移动通信技术,5G 具有大带宽、低延时、 广连接的特点和优势, 其三类典型应用场景 (增强移动带宽eMBB、15 手机人工智能技术与应用白皮书(2019) 大规模机器类通信 mMTC、超高可靠超低时延通信 URLLC)可分别从数据、时效和算力上为人工智能技术提供更好的支撑基础,大幅促进其各类终端使用场景的落地和应用。 大规模机器类通信输入海量数据,增强设备智能化学习能力。对于人工智能来说,大量的学习和训练数据是其发挥机器学习的基础,数据量愈广泛,
37、学习的程度就越深入,学习结果就越接近真实环境,越能够理解人类行为。5G 技术带来的超大联接能力,可收集来自通过智能家居等各类物联网终端传输的信息, 创造出史无前例的大数据基础,让人工智能设备迅速从数据中积累和学习,理解情境,从而精准无误的完成任务。 超高可靠超低时延通信提升用户体验,丰富垂直应用场景。5G 带来的超低延时为通过手机直播、赛事观看、在线互动等手机端多媒体应用场景提供了良好的通道。尤其在用户密度大的区域,5G 可增强通信能力,实现无缝用户体验。借助 5G,终端人工智能将极大化拓展多媒体类应用场景:如高清视频直播加持 AI 图片识别,不但能提供高质量、高清晰度的画面,还可以让用户根据
38、自己需求观赏不同角度和姿态的画面;AR(增强现实)、VR(虚拟现实)等全息类虚拟技术,也可以依托 5G,与终端和人工智能结合,拓展更多满足用户需求的垂直类应用场景。 增强移动带宽促进算力端化,推动端侧智能化进程。尽管人工智能的端侧承载能力已有所增强, 目前大多数计算和训练过程仍位于云中;然而,越来越多的人工智能应用都需要在端侧完成数据处理,以16 手机人工智能技术与应用白皮书(2019) 提升用户隐私安全和提升用户体验。5G 超强的网络能力,给人工智能提供了端侧与主机的高品质连接管道, 在推动网络边缘计算能力提高的同时减少了对云的依赖。 边缘计算也意味着一个终端设备能更好地了解自身的运行环境,
39、有助其更好的理解用户需求。事实上,5G的低延迟、 大带宽和边缘计算能力最终将使设备能够直接通信并协同运行,形成 “群计算”。 5G 就如同一条“信息高速公路”,为庞大数据量和信息量的传递提供了高速传输通道;人工智能是云端大脑,依靠高速公路传来的信息学习和演化,完成整个机器智能化进程。5G 时代下,人工智能可以为用户提供更多拥有更快响应、更丰富内容、更智能认知的应用模式。可以说,5G 补齐了制约人工智能发展的短板,是驱动人工智能发展的新动力。人工智能赋予机器人类的智慧,二者相结合,会为整个社会生产方式的改进和生产力的发展带来前所未有的提升。 (五)(五) AI丰富智能手机丰富智能手机应用场景,极
40、大繁荣应用生态应用场景,极大繁荣应用生态 1从应用角度 较为成熟的手机 AI 应用场景聚焦于智能拍照、人像美颜、图片管理、语音助手、智能翻译、语音搜索和增强现实类应用等。 智能拍照是在拍照过程中,通过检测图片中的目标,识别当前场景并自行调整参数,避免曝光、偏色等问题,还可根据用户需要进行背景虚化等调整。人像美颜是对人像进行美化的一种技术,包括面部分析、全局处理、局部精细化处理和美型等,从人种、性别、年龄、肤色、肤质等维度为用户提供个性化美颜。图片管理可对相册中的图17 手机人工智能技术与应用白皮书(2019) 片进行自动分类,也可对图片进行后期优化,如在不产生噪点的情况下,将在暗光环境下拍摄的
41、曝光不足的照片,修复成正常曝光状态的照片。 语音助手具备系统设置、智能提醒、调用第三方应用、控制周边其他智能设备、熄屏唤醒、语音搜索等功能。智能翻译通过选择语种转换,即可进行语音转换。语音搜索首先将语音转化成文字,再做文本匹配和搜索。增强现实类应用主要在智能家居、电商购物、实景导航和一些游戏应用中异军突起。 2从资源管理角度 从操作系统层面看,通过内部资源智能感知功能,安卓手机的卡顿问题(APP 资源竞争、后台任务繁重、权限不合理设置、文件碎片化等引起) 得到了有效缓解。 手机厂商或通过记录用户习惯进行学习,预测用户使用 APP 的行为,标记优先级,降低冷启动概率;或改变安卓原理和机制,整理内
42、存碎片、消除碎片文件,通过后台内存压缩、极速内存回收保证 CPU 的资源调用。 从芯片层面看,利用芯片层系统管理和优化,可优化系统运行速度并延长电池寿命;通过在性能核心与能效核心之间合理分配任务,智能地管理芯片的性能,可给用户带来直观的体验提升。华为海思麒麟 970 处理器,利用 NPU 专门处理机器学习相关的运算,采用 HiAI移动计算架构,可根据使用状态智能管理和平衡处理器的性能,达到快速运算且省电的目的。 三、 AI 对全球智能手机产业链的影响 18 手机人工智能技术与应用白皮书(2019) (一)(一) 手机芯片产业手机芯片产业 人工智能驱动移动芯片产业创新。时至今日,摩尔定律遇到了技
43、术和经济上的双重瓶颈,处理器性能的增长速度越来越慢,然而在移动应用、大数据、人工智能等新的应用兴起后,对于计算能力、计算功耗和计算成本的需求并未减缓。据 Strategy Analytics 的数据显示,2018 年第一季度拥有 AI 能力的智能手机应用处理器市场份额同比增长近三倍。受益于 AI 带来的东风,苹果、海思、高通和三星等智能终端企业也在通过多种方式推动 AI 芯片市场的创新,如专用 AI IP 模块、DSP 与 GPU 的异构组合等。 人工智能拉动手机芯片市场增长。手机 AI 芯片在终端领域迅速渗透,产业规模将呈现快速扩张之势。从 2017 年开始,苹果、华为海思、高通、联发科等主
44、要芯片厂商相继发布支持 AI 加速功能的新一代芯片, 目前AI 芯片逐渐向中端产品渗透。 除了追求性能提升外,手机AI 芯片也逐渐专注于特殊场景的优化。 2017 年全球手机 AI 芯片市场规模 3.7 亿美元, 占据全球AI芯片市场的9.5%。 预计2022 年将达到 38 亿美元,年复合增长率达到 59%,未来五年有接近十倍的增长。 人工智能加剧手机芯片市场竞争。2017 年全球手机 AI 芯片市场规模 3.7 亿美元,发展空间巨大。手机 AI 芯片的迅猛增长之势,吸引了包括谷歌、Facebook、微软、亚马逊以及百度、阿里、腾讯在内的互联网巨头相继入局,加剧原有手机芯片市场竞争。在云端,
45、Nvidia 的 GPU 芯片被广泛应用于深度神经网络的训练和推理; Google 19 手机人工智能技术与应用白皮书(2019) TPU 通过云服务 Cloud TPU 的形式把 TPU 开放商用,处理能力达到 180 Tflop,提供 64 GB 的 HBM 内存,2400 Gbit/s 的存储带宽。三星、苹果、华为、高通、联发科等厂商纷纷推出 AI 芯片,并竞相推出升级产品。 传统芯片厂商发力人工智能巩固竞争优势, 新晋厂商通过授权方式切入市场。手机芯片市场目前包括两类企业,一类是苹果、三星、华为这类采用芯片+整机垂直商业模式的厂商,另一类则是高通、联发科、展锐等独立芯片供应商。采用垂直
46、商业模式厂商的芯片不对外发售, 只服务于自身品牌的整机, 性能针对自身软件做出了特殊优化,靠效率取胜。独立芯片供应商以相对更强的性能指标,来获得剩余厂商的市场份额。在 AI 加速芯片设计能力上有先发优势的企业(如寒武纪)一般通过 IP 授权的方式切入。 人工智能加速手机芯片实现先进工艺突破。手机 AI 产业链包括三大环节,分别是提供 AI 加速核的 IP 授权商、各种 AI 芯片设计公司、以及晶圆代工企业。目前产业链环节各企业基本就位,IP 授权企业包括新思、Cadence、GUC、ARM;设计企业包括苹果、高通、联发科、海思;代工企业主要有台积电。由于手机空间有限,独立的AI 芯片很难被手机
47、厂采用。AI 芯片对单位能耗算力要求较高,一般采用 14nm/12nm/10nm 等先进工艺生产,台积电目前已实现 7nm AI 芯片量产。 (二)(二) 关键元器件产业关键元器件产业 人工智能推动多种手机器件繁荣发展。除了手机处理器,AI 的20 手机人工智能技术与应用白皮书(2019) 发展还带动了 GPU、FPGA、ASIC、DSP 等多种芯片发展,用于云端训练、云端推理、终端推理等不同环节。GPU 由大量核心组成的大规模并行计算架构,非常适合做并行计算,一般用于云端训练场景。AI的发展,极大促进了 GPU 的出货增长。 FPGA 由于可编程、灵活、计算能力强等特点,被认为适用于人工智能推理阶段。2015 年 Intel 收购 FPGA 市场第二大企业 Altera,开始了 FPGA 在人工智能领域的应用热潮。全球科技巨头纷纷布局云端 FPGA 生态,国外包括亚马逊、微软都推出了基于 FPGA 的云计算服务, 而国内包括腾讯云、 阿里云均在2017年推