《人工智能半导体产业分析报告.docx》由会员分享,可在线阅读,更多相关《人工智能半导体产业分析报告.docx(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、人工智能半导体产业分析报告人工智能芯片架构转变世界人工智能倒逼芯片底层的真正变革人类周密制造领域半导体制造是目前为止人类制造领域的最巅峰遇到硅基极限的挑战,摩尔定律的放缓似乎预示着底层架构上的芯片性能的再提已升经消灭瓶颈,而数据量的增长却呈现指数型的爆发,两者之间的不匹配势必会带来技术和产业上的变革升级。变革从底层架构开头。计算的体系处 于碎片化引发架构变革。数据的扩张远大于处理器性能的扩张,依靠处理器性能在摩尔定律推动下的提升的单极世界已经崩溃,处理器性能提升的速 度并缺乏以满足 AI 所需的应用程序的需求。大量数据消耗的数字运算力量比几年前全部数据中心加起来还要多。基于冯诺伊曼架构的拓扑构
2、造已经持 续了很多年并没有本质上的变化。而人工智能带来的 ,是在摩尔定律放缓维度下引发芯片底层架构重构的变革 。有可能引发的是一次超越以往任何时代的科技革命基于摩尔定律的机器时代的架构从 Wintel 到 AA冯诺伊曼架构带来了计算体系的建立并通过 Intel 实现了最大化;ARM通过共享 IP 的商业模式带来了更开放的生态体系,实现了软硬件的结合延长了人类的触角观看 Intel 和 ARM 的黄金十年,站在现在时点往后看,我们提出以下观点:过去十年以下游的应用驱动设计公司的成长转换为由设计公司 主导应用正在发生。从需求层面看企业成长空间。类似90 年月的 PC 和 10年的智能手机带来的亿级
3、大空间增量市场将很简洁推动企业的快速增长。设计企业能够在成长轨迹上实现跨越式突破的可能性来自于赛道的选择。但站在现在时点看,人工智能是确定性的方向,在全部已有领域的人工智能渗都透, 将极大的转变人类的生活。处于最前沿的芯片公司的革正在以此而发生,重定义底层架构的芯片,从上游推动行业的变。革在并没有具体应用场景爆发之前已经赐予芯片公司充分的高估值就是认可设计公司的价值人工智能芯片架构的异军突起观看人工智能系统的搭建,以目前的架构而言,主要是以各种来实现深度学习算法。争论各种的形式和实现,并探讨变革下引发的行 业深层次转变。认为人工智能芯片将有可能在摩尔定律放缓维度下引发芯片底层架构重构的变革。从
4、 2 个维度测算人工智能芯片空间从两个维度争论人工智能芯片的市场空间测算。维度一从人工智能总市场规 模空间反推芯片,维度二具体拆分云端/移动端所需人工智能的BOM 进而推断人工智能芯片市场空间。二个维度印证到2023 年人工智能芯片将到达百亿美元市场重点标的:Intel,台积电,NVIDIA,全志科技,富瀚微,北京君正内容名目1. 人工智能倒逼芯片底层的真正变革42. 基于摩尔定律的机器时代的架构从 Wintel 到 AA62.1. IntelPC 时代的王者荣耀62.1.1. Intel 公司简介62.1.2. Intel 带来的 PC 行业的市场规模变革和产业变化72.2. ARM开放生态
5、下移动时代的王加冕92.2.1. ARM 公司简介92.2.2. ARM 架构重塑造移动智能时代102.2.3. 生态的建立和商业模式的转变ARM 重塑了行业123. 人工智能芯片架构的异军突起153.1. GPU旧瓶装酒163.1.1. GPU 芯片王者NVIDIA173.2. FPGA紧追 GPU 的步伐193.3. ASIC定制化的专用人工智能芯片213.3.1. VPU你是我的眼223.3.1. TPUGoogle 的野心233.4. 人工神经网络芯片243.4.1. 寒武纪真正的不同254. 从 2 个维度测算人工智能芯片空间265. 重点标的29图表名目图 1:遵从摩尔定律进展到微
6、处理器进展4图 2:摩尔定律在放缓4图 3:全球智能手机每月产生的数据量EB5 年提升了 13X4图 4:单一神经元 VS 简单神经元5图 5:2 次应用驱动芯片进展6图 6:英特尔 x86 处理器总市场份额6图 7:使用 X86 架构的单元7图 8:摩尔定律下推动下的 Intel 股价上扬8图 9:Intel 2023Q1-2023Q4 各产品线增速8图 10:Intel 总产品收入 VS PC 端收入8图 11:Intel VS 全球半导体 增速8图 12:ARM 的商业模式9图 13:ARM 架构的进展10图 14:高级消费电子产品正在结合更多的 ARM 技术12图 15:ARM 在智能
7、手机中的成分13图 16:基于 ARM 芯片的出货量13图 17:ARM 在载有处理器芯片部门的市场占有率14图 18:ARM 收入及利润状况14图 19:人工智能芯片产业链15图 20:CPU VS GPU 架构16图 21:GPU 架构流程16图 22:CPU VS GPU 1. 7图 23:GPU 性能 .17图 24:2023-2023 年 NVIDIA 营收状况.18图 25:2023-2023 年 NVIDIA 毛利状况.18图 26:NVIDIA2023 年上半年收入构成.18图 27:FPGA 架构.20图 28:FPGA VS CPU 性能 .20图 29:FPGA VS C
8、PU 功耗 .20图 30:FPGA 性能.21图 31:VPU 架构.22图 32:VPU 模组 .22图 33:VPU 应用.23图 34:3D 景深构造.23图 35:3D 成像.23图 36:Google 公司 TPU 架构.23图 37:Google 公司 TPU 性能.24图 38:传统硬件处理方式 .25图 39:寒武纪处理方式 .25图 40:寒武纪芯片性能/能效 .25图 41:终端和移动端.25图 42:人工智能市场规模 .26图 43:人工智能芯片总市场规模 .27表 9:云端市场规模单位:百万美元 .28图 44:云端领域人工智能芯片规模推测 .28图 45:终端领域人
9、工智能芯片市场规模推测 .29表 1:ARM 架构汇总 .11表 2:2023 年 ARM 在各类型智能手机部件中的可获得的单机收入13表 3:人工智能系统15表 4:NVIDIA 出货芯片推测单位:百万颗19表 5:冯诺伊曼架构 VS FPGA 架构19表 6:图像应用和语音应用人工智能定制芯片21表 7:实现原理22表 8:冯诺伊曼架构 VS 神经网络芯片架构241. 人工智能倒逼芯片底层的真正变革争论人类的科技进展史,觉察科技的进步速度呈现指数型加速态势。尤其在 1950 年以后进入芯片时代,摩尔定律推动下的每 18 个月“芯片晶体管同比例缩小一半”带来的性能提升以倍数计。每一次加速的过
10、程推动,都引发了产业的深层次变革,带动从底层到系统的阶跃。我们本篇报告将着重从底层芯片角度动身,探讨人工智能芯片带来的深层次变革。图 1:遵从摩尔定律进展到微处理器进展资料来源:Gartner,天风证券争论所然而时至今日,人类周密制造领域半导体制造是目前为止人类制造领域的最巅峰遇到硅基极限的挑战,摩尔定律的放缓似乎预示着底层架构上的芯片性能的再提升已经消灭瓶颈, 而数据量的增长却呈现指数型的爆发,两者之间的不匹配势必会带来技术和产业上的变革升级。资料来源:IFS,天风证券争论所资料来源:Cisco VNL,天风证券争论所图 2:摩尔定律在放缓图 3:全球智能手机每月产生的数据量EB5 年提升了
11、 13X14121086420202320232023202320232023变革从底层架构开头计算芯片的架构 50 多年来都没有发生过本质上的变化,请留意计算架构的打算是资源的组织形式。而传统的冯诺伊曼是实行掌握流架构,承受的是线性的记忆体和布尔函数作为基 线计算操作。处理器的架构基于流水线串行处理的机制建立,存储器和处理器分别,流水线的计算过程可以分解为取指令,执行,取数据,数据存储,依次循环。依靠整个串行 的过程,规律清楚,但性能的提升通过两种方式,一是摩尔定律下推动下晶体管数量的增 多实现性能倍增;二是通过并行多个芯片核来实现。无论何种方式,本质上都是线性的性 能扩张。人工智能芯片依据
12、数据流的碎片化和分布式而实行神经网络计算范式,特征在于分布式的表示和激活模式。变量由叠加在共享物理资源上的向量表示,并且通过神经元的激活来进 行计算。以神经元架构实现深度学习人工智能的临界点实现主要缘由在于: 数据量的激增和计算机力量/本钱。深度学习以神经元为架构。从单一的神经元,再到简洁的神经网络,到一个用于语音识别的深 层神经网络。层次间的简单度呈几何倍数的递增。数据量的激增要求的就是芯片计算力量的提升。图 4:单一神经元 VS 简单神经元资料来源:NVIDIA,天风证券争论所计算的体系处于碎片化引发架构变革 。数据的扩张远大于处理器性能的扩张,依靠处理器性能在摩尔定律推动下的提升的单极世
13、界已经崩溃,处理器性能提升的速度并缺乏以满足AI 所需的应用程序的需求。大量数据消耗的数字运算力量比几年前全部数据中心加起来还要多。我们在下一章将观看历史上两次重要的电子产业变革,试图证明无论是PC 时代的“Wintel”还是智能手机时代的“ARM+Android”,都还无法摆脱机器本身的桎梏。换句话说,截于止现阶段的一切技术和应用,基于冯诺伊曼架构的拓扑构造已经持续了很多年并没有本质上的变 化。而人工智能带来的,是在摩尔定律放缓维度下引发芯片底层架构重构的变革。有可能引发的是一次超越以往任何时代的科技革命。2. 基于摩尔定律的机器时代的架构从 Wintel 到 AA本章我们重点争论两次芯片架
14、构变化引发的产业变革和应用爆发。Intel 与 Windows 结合构建 PC 生态 ,本质上诞生了软硬件结合的机器时代。而在其根底上的延升, 2023 后苹果带来的智能手机引发的 ARM 与 Android 生态,将机器与人的结合拓展到了移动端。我们回忆历史上的芯片架构历史,认为冯诺伊曼架构带来了计算体系的建立并通过 Intel 实现了最大化;ARM 通过共享 IP 的商业模式带来了更开放的生态体系,实现了软硬件的结合延长了人类的触角。图 5:2 次应用驱动芯片进展资料来源:SIA,天风证券争论所观看 Intel 和 ARM 的黄金十年,站在现在时点往后看,我们提出以下观点: 过去十年以下游
15、的应用驱动设计公司的成长转换为由设计公司主导应用正在发生。从需求层面看企业成长空间。类似90 年月的 PC 和 10 年的智能手机带来的亿级大空间增量市场将很简洁推动企业的快速增长。设计企业能够在成长轨迹上实现跨越式突破的可能性来自于赛道的选择。但站 在现在时点看,人工智能是确定性的方向,在全部已有领域的人工智能渗透,都将极 大的转变人类的生活。处于最前沿的芯片公司的革正在以此而发生,重定义底层架构的芯片, 从上游推动行业的变革。在并没有具体应用场景爆发之前已经赐予芯片公司充分 的高估值就是认可设计公司的价值2.1. IntelPC 时代的王者荣耀本节重点阐述 Intel 公司在 X86 时代
16、的芯片架构产品以及此架构下公司以及行业的变化。2.1.1. Intel 公司简介Intel 是一家成立于 1968 年的半导体制造公司,总部位于美国加州。随着个人电脑的普及和全球计算机工业的日益进展,公司渐渐进展成为全球最大的微处理器及相关零件的供给 商。公司在 2023 年实现营业收入 594 亿美元,世界 500 强排名 158。公司分为 PC 客户端部门、数据中心部门、物联网、移动及通讯部门、软件及效劳运营,其他还有笔记本部门、设备部门及 NVM 解决方案部门。公司主要营业收入来自于 PC 客户部门,其次是数据中心部门。公司的主要产品 X86 处理器占主导地位,接近 90%,包括苹果在
17、2023 年放弃 PowerPC 改用英特尔的 x86 processors。图 6:英特尔 x86 处理器总市场份额95.00%90.00%85.00%80.00%75.00%70.00%65.00%143Q Q Q 2230002143Q Q Q Q 45560000214Q Q Q 78800032143Q Q Q Q Q 901120111121432Q Q Q Q Q 3445611111资料来源:Intel,天风证券争论所Intel 是第一家推出 x86 架构处理器的公司。Intel 从 8086 开头,286、386、486、586、P1、P2、P3、P4 都用的同一种 CPU
18、架构,统称 X86。大多数英特尔处理器都是基于 x86 指令集,被称为 x86 微处理器。指令集是微处理器可以遵循的根本命令集,它本质上是微处理器的芯片级“语言”。英特尔拥有 x86 架构的学问产权和给 AMD 和 Via 做处理器的许可权。图 7:使用 X86 架构的单元8000700060005000400030002023100001 3 1 3 1Q Q Q Q Q 3 3 4 4 50 0 0 0 03 1 3Q Q Q 5 6 60 0 01 3 1Q Q Q 7 7 80 0 03 1 3Q Q Q 8 9 90 0 01 3 1Q Q Q 0 0 11 1 13 1 3Q Q
19、Q 1 2 21 1 11 3 1Q Q Q 3 3 41 1 13 1 3 1 3Q Q Q Q Q 4 5 5 6 61 1 1 1 1资料来源:wind,天风证券争论所2.1.2. Intel 带来的 PC 行业的市场规模变革和产业变化回忆 Intel 90 年月至今进展历程,清楚看到90 年月是 Intel 进展最快的阶段并在2023 年前后到达了峰值。显而易见的缘由是个人电脑的快速普及渗透。而遵从摩尔定律的每一代产品的推出,叠加个人电脑快速渗透的乘数效应,持续放大了企业的市值,类似于戴维斯双击,推动股价的一路上扬。图 8:摩尔定律下推动下的 Intel 股价上扬资料来源:Wind,天
20、风证券争论所冯诺伊曼架构带来了计算体系的建立并通过 Intel 实现了最大化,但从本质上说,英特尔参与的是机器时代的兴起和计算芯片价值表达。但时至今日,在人口红利消散,PC 渗透率到达稳定阶段,依托于 PC 时代的处理器芯片进入了稳定常态。英特尔在总产品收入提升的状况下,PC 端供给的收入增长时机停滞。处理器依靠摩尔定律不断推经连续生命力, 但在应用增长乏力的阶段缺乏爆发式的再增长。 PC 时代的处理器设计遵从了下游应用驱动上游芯片的实质。图 9:Intel 2023Q1-2023Q4 各产品线增速图 10:Intel 总产品收入 VS PC 端收入资料来源:Intel,天风证券争论所资料来源
21、:Intel,天风证券争论所进入 2023 年后,英特尔的处理器增速同半导体行业根本协同全都,毫无疑问超越行业增速的增长已经需要的应用拉动。摩尔定律支撑了 10 多年的快速增长再消灭边际改善的增长需要重打量。图 11:Intel V全S 球半导体增速资料来源:Inte,l 天风证券争论所2.2. ARM开放生态下移动时代的王加冕本节重点阐述 ARM 在移动时代的芯片架构产品以及此架构下公司以及行业的变化。2.2.1. ARM 公司简介ARM 公司是全球领先的半导体学问产权 (IP) 供给商,特地从事基于RISC 技术芯片设计开发,并因此在数字电子产品的开发中处于核心地位。公司的前身 Acorn
22、 于 1978 年在伦敦正式成立。1990 年 ARM 从 Acorn 分拆出来。得益于 20 世纪 90 年月手机的快速进展,基于 ARM 技术的芯片出货量飞速增长,并于 2023 年宣布正式达成 1000 亿芯片出货量的里程碑。2023 年 7 月,日本软银以 320 亿美元收购了 ARM。ARM 本身不直接从事芯片生产,只设计 IP,包括指令集架构、微处理器、图形核心和互连架构,依靠转让设计许可由合作公司生产各具特色的芯片,目前它在世界范围有超1过100 个的合作伙伴。ARM 的创型商业模式为公司带来了丰厚的回报率:它既使得 ARM 技术获得更多的第三方工具、制造、软件的支持,又使整个系
23、统本钱降低,使产品更简洁进入市场被消费者所承受,更具有竞争力。正由于 ARM 的 IP 多种多样以及支持基于 ARM 的解决方案的芯片和软件体系格外浩大,全球领先的原始设备制造商 (OEM) 都在广泛使用 ARM 技术,因此ARM 得以在智能手机、平板上一枝独秀,全世界超过 95%的智能手机都承受 ARM 架构。图 12:ARM 的商业模式资料来源:ARM,天风证券争论所2.2.2. ARM 架构重塑造移动智能时代ARM 沿用了冯诺伊曼架构,在性能和功耗上做到了更加平衡。在底层架构没有发生根本性变革的状况下,在架构的横向延长上查找到了技术的转换,从而实现了智能手机时代 移动端的产品阶跃。处理器
24、架构在根源上看 ARM 连续了 X86 的底层架构。正如我们在之前争论架构时指出, 处理器一般分为取指令,译码,放射,执行,写回五个步骤。而我们说的访存,指的是访问数据,不是指令抓取。访问数据的指令在前三步没有什么特别,在第四步,它会被发送到存取单元,等待完成。与X86 不同的是在指令集方面,ARM 架构过去称作进阶精简指令机器Advanced RISC Machine,更早时期被称作Acorn RISC Machine,是32 位精简指令集RISC处理器架构,被广泛地使用在嵌入式系统设计中。在应用场景上有所不同。ARM 指令集架构的主要特点:一是体积小、低功耗、低本钱、高性能,因此 ARM
25、处理器格外适用于移动通讯领域;二是大量使用存放器且大多数数据操作都在存放器中完成,指 令执行速度更快;三是寻址方式敏捷简洁,执行效率高;四是指令长度固定,可通过多流 水线方式提高处理效率。图 13:ARM 架构的进展资料来源:ARM,天风证券争论所表 1:ARM 架构汇总ARMARM2、ARM3V2该版本架构对 V1 进展了扩展,包含了对 32 位乘法指令和协处理器指令的支持。版本2a 是版本 2的变种,ARM3 芯片承受了版本 2a,是第一片承受Cache 的 ARM 处理器。架构ARM V1代表处理器简介ARM1ARM V3ARM6、ARM7ARM 作为独立的公司,在 1990 年设计的第
26、一个微处理器承受的就是版本 3 的 ARM6。它作为 IP 核、独立的处理器、具有片上高速缓存、MMCU 和写缓冲的集成CPU。变种版本有3G 和 3M。版本 3G 是不与版本 2a 相兼容的版本 3。版本 3M 引入了有符号和无符号数乘法和乘加指令。ARMV4ARM7-TDMI,ARM720-T, ARM9-TDMI, ARM920-T,ARM940-T 等V4 版架构在 V3 版上作了进一步扩大,V4 版架构是目前应用最广的ARM 架构。V4 首次增加 Thumb指令集,不再强制要求与 26 位地址空间兼容,而且还明确了哪些指令会引起未定义指令特别。ARMARMv5TE 指令集: V5 版
27、架构是在 V4 版根底上增加了一些的指令,包括带有链接和交换的转移BLX 指令;计数前导V5ARM9-E-S, ARM1020-E, ARM940-T 等;ARMv5EJ 指令集: ARM926-EJ-S, ARM7-EJ-S, ARM1026-EJ-S 等零 CLZ 指令;BRK 中断指令;增加了数字信号处理指令V5TE 版;为协处理器增加更多可选择的指令。ARMARM1136-J(F)-S, V6 版架构于 2023 年正式公布,首先被应用在ARM11 处理器。V6 版架构在降低耗电量的同时,还V6ARM1156-J(F)-S, 强化了图形处理性能。它还引进了包括单指令多数据(SIMD)
28、运算在内的一系列功能。通过追加ARM1176-J(F)-S, 有效进展多媒体处理的 SIMDSingle Instruction,Multiple Data,单指令多数据功能,将语音及图ARM11 MPCore 等 像的处理功能提高到了原型机的4 倍。此外,还引进了作为ARMv6 体系构造的变体的 Thumb-2和 TrustZone 技术。ARM V7Cortex-A、Cortex-M、Cortex-R 等全的 ARMv7 架构是在 ARMv6 架构的根底上诞生的。ARMv7 架构承受了 Thumb-2 技术,它是在ARM 的 Thumb 代码压缩技术的根底上进展出来的,并且保持了对已存 A
29、RM 解决方案的完整的代码兼容性。此外,ARMv7 还支持改进的运行环境,来迎合不断增加的JIT 和 DAC 技术的使用。ARMv7ARM Cortex-A23、V8 Cortex-A57 、Cortex-A53 、Cortex-R52 、Cortex-M23 、Cortex-M33 等架构还包括 NEON 技术扩展,可将DSP 和媒体处理吞吐量提上升达 400%,并供给改进的浮点支持以满足下一代3D 图形和玩耍以及传统嵌入式掌握应用的需要。ARMv8 是 ARM 公司的首款支持64 位指令集的处理器架构,可在32 位 和 64 位 之间切换。由于ARM 处理器的授权内核被广泛用于手机等诸多电
30、子产品,故ARMv8 架构作为下一代处理器的核心技术而受到普遍关注。ARMv8 是在 32 位 ARM 架构上进展开发的,主要被用于对扩展虚拟地址和64 位数据处理技术有更高要求的产品领域。ARMv8 是近 20 年来,ARM 架构变动最大的一次。它引入的 Execution State、Exception Level、Security State 等特性,已经和我们对旧的ARM 架构的认知。资料来源:ARM、满天芯,天风证券争论所2.2.3. 生态的建立和商业模式的转变ARM 重塑了行业ARM 的商业模式值得真正的关注。ARM 通过授权和版税来赚取收入。使用 ARM 的授权,跟据流片的次数,
31、可以付一次流片的费用,也可以买三年内无限次流片,更可以永久买断。芯片 量产后,依据产量,会按百分比收一点版税I。ntel 通过售卖自己的芯片来赢得终端客户和市场,而ARM 则是通过授权让全世界的芯片制造商使用自家的产品来推广。ARM 的商业模式之所以在智能手机时代能够推广,是由于移动端的生态更为开放,自上而下的生 态建立,不仅是芯片开发者,也包括软件开发者,都被构建在生态的范围内。智能移动设备上包含多件 ARM 的处理器/技术,每当智能手机上增一个功能时,就为的 ARM 学问产权带来了的时机。2023 年,ARM 在移动应用处理器包括智能手机、平板电脑和笔记本电脑上,依据量的测算,其市场份额高
32、达 90%,同时 ARM 估量移动应用处理器规模将从 2023 年的 200 亿美元增长到 2025 年的 300 亿美元。图 14:高级消费电子产品正在结合更多的ARM 技术资料来源:ARM,天风证券争论所2023 年,ARM 各项技术在智能手机领域都有良好的渗透率:ARMv7-A 技术早已完全渗入, ARMv8-A 技术渗透率到达 70%,Mali graphics 到达 50%,高核数技术high core count 则为 35%.图 15:ARM 在智能手机中的成分资料来源:ARM,天风证券争论所依据 ARM 的推测,到 2025 年为止,智能手机设备的CAGR 为 3%左右,而AR
33、M 在这一板块的专利收入将会以大于 5%的 CAGR 上涨。表 2:2023 年 ARM 在各类型智能手机部件中的可获得的单机收入智能手机类型部件ASP高端智能机应用处理器$15-$20连接传感器$5-$10中端智能机应用处理器$5-$15连接传感器$2-$3低端智能机应用处理器$5资料来源:ARM ,天风证券争论所连接传感器$1-$2ARM 的累计出货量已经超过 1000 亿支,2023 年全年发出的基于 ARM 技术芯片到达 177 亿,发货量在过去5 年时间中 CAGR 将近 15%。ARM 的增长完善契合了智能手机的快速增长 10 年。图 16:基于 ARM 芯片的出货量资料来源:AR
34、M,天风证券争论所图 17:ARM 在载有处理器芯片部门的市场占有率图 18:ARM 收入及利润状况资料来源:ARM,天风证券争论所资料来源:ARM,天风证券争论所3. 人工智能芯片架构的异军突起观看人工智能系统的搭建,以目前的架构而言,主要是以各种来实现深度学习算法。本 章争论各种的形式和实现,并探讨变革下引发的行业深层次转变,并从 2 个维度给出具体的测算人工智能芯片的潜在空间首先我们必需描述人工智能对芯片的诉求,深度学习的目标是仿照人类神经网络感知外部 世界的方法。深度学习算法的实现是人工智能芯片需要完成的任务。在算法没有发生质变 的前提下,追根溯源,全部的芯片都是为了实现算法而设计。表
35、 3:人工智能系统架构单元处理器 存储器 通信接口芯片功能收发指令,规律运算数据/指令读写大规模并行计算信息交换芯片类型CPU NAND、DRAMGPU、FPGA、ASICWiFi、Bluetooth芯片厂商Intel,ARM,AMD 三星、海力士、美光Nvidia,Google、MovidiusAvago,Skyworks, CSR资料来源:Wind,天风证券争论所我们整理了人工智能芯片相关的类型和产业链公司, 传统的芯片厂商/生态的建立者/进入者。 传统的芯片制造厂商:Intel,Nvidia 和 AMD。他们的优势在于在已有架构上对人工智能的延长,对于硬件的理解会优于竞争对手,但也会困顿
36、于架构的囹圄;2 上层生态的构建者进入芯片设计,比方苹果和Google,优势在于依据生态敏捷开发定制各类 ASIC, 专用性强;进入者,某些全的架构比方神经网络芯片的寒武纪,由于是全的市场开 拓,具有后发先至的可能。进入者的时机,由于是个全的架构时机,将有时机诞生独角兽。图 19:人工智能芯片产业链资料来源:Wind,半导体行业观看,天风证券争论所3.1. GPU旧瓶装酒GPU 使用 SIMD单指令多数据流来让多个执行单元以同样的步伐来处理不同的数据, 原本用于处理图像数据,但其离散化和分布式的特征,以及用矩阵运算替代布尔运算适合处理深度学习所需要的非线性离散数据。作为的使用,可以实现深度学习
37、算法。 但留意的是,GPU 架构照旧基于冯诺伊曼。我们以 GPU 和 CPU 的比照来说明 GPU 所具有的架构特点。GPU 由并行计算单元和掌握单元以及存储单元构成 GPU 拥有大量的核多达几千个核和大量的高速内存,擅长做类似图像处理的并行计算,以矩阵的分布式形式来实现计算。同 CPU 不同的是,GPU 的计算单元明显增多,特别适合大规模并行计算。图 20:CPU VS GPU 架构资料来源:NVIDIA,天风证券争论所留意 GPU 并行计算架构,其中的流处理器组SMs类似一个 CPU 核,多个流处理器组可实现数据的同时运算。因此, GPU 主要适用于在数据层呈现很高的并行特性data-pa
38、rallelism的应用。图 21:GPU 架构流程资料来源:NVIDIA,天风证券争论所CPU 和 GPU 本身架构方式和运算目的不同导致了 CPU 和 GPU 之间的不同,主要不同点列举如下图 22:CPU VS GPU资料来源:Intel,天风证券争论所深度学习是利用简单的多级深度神经网络来打造一些系统,这些系统能够从海量的未标记训练数据中进展特征检测。由于 GPU 可以平行处理大量琐碎信息。深度学习所依靠的是神经系统网络与人类大脑神经高度相像的网络而这种网络消灭的目的, 就是要在高速的状态下分析海量的数据。GPU 擅长的是海量数据的快速处理GPU 的特征打算了其特别适合做训练。机器学习
39、的广泛应用: 海量训练数据的消灭以及 GPU 计算所供给的强大而高效的并行计算。人们利用 GPU 来训练这些深度神经网络,所使用的训练集大得多,所消耗的时间大幅缩短,占用的数据中心根底设施也少得多。 GPU 还被用于运行这些机器学习训练模型,以便在云端进展分类和推测,从而在消耗功率更低、占用根底设施更少的状况下能够支持远比从前更大的数据量和吞吐量。与单纯使用 CPU 的做法相比,GPU 具有数以千计的计算核心、可实现10-100 倍应用吞吐量,因此 GPU 已经成为数据科学家处理大数据的处理器。图 23:GPU 性能资料来源:NVIDIA,天风证券争论所3.1.1. GPU 芯片王者NVIDIANVIDIA 是一家以设计 GPU 芯片为主业的半导体公司,其主要产品从应用领域划分,包括GPU如玩耍图形处理器 GeForce GPU,