《【艾瑞咨询】2021年中国人工智能基础层行业发展研究报告.pdf》由会员分享,可在线阅读,更多相关《【艾瑞咨询】2021年中国人工智能基础层行业发展研究报告.pdf(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、中国人工智能基础层行业发展研究报告2021年海量行研报告免费读22021.7 iResearch Inc. 摘要来源:艾瑞研究院根据公开资料自主研究绘制。 人工智能基础层资源向集约型发展:伴随各行业智能化转型的迫切需求,艾瑞认为人工智能基础层发展总体向好。在人工智能由技术落地应用阶段向效率化生产阶段转变的背景下,人工智能基础层的各模块工具有望走向集约型的生产模式。 人工智能基础层资源自主可控展望:基础层全栈的自主可控建设目前还处在萌芽阶段。未来或将有更多企业自研开源框架,国产的操作系统与数据库等软件配套设施将稳步崛起,算力模块的智能服务器国产化率也将逐步提升。 人工智能基础层定义:算力、算法、
2、数据是人工智能产业发展的三大要素。基于此,艾瑞定义人工智能基础层是支撑AI应用模型开发及落地的必要资源,主要包括智能计算集群、智能模型敏捷开发工具、数据基础服务与治理平台三大模块。 人工智能基础层价值:AI基础层可多环节提效AI技术价值的释放,解决需求方人工智能生产力稀缺问题;依托AI基础层资源,AI企业可有效应对下游客户的长尾应用需求,将其高频应用转化为新主营业务,寻找业务增长突破点;基础层工具属性标志着AI产业社会化分工的出现,AI产业正逐步进入各产业深度参与、双向共建的效率化生产阶段。 智能计算集群:提供支撑AI模型开发、训练或推理的算力资源,包括系统级AI芯片和异构智能计算服务器,以及
3、下游的人工智能计算中心等 智能模型敏捷开发工具:包括开源算法框架、提供AI技术能力调用的AI开放平台和AI应用模型效率化生产平台。API规模经济与效率化生产平台杠杆增效共拓产业广度与深度。 数据基础服务与治理平台:实现AI应用所需的数据资源生产与治理,提供AI基础数据服务及面向AI的数据治理平台SMS 人工智能基础层市场规模:据艾瑞测算,2020年中国人工智能核心产业规模超过1500亿元;其中人工智能基础层市场规模为497亿元,为AI产业总规模的33%,AI芯片的高增长是产业规模增长的主要拉动力。2021-2025年,中国人工智能基础层市场规模CAGR为38%,整体产业规模发展速度较快、空间较
4、为广阔,于2025年将达到2475亿元。3人工智能基础层概念界定1人工智能基础层需求篇2人工智能基础层供给篇3典型人工智能基础层企业案例4人工智能基础层发展洞察542021.7 iResearch Inc. 人工智能基础层定义支撑各类人工智能应用开发与运行的资源和平台算力、算法、数据是人工智能产业发展的三大要素。据此,人工智能基础层主要包括智能计算集群、智能模型敏捷开发工具、数据基础服务与治理平台三个模块。智能计算集群提供支撑AI模型开发、训练或推理的算力资源,包括系统级AI芯片和异构智能计算服务器,以及下游的人工智能计算中心等;智能模型敏捷开发工具模块主要实现AI应用模型的生产,包括开源算法
5、框架,提供语音、图像等AI技术能力调用的AI开放平台和AI应用模型效率化生产平台;数据基础服务与治理平台模块则实现AI应用所需的数据资源生产与治理,提供AI基础数据服务及面向AI的数据治理平台。AI基础层企业通过提供AI算力、开发工具或数据资源助力人工智能应用在各行业领域、各应用场景落地,支撑人工智能产业健康稳定发展。来源:艾瑞根据公开资料自主研究绘制。智能计算集群支撑人工智能应用的算力资源智能模型敏捷开发工具帮助实现人工智能应用模型生产数据基础服务及治理平台面向人工智能的数据资源生产与治理人工智能基础层定义人工智能基础层涵盖AI算力、算法平台与数据资源模块人工智能应用层异构智能计算服务器AI
6、技术开放平台AI基础数据服务系统级AI芯片AI应用模型效率化生产平台面向AI的数据治理平台人工智能计算中心采用异构形式的服务器,支持X86、GPU、ARM、ASIC及FPGA加速卡等,以提升数据处理能力整合智能计算集群为企业或科研计算等需求提供AI算力服务包括应用于云端服务器、边缘及终端设备的AI芯片提供计算机视觉、智能语音、NLP等各类AI技术能力调用以深度学习或机器学习为主的一站式模型生产平台,含满足零代码或低代码开发需求的解决方案为AI算法训练及优化提供的数据采集、清洗、信息抽取、标注等服务,以采集和标注为主通过汇聚盘点数据、提升数据质量,增强数据可用性和易用性,进一步释放数据资产价值A
7、I开源框架一般包括大量的机器学习或深度学习算法,为多种编程语言提供API52021.7 iResearch Inc. 满足业务需求的数据采集高效数据标注数据统一管理高质量数据集挖掘数据关联信息人工智能基础层价值AI基础层是支撑AI应用模型开发及落地的必要资源开发一项人工智能模型并上线应用大致需经历从业务理解、数据采标及处理、模型训练与测试到运维监控等一系列流程。过程中需要大量的AI算力、高质量数据源、AI应用算法研发及AI技术人员的支持,但大部分中小企业用户并不具备在“算力、数据、算法”三维度从0到1部署的能力,而财力雄厚的大型企业亦需高性价比的AI开发部署方案。依靠AI基础层资源,需求企业可
8、降低资源浪费情况、规避试错成本、提高部署应用速度。作为支撑AI模型开发及落地的必要资源,AI基础层可在多环节提效AI技术价值的释放;其工具属性也标志着AI产业社会化分工的出现,AI产业正逐步进入低技术门槛、低部署成本、各产业深度参与双向共建的效率化生产阶段。来源:艾瑞根据公开资料自主研究绘制。AI应用开发上线流程与AI基础层资源价值点识别业务问题数据采集标注数据治理特征工程模型训练模型评估调优模型部署运维监控确定最优模型性能评估及模型持续优化数据输入运算端到端设计结合开发流程模板开发态流程运行态流程迭代调优AI基础层资源价值点数据基础服务及治理平台智能模型敏捷开发工具智能计算集群数据资源可视化
9、建模、交互式建模、自动建模实现分布式训练框架提高算法建模效率模型仓库管理提供算法工程化服务易用的模型部署、运行监控平台实现模型的持续集成、持续交付、持续部署算法开发资源CPU、GPU容器服务计算资源统一管理算力资源提高资源利用率提高执行效率AI专用芯片;实现软硬一体优化,突破性能瓶颈62021.7 iResearch Inc. 0102030405060708090类别 2类别 3200620252030人工智能基础层进阶之路粗放式单点工具向集约型、精细化资源演进智能化转型趋势下,企业部署AI项目的需求正经历着变化,对数据质量、模型生产周期、模型自学习水平、模型可解释性、云边端多样部署方式、人
10、力成本及资金投入、投资回报率等的要求都逐步走高。在上述需求特点及自动机器学习、AI芯片硬件架构等技术发展的共同推动下,AI基础层资源的整体效能水平也在不断进化,以有效降低需求企业的AI开发成本。大致涵盖相互交融的三个阶段:雏形期,算法/算力/数据各模块多为粗放式的单点工具,新兴产品及赛道逐步出现;快速发展期,各赛道活跃度显著提升,参与者积极探索产品形态与商业模式,基础层服务体系逐步完善、资源价值凸显;最后则向成熟阶段过渡,各赛道内企业竞争加剧,逐步跑出头部企业。同时各赛道间企业生态合作增多,一站式工具平台出现。来源:艾瑞根据公开资料自主研究绘制。人工智能基础层资源发展历程及效能曲线时间服务体系
11、逐步完善基础层雏形期粗放式单点工具新赛道出现各赛道活跃度提升探索产品形态与商业模式基础层发展期基础层成熟期玩家竞争阶段工具智能化水平提升异构计算应对AI负载增长;AI算力提供商将IT基础资源(计算、网络、存储等)集合形成资源池对数据质量的需求推动数据采标、数据治理等产品优化算法玩家持续深耕各垂直领域开发平台及AI工程化能力,帮助下游客户降低开发成本,提高模型生产效率产业链逐步清晰GPU支撑模型训练对AI算力需求AI加速落地催化了数据标注等行业兴起通过API输出AI基础算法能力,但大部分依赖于人工设计和开发效能集约型、精细化工具智能化水平提升,数据半自动标注、模型自动部署及自适应更新、AI数据中
12、心智能运维等算法、算力、数据各赛道基础层企业提供精细化解决方案,积极参与价值链延伸,塑造核心竞争力AI供应商布局覆盖数据治理、模型开发、算力资源管理全流程的一站式AI模型开发平台72021.7 iResearch Inc. 人工智能基础层相关政策指引相关政策以规划、鼓励、建设为倾向,政策红利持续释放从2017年到2021年初,国务院、国家发改委、国家工信部、科技部以及各省市、地方政府都发布了有关人工智能基础层的政策,在算力、数据、算法开发多层面皆有其侧重点。在算力层面,强调超算中心、AI芯片等基础硬件设施的源头战略地位,倡导为后续的AI应用开发做好硬件底层铺垫;在数据层面,突出实时数据的开发、
13、治理、共享以及数据安全与隐私建设,支持为人工智能的研发及应用做好高效高质、合规合法的数据准备;在AI开发平台层面,提倡开源开放、互助共享的理念,引导具备领先AI资源与技术能力的企业、高校或机构构建开源社区或开放平台,释放优势互补的协同效应。来源:艾瑞研究院根据公开资料自主研究绘制。建设原则中,提出以企业为主体,鼓励人工智能细分领域领军企业搭建开源、开放平台,面向公众开放AI技术研发资源,向社会输出AI技术服务能力,推动AI技术的行业应用。注:截止到目前,新一代人工智能开放创新平台已增加至15个,包含百度、阿里云、腾讯、科大讯飞、商汤等企业。人工智能基础层相关政策解读政策扫描总结:有关政策以建设
14、为倾向,覆盖海量实时大数据采集、数据治理、数据共享、数据安全与隐私等方面算力数据算法面向AI的数据治理人工智能基础数据服务2020.8.7 国家发改委、科技部等国家新一代人工智能标准体系建设指南建设内容中,提出支撑技术与产品标准,涵盖大数据标准,核心内容为规范AI研发与应用等过程涉及到的数据存储、处理等相关技术要素,包括数据治理、数据共享开放等。2021.2.9 北京市人民政府2021年市政府工作报告重点任务清单任务指出要大力发展数字经济,构筑高质量发展新优势。数据基础设施建设中提到,要强化数据安全管理和个人隐私保护,探索建立数据分类分级保护体系。人工智能技术开放平台2019.8.1 科技部国
15、家新一代人工智能开放创新平台建设工作指引2017.7.8 国务院新一代人工智能发展规划总体要求中,以开源开放作为基本原则之一,促进产学研用各创新主体共创共享。总体部署中,提出“构建开放协同的人工智能科技创新体系”,以针对性地解决原创性理论基础薄弱、重大产品和系统缺失等重点难点问题。政策扫描总结:政策以鼓励及建设为导向,重点落脚于开源开放的理念,以实现先进AI资源与技术能力的共享超算中心人工智能芯片2021.1.13 国家工信部工业互联网创新发展行动计划(2021-2023年)战略任务中提到,要“强化原始创新,增强源头供给”,建设一批支撑高水平创新的基础设施和平台,建设超算中心和云计算平台等数字
16、化基础设施。重点任务中指出要加强工业互联网基础支撑技术攻关,支持工业5G芯片模组、边缘计算专用芯片与操作系统、工业人工智能芯片及工业视觉传感器等基础软硬件的研发突破。2019.11.13 国务院国家创新驱动发展战略纲要政策扫描总结:有关政策以规划和建设为引导,围绕超算中心、数据中心、AI芯片等展开基础硬件的强化与升级8人工智能基础层概念界定1人工智能基础层需求篇2人工智能基础层供给篇3典型人工智能基础层企业案例4人工智能基础层发展洞察592021.7 iResearch Inc. 108915131898234029693715453338225726744292011137513940166
17、48201920202021e2022e2023e2024e2025e人工智能核心产业规模(亿元)人工智能带动产业规模(亿元)人工智能产业的社会经济价值智能化转型趋势下,人工智能产业及其带动规模维持高增速AI技术作为智能化转型的重要工具,是指通过机器学习、计算机视觉、智能语音和自然语言处理等技术,处理企业的结构化与非结构化数据等,以提升业务流程效率、进行产品与服务创新并对整体业务作出分析与反馈等。现阶段,各行业企业在改善价值链、降本增效的内在需求驱动和人工智能被列入“新基建” 的外在因素影响下,产生了多样化的智能化转型升级需求。据艾瑞测算,2020年中国人工智能核心产业规模超过1500亿元,至
18、2025年预计超过4500亿元,2021-2025年人工智能核心产品CAGR为24%; 2020年人工智能带动相关产业规模超5700亿元,至2025年将突破16000亿元,2021-2025年人工智能带动相关产业CAGR为22%。在新产业、新业态、新商业模式经济建设的大背景下,企业对AI的需求逐渐升温,人工智能产值的成长速度令人瞩目;且基于AI的“赋能”特性,已逐步展现出从单向的产品供应向各产业深度双向共建的特征发展,带动相关产业发展,回馈社会经济。注释:核心产业规模包括计算机视觉、智能语音、人机交互、机器学习、知识图谱与NLP、AI芯片等;带动产业规模包括AI核心产品所带动的工程服务、大数据
19、平台与应用建设、计算机通信产品整机销售收入、甲方企业产值与效益提升的规模总和。来源:艾瑞长期政府及企业服务数据监测,结合行业专家访谈,根据数据测算模型,自主研究绘制。2019-2025年中国人工智能产业及带动相关产业规模CAGR=22%CAGR=24%102021.7 iResearch Inc. 基础层初步成型是AI产业链成熟的标志基础层资源促进AI产业链各环节价值传导顺畅、分工明确现阶段,已初步成型的AI基础层资源可有效缓解下游行业用户逐渐增长的、从感知到认知多类型的AI应用模型开发及部署需求。细看基础层内部,一方面,数据资源、算力资源和算法开发资源三者之间的分工更为明确和有序。数据基础服
20、务及治理平台企业为AI产业链供应数据生产资料;智能计算集群产出高质效的生产力;智能模型敏捷开发工具则负责模型开发及模型训练等,输出AI技术服务能力,提高AI应用模型在各行业的渗透速率与价值空间。另一方面,基础层厂商的数量保持增长、厂商业务范围持续扩大,可提供专业定制化或一站式的基础资源服务。由此,基础层完成AI工业化生产准备,通过直接供应和间接供应的形式,将基础层资源传送到下游的AI应用需求端,产业链向顺畅的资源输送及价值传导方向演进。注释:绿色箭头代表需求传导链,黄色箭头代表供应传导链,需求端与供给端的传导链并不完全独立,可同时并存。AI企业可具备AI技术层供应和AI基础层供应双重角色。来源
21、:艾瑞研究院自主绘制。AI基础层供应端AI技术层供应端AI应用需求端数据基础服务及治理平台智能计算集群智能模型敏捷开发工具提供模型训练的生产资料提供产业链的生产驱动力输出AI技术服务能力应用需求直接传达到基础层一站式数据治理平台厂商数据标注厂商数据采集厂商智能计算平台AI服务器厂商AI芯片厂商一站式AI开发平台厂商AI开放平台厂商计算机视觉自然语言处理语音识别机器学习知识图谱深度学习G端需求B端需求智慧城市、智慧政务、智慧警务等高校学术科研和学科建设AI模型部署需求AI基础层资源调用需求直接供应:不经过中游技术层,上游直接提供基础层资源供自研需求的客户调用间接供应:将基础层资源传输到技术层在解
22、决方案中供应基础层资源对技术层传递基础资源需求转达基础资源需求AI产业链价值传导机制示意图112021.7 iResearch Inc. 2021.7 iResearch Inc. AI基础层解决人工智能生产力稀缺问题基础层资源缓解甲方在对待人工智能投资上的“矛盾”根据艾瑞2020年执行的CTO调研,2019年超过51%的样本企业AI相关研发费用占总研发费用比重在10%以上,2020年65.9%的企业AI研发占比达到10%以上。一方面是甲方企业不断增长的对智能化转型的强劲需求,一方面则是在AI应用开发与部署过程中企业普遍面临的数据质量(49%)、技术人才(51%)等基础资源配置难点。且目前只有
23、少数企业可以完成AI项目实施前设定的全部投资回报率(ROI)标准,因此甲方企业在投资AI项目时相对审慎。AI基础层资源则可有效缓解甲方利用AI技术重塑自身业务时的投资矛盾,提升模型生产效率,降低部署成本:数据资源集群具备数据采标与数据治理能力,且一站式的数据平台可对实时数据进行统一管理,提高数据利用率;高效的AI算力集群与调度系统可满足模型训练与推理需求,降低总拥有成本(TCO,Total Cost of Ownership);基于算法开发平台演化出的语音识别、计算机视觉、机器学习等专业的AI模型生产平台,可提供高效、一站式的AI模型生产服务。来源:艾瑞研究院自主绘制。来源:艾瑞咨询2020年
24、中国人工智能产业研究报告大中型企业CTO/CIO调研,N=41,2020年9月。数据资源算力资源算法开发资源 数量多、标准不统一:数据量激增,半结构化与非结构化数据难以标准化,数据价值有待发掘,数据开发缺少统一标准 标注成本高:海量数据标注耗费大量时间与人力 风险隐患:数据存在违规违法泄露风险,数据共享隐患多 算力需求强劲但利用率较低:各业务实时性算力需求攀升,业务与算力适配难度较大 算力资源部署难、调度难:硬件采购成本高以及交付周期不可控,计算资源调度门槛高 算力集群操作系统复杂:各类异构算力的操作系统自动化水平低,交互友好性低 产品二次开发:由于企业业务特性不同,长尾化的AI开发需求难以满
25、足。产品二次开发普遍存在,需要定制化的AI能力 沟通不畅:开发涉及多团队沟通、沟通对接冗余43.9%34.1%12.2%9.8%完成全部ROI指标仅达成部分ROI指标未设定明确ROI未完成ROI指标2020年中国甲方企业AI项目投资回报率实现情况甲方企业部署AI基础层资源面临难点12人工智能基础层概念界定1人工智能基础层需求篇2人工智能基础层供给篇3典型人工智能基础层企业案例4人工智能基础层发展洞察5132021.7 iResearch Inc. 人工智能基础层资本情况融资热度较高,资本市场广度与深度拓宽据艾瑞不完全统计,2015年至2021年Q1,中国人工智能基础层融资事件共计208起。各赛
26、道中,算力资源赛道目前形成以AI芯片和智能服务器为主、高性能计算中心为辅的情况,而数据资源赛道的融资集中分布于数据资源定制服务与数据集产品。同时,综合类融资事件围绕着AI芯片、高性能计算平台、AI模型生产平台与数据资源服务而展开。从融资轮次分布情况看,人工智能基础层资本市场呈现多轮次的局面。融资多聚集在战略投资、股权投资、并购与A轮及以前,IPO与Pre-B轮后融资较为分散。这意味着该市场存在新鲜度、活跃度较高的企业同时,不乏产业成熟度较高的企业。艾瑞认为,随着多类型的玩家入局与产品丰富度提高,该资本市场的广度与深度将进一步拓宽。来源:艾瑞研究院根据公开投融资数据自主研究绘制。2015-202
27、1Q1中国人工智能基础层融资事件分布情况算力97起AI开发平台38起算力&AI开发平台15起数据47起算力&数据&AI开发平台11起融资轮次分布投融资走势赛道分类统计242736403237122015201620172018201920202021Q127.9%26.4%14.4%12.0%11.5%7.7%战略投资/股权投资/并购A轮及以前Pre B至B+轮IPO相关C轮至C+轮D轮至E轮142021.7 iResearch Inc. 人工智能基础层产业图谱注释:以企业主营业务为主,展示部分行业代表性企业。图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名
28、。来源:艾瑞根据公开资料研究绘制。2021年人工智能基础层产业图谱智能计算集群智能模型敏捷开发工具数据基础服务及治理平台服务器芯片及加速卡异构智能计算服务器终端AI芯片智能云算力AI开放平台AI应用模型效率化生产平台AI基础数据服务面向AI的数据治理平台横琴先进智能计算平台、国家超级计算中心、地区人工智能计算中心先知Brain+PAITIModelArtsAI 云AI开源框架AI Station企业自建/第三方AI数据中心等152021.7 iResearch Inc. 人工智能基础层市场规模AI企业业务突破、智能化转型趋势等多因素驱动产业规模增长AI企业突破业务增长瓶颈的需求是人工智能基础层
29、发展的驱动力之一。当前人工智能核心产业规模保持线性增长态势,且增速趋于平稳与常态化。为寻求产值增长突破点,AI企业发力探索开拓市场的有效手段。依托人工智能基础层资源建设,AI企业可有效应对下游客户的长尾应用需求,再将高频应用转化为新主营业务。此外“新基建”、半导体自主可控等相关政策扶持、传统行业智能化转型等因素也都在助推人工智能基础层资源的发展。据艾瑞测算,2021-2025年,人工智能基础层市场规模CAGR为38%,整体产业规模发展速度较快、空间较为广阔,总体呈现持续增长的走势。2020年,中国人工智能基础层市场规模为497亿元,为人工智能产业总规模的33%,市场规模相较去年同比增长76%,
30、AI应用模型效率化生产平台创收增长、AI芯片市场规模随着云端训练需求出现较高增长等是同比增速的主要拉动力;2021-2024年同比增速趋于平缓下降,市场开始恢复稳步增长态势。到2025年,中国人工智能基础层市场规模将达到2475亿元,云端推理与端侧推理芯片市场持续走高使得人工智能基础层整体市场同比增速稍有抬升。注释:此处的人工智能基础层规模由AI芯片(算力)、AI基础数据服务(数据)、面向AI的数据治理(数据)、AI技术开放平台(算法)与AI应用模型效率化生产平台(算法)构成;算力模块的计算核心为AI芯片,服务器其他硬件构成与AI算力不存在直接相关性,故不予统计计算。来源:艾瑞研究院自主研究绘
31、制。CAGR=38%282 497 692 957 1315 1801 2475 76.0%39.3%38.3%37.4%37.0%37.4%201920202021e2022e2023e2024e2025e中国人工智能基础层市场规模(亿元)同比增速(%)2019-2025年人工智能基础层市场规模16智能计算集群172021.7 iResearch Inc. 设备与基础设施供应芯片原材料与设计制造智能计算集群产业链及图谱智能计算集群的产业链结构为:1)上游:材料与基础设施;2)中游:智能计算集群供应商;3)下游:各行业算力需求企业。中游的三类服务商中,系统级AI芯片厂商为服务器厂商提供异构计算
32、所用的芯片或板卡;异构智能计算服务器厂商则为各类型数据中心/超算中心提供服务器。值得注意的是,智能云、互联网等领域企业的自建数据中心需求增长,且其中AI服务器比例逐渐增高。服务器零部件CPU/GPULAN芯片组DRAM内存RAID控制器SSD/HHD电源/其他ODM厂商EDM设计生产制造设备:光刻机、蚀刻机等半导体材料:硅片及耗材宽带网络基础设施电力供应温度/通风机柜/光纤ICT设备国家/地区级超算中心国家超算中心地方超算中心第三方数据中心厂商自建数据中心人工智能计算中心算力集群供应商中游上游材料与基础设施数据中心/超算中心异构智能计算服务器厂商品牌厂商智能计算集群供应商企业自建数据中心需求增
33、长,AI服务器占比逐渐增高注释:图谱中所展示的公司logo顺序及大小并无实际意义,不涉及排名。来源:艾瑞研究院结合公开资料自主研究绘制。智能数据集群产业链及图谱下游:各行业算力需求企业地区人工智能计算中心封测代工系统级AI芯片厂商:IDM模式系统级AI芯片厂商:Fabless模式晶圆代工IC设计182021.7 iResearch Inc. 超算/数据中心的存量与增量判断从算力需求与节能减排规定看存量替换与增量增长现有的超算/数据中心以建设单位为标准,可分为两类:1)以国家或地方为建设单位的G端超算中心,服务对象主要为国家牵头的重点科研单位、高校研究院等,此类超算中心是解决国家安全、科学进步、
34、经济发展与国防建设等重大挑战性问题的重要手段,近两年受国家与地方的高度重视与扶持,建设与升级超算中心的趋势愈加明朗。但由于数据网络安全与计算精度要求高,建设周期较长,此类超算中心的数量在中短期内增长缓慢,长期来看则会成为替换存量与增量增长的贡献主力之一。2)以智能云厂商或IDC服务商为建设供应主体的B端超算/数据中心,为互联网公司、其他类型的企业或事业单位提供主机托管、资源出租、增值或应用服务,是存量与增量市场变化主要推力。从市场变化趋势来看:1)存量市场:日渐增加的AI计算负载需要处理力更强、能耗承受度更大的数据中心,同时,一系列有关控制数据中心PUE值的节能审查规定相继出台,一味盲目扩建、
35、新建数据中心已难合时宜,促进老旧数据中心绿色化改造的减量替代方案因此诞生。微型、中小型数据中心会逐渐被改造为集约型的大型数据中心,符合节能减排相关标准、机柜数量与异构组合增多的集约型超算/数据中心将在存量市场中占据主流。2)增量市场:考虑到边缘计算可分担AI计算任务、兼具低延时优势,管理边缘计算中心则需要布局相应的大型云端数据中心,故增量市场会被异构的边缘计算数据中心与云端超算或大型数据中心扩充。注释:此面积图是根据研究资料总结所得的历史趋势判断进行的定性绘制。来源:艾瑞研究院结合国防科技大学学报中国超算技术赶超发展模式探析、专家访谈、桌研公开资料自主研究绘制。中短期长期超算/数据中心未来的存
36、量与增量市场变化存量增量数据中心数量集约型的超算中心、大型数据中心的数量(含G端与B端)占比相当,在存量市场中占据主要地位微型、中小型数据中心逐步被替换,数量减少,占比压缩时间新建的边缘数据中心、云端超算或大型数据中心数量增多(含G端与B端)微型、中小型数据中心的数量依旧有所保持,在存量市场中保有相当占比集约型的超算中心、大型数据中心的数量逐步增多192021.7 iResearch Inc. AI服务器综合能力维度资源配置相互协作,共同决定AI服务器综合能力强弱吞吐量、响应时间、并发数与业务成功率等技术评价指标往往是一台AI服务器在各种资源运行协作下产生的结果,要评价AI服务器的综合能力,需
37、追溯到最根源的资源配置上,查看软硬件搭配的综合情况。艾瑞在此处将AI服务器的综合能力维度分成三部分:板卡芯片组配置、硬盘-网络带宽-操作系统、机箱结构设计。板卡芯片组是AI服务器运行效率的核心,主频高、核心数多的CPU搭配小面积、高频率、算力强的加速芯片,并结合互联互通的总线与充足的内存,才能保证更高的吞吐量、更多的并发数与更低的延迟。硬盘-网络带宽-操作系统是AI服务器的运作基础,硬盘存储空间与网络带宽的大小影响着AI应用与用户数据存储的上限与线上接入数据的快慢,操作系统则影响着数据与访问的安全性、执行的效率与稳定性。由于AI服务器配置多个GPU或其他的系统级芯片,在助跑AI模型时会散发较多
38、的热量,因此AI服务器物理环境的安全稳定、机箱的通风散热设计亦是需要考虑的因素。来源:艾瑞研究院结合公开资料自主研究绘制。计算核心:板卡芯片组配置辅助:机箱结构设计AI服务器综合能力解析运作基础:硬盘-网络带宽-操作系统CPU很大程度上决定服务器的工作速度与效率,影响吞吐量。CPU的主频越高、核心数越多,服务器的运转速度就越快GPU or FPGA or ASIC AI芯片是算力强弱的核心。架构与制程、理论与实际算力效果、功耗、存储宽带接口、与物理主机的适配性等共同影响着AI芯片性能的高低缓存、内存与总线缓存越大,越能提高CPU对内部数据的命中率;内存的容量越大、频率越快、延迟越低,越能提高C
39、PU调用数据的效率;总线涉及到芯片、硬盘、设备、网卡之间的通信效率硬盘网络带宽操作系统服务器硬盘种类的选择关联到CPU的占用情况与数据传输速度的快慢,目前一般采用SATA和SCSI接口类型的硬盘部署服务器的前期需做好带宽预估工作,带宽影响单位时间内数据量的传输效率与业务响应时间当前服务器的主流操作系统为Unix、Linux、Windows Server和NetWare,各操作系统的特性与应用场景有差异,客户需根据自身行业与业务性质选择AI服务器为多卡配置,需对系统的结构、散热、拓扑做针对性设计,保证性能稳定AI服务器综合能力的三大维度202021.7 iResearch Inc. AI加速服务
40、器的出货情况销售数量持续走高,市场处于成长期尽管现阶段的各类人工智能应用模型层出不穷,但是人工智能应用层的各种理念远远走在底层算力架构之前,现有的计算资源难以满足人工智能的算力需求,人工智能底层算力架构的设计与优化已是大势所趋。CPU+GPU/FPGA/ASIC类的异构AI加速服务器能够为机器学习、深度学习、计算机视觉、NLP、知识图谱、智能语音等AI技术加速,支持更大规模的深度神经网络模型的同时,还能提高训练精度,因而成为AI算力突破的新业务增长点。据艾瑞统计与预测,2020年我国AI加速服务器销售数量为13万台,到2025年,我国AI加速服务器销售数量将达到27万台,2021-2025年的
41、相关CAGR=12%,我国AI加速服务器出货市场整体呈现上扬趋势,AI加速服务器在服务器市场中的渗透率将会继续走高,并持续为服务器市场注入较为强劲的增长活力。注释:AI加速服务器是指采用异构形式部署、搭载异构计算加速卡的服务器。来源:艾瑞研究院结合桌研情况、专家访谈自主研究绘制。2020-2025年中国AI加速服务器销售数量13 17 19 22 24 27 20202021e2022e2023e2024e2025eAI加速服务器销售数量(万台)CAGR=12%212021.7 iResearch Inc. 端-边-云的算力协同端-边-云实现AI算力泛在,加速AI模型训练与推理在人工智能与5G
42、等技术的冲击下,设备端产生大量实时数据,若直接上传到云端处理,会对云端的带宽、算力、存储空间等造成巨大压力,同时也存在延时长、数据传输安全性等问题。因此,为缓解云端的工作负载,云计算在云与端之间新增了若干个边缘计算节点,从而衍生出端-边-云的资源、数据与算力协同。在算力协同的业务模式下,靠近云端的云计算中心承担更多的模型训练任务,贴近端侧的各设备主要进行模型推理,而二者之间的边缘侧则负责通用模型的转移学习,帮助云端分散通用模型训练任务、处理实时计算的同时,也解决了终端算力不足、计算功耗大的难题。未来,边缘计算的发展会催生出更适宜边缘计算场景的算力集群异构设计,其异构化程度将会高于传统的数据中心
43、,异构设计的突破将会进一步提高端-边-云的整体计算效能,进而加速AI模型的训练与推理。来源:艾瑞研究院结合公开资料自主研究绘制。端-边-云的算力协同运作流程云Cloud边缘Edge端Device算力:1-10TOPS功耗:0.1-10W延时:1ms算力:10-100TOPS功耗:10-100W云边缘延时:30ms移动边缘延时:20ms私有边缘延时:2ms算力:100+TOPS功耗:100+W延时:100ms训练推理STEP 3 信息输出:模型推理阶段从通用数据池获取云端存储的公共数据云服务器算力集群预训练,此环节为边缘AI的底座输出基础的通用云端模型STEP 2 算法执行:边缘转移学习阶段从边
44、缘数据池获取已存储的私有数据边缘服务器算力集群通过转移学习,对模型进行调优输出调优后的边缘模型边缘数据接入,从边缘数据池获取已存储的增量数据边缘服务器算力集群进行增量学习生成最终的边缘模型最终的边缘模型植入各种终端设备终端设备调动自有的算力工具,如AI推理芯片,进行推理输出模型计算出的结果算法下行与数据上传STEP 1 算法输出:预训练阶段222021.7 iResearch Inc. AI芯片市场规模当前以训练需求为主,推理需求将成为未来市场主要增长动力AI芯片是人工智能产业的关键硬件,也是AI加速服务器中用于AI训练与推理的核心计算硬件,被广泛应用于人工智能、云计算、数据中心、边缘计算、移
45、动终端等领域。当前,我国的AI芯片行业仍处于起步期,市场空间有待探索与开拓。据艾瑞统计与预测,2020年我国AI芯片市场规模为197亿元,到2025年,我国AI芯片市场规模将达到1385亿元,2021-2025年的相关CAGR=47%,市场整体增速较快。从AI芯片的计算功能来看,一开始,因AI应用模型首先要在云端经过训练、调优与测试,计算的数据量与执行的任务量数以万计,故云端训练需求是AI芯片市场的主流需求。而在后期,训练好的AI应用模型转移到端侧,结合实时数据进行推理运算、释放AI功能,推理需求逐渐取代训练需求,带动推理芯片市场崛起。2025年,云端推理与端侧推理成为市场规模增长的主要拉动力
46、,提升了逐渐下滑的AI芯片市场规模同比增速。来源:艾瑞研究院通过统计分析市场主流AI芯片供应商数据、结合桌研行业趋势与专家访谈自主研究绘制。2019-2025年中国AI芯片市场规模CAGR=47%67 102 148 208 287 383 494 58 95 150 233 361 563 891 57.0%50.7%48.3%46.9%46.2%46.4%201920202021e2022e2023e2024e2025e训练芯片市场规模(亿元)推理芯片市场规模(亿元)同比增速(%)1261972974416479461385232021.7 iResearch Inc. 以技术架构分类看A
47、I芯片市场规模GPU、ASIC、FPGA各司其职,协同开拓细分架构市场从AI芯片的技术架构看,运用得最为广泛的加速计算芯片为GPU,这主要是因为GPU具备高密度与高并行的计算优势,可用于以深度学习为主的AI算法模型训练。但是,在以下典型的两种情况下,GPU的优势难以得到充分发挥,AI计算需要更好的替代方案:1)在细分长尾的计算场景中,通常需要设计可实现特定功能的计算模型,相比更为通用、更适用于图像类运算的GPU而言,ASIC芯片因其专有性更适合此类计算。2)在执行推理任务时,数据量是实时而小批量的,使用GPU显得有些“大材小用”,而FPGA同时拥有流水线并行与数据并行的功能,更适用于此类情况,
48、而且时延更低。因此,AI芯片市场同时需要GPU、ASIC与FPGA等多类芯片来针对不同的应用模型进行计算。2019-2025年,GPU的市场规模保持着主要地位,2025年起市场规模将达到1169亿元。ASIC与FPGA的市场规模还处在起步阶段,增长态势偏稳定,存在较大的拓展空间,有望替代GPU执行更为复杂或更有针对性的计算任务。来源:艾瑞研究院通过统计分析市场主流AI芯片供应商数据、结合桌研行业趋势与专家访谈自主研究绘制。2019-2025年中国AI芯片细分架构市场规模119 187 277 402 579 822 1169 4 7 12 21 38 71 136 3 3 8 17 30 52
49、 80 201920202021e2022e2023e2024e2025eFPGA市场规模(亿元)AISC市场规模(亿元)GPU市场规模(亿元)242021.7 iResearch Inc. 云化AI算力开放共享虚拟AI算力资源,实现AI模型海量训练与推理AI是一种高资源消耗、强计算的技术,AI算力的强弱直接关联到AI模型训练的精度与实时推理的结果。若企业独立部署AI算力,不仅需要建设或租用机房这类重资产与网络宽带资源,还需要购置物理机、内存、硬盘等硬件设备,而且购置设备存在采购周期不确定、硬件资源过度铺张、专业管理团队缺乏等问题。所以,独立部署AI算力资源是一项耗时耗力的工作。将AI算力云化
50、是一种高效能、低成本的有力解决方案。具备先天性业务优势的云服务商搭建数据中心,先将AI服务器算力资源虚拟化,开放给AI模型开发者,做到按需分配,如给短视频业务的开发者优先配备CPU+GPU方案,而后对算力资源的调度工作进行统一管理。由此,“物美价廉”的算力有序注入各行各业的AI模型中,减轻了井喷式数据爆发所带来的模型训练负担,并能及时根据用户使用情况弹性扩充或缩减虚拟算力资源空间,达到方便、灵活、降本增效的效果。来源:艾瑞研究院自主研究绘制。完成AI服务器集群虚拟化部署物理层:云化之前的基础铺垫IaaS层:全自动管理算力资源调度的云平台提供AI云算力资源调度服务云化AI算力架构图算力资源虚拟化算力资源云化虚拟化后需构