【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现图计算是继 AI 之后的又一方向性领域-精品文档资料整理.docx

上传人:安*** 文档编号:73269034 上传时间:2023-02-17 格式:DOCX 页数:13 大小:20.32KB
返回 下载 相关 举报
【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现图计算是继 AI 之后的又一方向性领域-精品文档资料整理.docx_第1页
第1页 / 共13页
【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现图计算是继 AI 之后的又一方向性领域-精品文档资料整理.docx_第2页
第2页 / 共13页
点击查看更多>>
资源描述

《【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现图计算是继 AI 之后的又一方向性领域-精品文档资料整理.docx》由会员分享,可在线阅读,更多相关《【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现图计算是继 AI 之后的又一方向性领域-精品文档资料整理.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现,图计算是继 AI 之后的又一方向性领域 CSDN首页 业界 订阅业界RSS 【AI技术生态论】阿里云蒋晓维入选 HPCA 名人堂:高性能计算新内存介质将涌现,图计算是继 AI 之后的又一方向性领域 发表于 2020-06-04 15:30:01 受访者 | 蒋晓维 阿里云根底设施效劳器研发团队科学家 记者 | 夕颜 出品 | CSDN ID:CSDNnews 是CSDN提议的“建议下的重要组成局部 与、一起 打造一个覆盖百万开发者的AI生态联盟。 2020年度 AI技术生态论栏目将对1000 AI生态大咖进展系列

2、访谈 勾勒出AI生态最具影响力人物图谱以及AI产业全景图 本文为 AI 技术生态论系列访谈第三十一期。 百万人学 AI 你也有份 今日起点击浏览原文报名2020 AI开发者万人大会 使用优惠码“AIP211 即可免费获得价值299元的大会在线直播门票一张。限量100张 先到先得 近日 由 IEEE 主办的高性能计算架构国际研讨会 HPCA 公布了最新一期名人堂 Hall of Fame 名单 来自阿里云根底设施效劳器研发团队的科学家蒋晓维成为名人堂新晋成员。 这是首次有云计算领域学者入选 蒋晓维也是阿里巴巴第二位入选 HPCA 名人堂的科学家。 HPCA名人堂很牛吗 蒋晓维这次入选的 HPCA

3、 名人堂是什么来头 关注计算机构造的朋友一定听讲过 它与计算机体系构造国际研讨会 ISCA 以及微体系构造国际研讨会 MICRO 齐名 并列计算机体系构造领域三大国际顶会 论文专业领域包含 CPU 体系构造、高性能计算、AI 芯片、I/O、平安、新介质研究等 过去 26 年度来推动了多项计算机系统技术的开展 包括 90 年度代末的 SMT 技术、2005 年度的虚拟化技术、10 年度的非易失内存技术等。 计算机体系构造领域的三大顶会分别有自己的名人堂 HPCA 名人堂成员包括 GPU 之父 Bill Dally 等。HPCA 名人堂的入选要求极为严苛 入选标准为发表 8 篇 HPCA 论文 论

4、文平均入选率仅为 15%。 HPCA 名人堂名单 以往 入选 HPCA 名人堂者根本都是来自于各国的大学以及研究所 纯粹来自工业界背景的人很少 华人更是凤毛麟角 自成立以来仅有 5位华人学者获得 HPCA 名人堂荣誉 其中就包括蒋晓维在阿里巴巴的同事阿里巴巴达摩院高级研究员、平头哥首席科学家谢源。 在一众计算机体系架构顶尖专家中脱颖而出 实属不易。 这不禁让人好奇 蒋晓维是如何一个人 为何能获此殊荣。幸运的是 恰逢此次 HPCA 宣布名人堂入选人之际 CSDN 有了一次与蒋晓维本人沟通的时机 来深化解析一下蒋晓维其人。 别人家的小孩 长成芯片“大佬在方案之中 自从 2021 年度参加阿里云根底

5、设施效劳器研发团队 蒋晓维至今仍在这里从事效劳器研发工作 研究领域覆盖 CPU 架构、芯片设计、网络、虚拟化技术等。 在此之前 他曾在 Intel 以及 Google 工作 在芯片、软硬件领域硕果累累。在 Intel 他是首颗超低功耗 CPU Quark D1000 的首席架构师 定义了其核心架构 介入 多代芯片端到端开发测试流片以及产品化 同时他也是 Edison SoC 芯片的架构师。 在 Google 他介入Google第二代SDN网络的研发工作 负责其中的数据面开发。 参加阿里后 他完成了国内首颗 x86 CPU 的特性定制化工作 使阿里成为国内第一家部署基于定制CPU 的自研效劳器的

6、公司 开了国内定制化 CPU以及自研效劳器 的先河 在网卡领域 他定义了高性能虚拟网络硬件转发 确定了阿里云网络转发性能业内第一的地位。 从如今的视角会看 蒋晓维的这些成果在当时的背景下 无一不对当时的计算机体系架构领域产生重大影响。 不积跬步无以致千里 蒋晓维是怎样从幼龄小童成长为一个对中国乃至世界计算机领域做出奉献的科学家呢 从小到大 蒋晓维的成长经历都是典型的父母眼里别人家的小孩。 他生于六朝古都南京 是土生土长的南京人。小学时期 蒋晓维就在计算机上显示出了不同于同龄小孩的聪明 尤其擅长数学 小学三年度级就被南京市选拔开场学习编程 六年度级获南京市青少年度奥林匹克信息学竞赛一等奖 初中以

7、及高中分别获得过全国数学联赛江苏赛区一等奖。在这个经过中 蒋晓维不仅对编程产生浓重的兴趣 还对程序怎样运行在底层硬件这件事很感兴趣 毕竟在那个年度代 包括 CPU 在内的计算机底层芯片对于人们生活的影响还没有很明显的表达 程序能在一枚小小的芯片上运行对蒋晓维来讲是件新奇的事。当时 他曾接触过一个叫做 laser310的芯片 可能如今很多人已经认不出这是何物 它其实就是一个只有 8K 的 ROM 固化了 basic编程语言的 CPU。 按照蒋晓维的话来讲 回头看当时的底层芯片 真是“low到不可思议。但随着 CPU 技术的开展 如今底层芯片已经发生了翻天覆地的变化 性能得到千万 甚至上亿倍的提升

8、。进入互联网时代 分布式、大数据、AI 各种应用层出不穷 大众都在追求极致的性能。 小时候这股“开挂的石头后劲十足 一直持续到他进入南京大学学习电子工程 又一路顺利读研 最终在北卡州立大学完成博士学业 获得计算机工程博士学位。 在读博期间 蒋晓维接触到很多计算机领域的专家 为他之后学业以及职业生涯奠定了根底。 蒋晓维是个目的明确的人 认准了计算机架构这个方向才定向选择到北卡州立大学求学 并选择了自己的导师以及专注于计算机构造领域实验室。在实验室里 蒋晓维认识了很多对他产生重大影响的专家们 其中对他影响最大的 是他博士期间的导师 Yan Solihin 。这位来自印尼的教授是美国电子电气工程师协

9、会 Fellow 在计算机体系构造各个领域都有很多学术奉献 也对 x86 等各种商业化产品产生过较大的影响 比方 x86 里的CAT 即Cache QoS技术 他就是最早的提议者 硬件平安领域中的平安处理器 最早也是由他提出的。 在这位态度严谨的导师的影响下 蒋晓维专精于计算机体系构造 同时也广泛涉猎操作系统 具备平安等跨领域才能 对他后来在工作中的选择方向以及领域产生了比拟重要的影响。 毕业后 蒋晓维先后在 Intel、Google 以及阿里巴巴从事计算机构造、网络、效劳器等领域工作。在全球顶尖科技公司工作 三家公司给了他不同的感受以及经历。 打造首颗低功耗CPU Quark D1000 I

10、ntel 是蒋晓维毕业后走向职业生涯的第一个“东家。这家老牌公司固然员工平均年度龄是三家公司中最大的 但创新才能也是有目共睹。 在这里 蒋晓维是史上首颗低功耗x86 CPU Quark D1000 和 Edison SoC 的架构师。 图源 视觉中国 Quark 一族早已历经数次迭代 性能早已不同往日 但回首起来 Quark D1000 对于Intel 公司 乃至整个 CPU 技术以及市场 都有着重要的意义。 不仅是 Quark D1000 蒋晓维作为首席架构师研发的 Edison SoC 对于 Intel 来讲也是至关重要的产品。在 2021 年度的 CES 展上 Intel CEO 发布了

11、这枚片上系统 引起了很大关注。参加阿里巴巴之后 等到 2021 年度蒋晓维路过杭州的云栖小镇 当地已然围绕 Edison SoC 形成了一个创业生态社区。 在Google打造第二代SDN网络 在 Google 蒋晓维感受到了与 Intel 不一样的气氛。这里的员工平均年度龄更小 非常鼓励创新。 图源 视觉中国 在这里 蒋晓维从事的是数据中心负责业界最大规模的第二代 SDN 网络研发工作 团队里有一群来自于美国各个大学 拥有教授背景的同事。学术界其实很早就已经提出 SDN 的概念 Google 是第一家将之实现并在数据中心大规模部署的公司。 在阿里 创始国内定制化CPU以及自研效劳器先河 时间来

12、到 2021 年度 蒋晓维参加了阿里巴巴 与一群更加年度轻的人共事。与 Google 总体单调的业务相比 阿里的业务场景更加复杂 给了做技术的人更多与业务结合 以业务驱动技术创新的发挥空间。 他做的第一件重大成果就是完成了国内 x86 CPU 定制化以及自研效劳器的工作 打造了离线以及在线业务负载tracing 才能 创始了国内定制化 CPU以及自研效劳器 的先河。 阿里的初衷 是让底层的 x86 CPU 以及效劳器可以更好地适配阿里云的计算需求 蒋晓维团队的工作主要是填充之间的 gap。所以 他们针对阿里云在性能在功耗各方面的特征以及需求展开 trace 捕捉这些业务的特征。有了这个才能之后

13、 阿里一方面可以有的放矢地进展性能优化 更重要的是结合英特尔针对性地对 CPU 以及效劳器做后期改动 让 CPU以及效劳器更好地知足阿里云的需求。 同时 蒋晓维团队还针对阿里业务定义 benchmark 让定制 CPU 以及自研效劳器从系统层面、微架构层面确保性能符合业务需求。 值得一体的是 在阿里 蒋晓维与同被入选 HPCA 名人堂的谢源一起工作 两人不仅在工作上交集颇多 也保持着不错的私人关系。在蒋晓维看来 谢源是华人中的旗帜性人物 由于在计算构造领域的前沿方向性奉献 谢源是目前唯一一个“集齐ISCA、MICRO、HPCA 三大顶会名人堂荣誉的华人。固然不在同一个部门 但工作上的共性让两人

14、之间有了一些合作 比方合作发表关于图计算与高性能计算集群 EFLOPS 论文。 除去这些荣誉上的光环 蒋晓维眼中的谢源是个平易近人 球技不错的足球爱好者。在专业上 谢源是个对技术方向性具有前瞻以及预判的科学家 此前在 AMD 建立中国团队的经历 也让他在学术以及工业两方面具备了良好的判断力以及执行力。 在笔者看来 同被选入顶会名人堂 可能与蒋晓维以及谢源两人身上普通人不具备的共同特质分不开 比方对技术创新促进技术开展 通过技术手段应用于理论 给上层业务带来红利 反过来业务可以以驱动底层创新这一点坚信不疑 换句话讲 他们都是 believer。 高性能计算的将来 新内存介质将涌现 图计算是方向性

15、领域 在学术上 今年度 2 月份 蒋晓维系统性介绍了阿里云的高性能 AI 集群的节点架构、网络架构、以及通信算法的一篇论文被 HPCA 收录 该论文名为?EFLOPS: Algorithm and System Co-design for a High Performance Distributed Training Platform? 展示了他对于高性能计算的考虑以及 EFLOP S集群为阿里巴巴业务带来的价值。 图源 视觉中国 这个来历自多个部门的阿里技术专家介入打造的集群可将大模型的训练速度提升4 倍 并支持千万分类模型的训练 在提升翻译模型精度的同时 能将训练时间从100 小时降低至1

16、2小时。 关于高性能计算的将来 蒋晓维也给出了一些自己的看法以及预测。 他讲到 高性能计算 包括 CPU 所擅长的通用型计算将来都会出现一些新的技术与趋势。 首先 是新的内存介质以及计算架构会源源不断地涌现 比方就在过去几年度 非易失内存 Apache Pass 的出现使得内存才能得到宏大提升 同时也改变以及计算架构 很快会有其他介质的内存出现 in memory computing技术也会不断产品化。 此外 将来软硬一体化的设计思路将会更多 结合业务上层的软件特质 对底层架构设计产生打的影响。 最后一点是图计算将是将来计算领域的方向之一 包括稀疏性计算在图计算以及一些 AI 场景下都会表达出

17、重要性。无论是 CPU GPU还是计算体系 这方面都有很大的提升空间 在不久的将来可能会出现相应的解决方案。 除了大的方向性趋势 蒋晓维还从实处聊了聊当前的处理器现状。进入智能计算时代 IoT 已成为将来应用的新趋势已成为业界的共识 因此针对 IoT 的底层计算设备至关重要。 MCU 处理器就是非常合适 IoT 场景的底层硬件。在微控制器架构层面上 现状是 x86 以及 Arm 等架构并存 的从专业视角来看 哪种架构形式将成为主导呢 MCU 架构又会向什么方向以及趋势开展 首先 蒋晓维讲到 MCU 处理器其实更多地是针对 IoT 场景 之前这一领域是 Arm 的强项 但最近几年度 RISC-V

18、 崛起 不断地吞噬这一局部市场。就 MCU 来讲 从软件生态上来看 Arm 以及 RISC-V 一定会是主导 但除了这两个架构之外 可能也会有其他在这个生态之外的单个点的架构的存在。 而对于数据中心的效劳器 不管是公有云还是私有云 因为 x86 上层的软件生态构建相对完善 x86 的效劳器可能在将来一段时间都是主导 但是 Arm 也是一股不容小觑的崛起的权力 在中国 Arm 已经在效劳器侧推出了一些产品。 深度优化底层硬件在图计算领域的性能表现至关重要 在 HPCA 收录的文章中 除了 EFLOPS 蒋晓维以及研发团队还率先提出 CPU 架构上运行图计算的六大瓶颈 并给出相应的优化方案 为图计算将来的芯片架构以及效劳器架构奠定了理论根底。 之所以在图计算上投入宏大精力 是因为阿里云认为图计算是一个继 AI 之后额方向性领域。蒋晓维认为 图计算与 AI 的处境有所不同 深度学习目前已经有了很不错的底层硬件支持 比方谷歌的 TPU 阿里云的含光 800、GPU 等 但是图计算上 无论是 CPU 或者 GPU 还是效劳器架构 底层硬件对图计算的支持几乎是空白。将来 业务必将向图计算开展 因此 深度优化底层硬件在图计算领域的性能表现 这对于学术界以及业界来讲都具有重要的意义。 【End】

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 工程图纸

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁