燧原科技张亚林:解构数据中心AI系统“全垒打”和“全维度”|GTIC2020


燧原科技张亚林:解构数据中心AI系统“全垒打”和“全维度”|GTIC2020文章插图
芯东西(ID:aichip001)
编辑 | 信仪
GTIC 2020全球AI芯片创新峰会刚刚在北京圆满收官!在这场全天座无虚席、全网直播观看人数逾150万次的高规格AI芯片产业峰会上 , 19位产学界重磅嘉宾从不同维度分享了对中国AI芯片自主创新和应用落地的观察与预判 。
在峰会上午场 , 燧原科技创始人兼COO张亚林通过视频的方式 , 发表了题为《软硬系统协同——云端AI芯片产品化关键》的主题演讲 。
燧原科技张亚林:解构数据中心AI系统“全垒打”和“全维度”|GTIC2020文章插图
燧原科技创始人兼COO张亚林通过视频的方式发表演讲
目前 , 燧原科技的云端AI芯片生态已经覆盖“邃思”通用人工智能训练芯片、“云燧T10”人工智能加速卡、GCU-LARE智能互联技术以及“驭算”计算及编程平台 。
在GTIC AI芯片创新峰会上 , 张亚林与我们分享了燧原科技对云端AI芯片产品化的看法 , 在他看来 , AI系统要落地数据中心必须具备四个要素 , 分别为系统集群、板卡、高性能高算力的芯片 , 以及全栈的软件 。 而衡量一个数据中心的AI系统需要从完备性、生产率、成本、功耗和性能五个维度来考量 。
以下为张亚林演讲实录整理:
一、数据中心趋于整合 , 计算和图形加速架构分离首先 , 张亚林通过案例和数据向观众解读了一个问题:2020年数据中心到底发生了什么?
在2019年 , 中国的数据中心行业规模已经占到全世界的30% , 2019~2021年全球云计算市场规模一直在爬升 , 到2021年将达到2890亿美金的市场规模 。
NVIDIA在第二季度公布的财报表明 , 这是有史以来第一次NVIDIA的数据中心业务超过了显卡业务 , 共达到17.5亿美金的营收 , 与去年同期相比增长了167% 。
张亚林说 , 数据中心正在朝着整合的方向走 , 世界上的三大巨头:Intel、NVIDIA、AMD都在通过并购加强自身在数据中心的布局 。
燧原科技张亚林:解构数据中心AI系统“全垒打”和“全维度”|GTIC2020文章插图
Intel、NVIDIA、AMD通过并购加强数据中心布局
Intel基于自己的CPU、数据和互联的业务收购了Altera后 , 在去年又收购了Habana来做Intel自身的加速卡业务 。
NVIDIA的加速卡计算业务很强 , 去年收购了Mellanox以丰富其数据卡和互联的业务 , 目前NVIDIA还正在积极布局收购Arm以增强NVIDIA自身的CPU业务 。
AMD本身具有CPU和加速卡业务 , 目前也开始收购赛灵思 , 以布局数据和互联方面的业务 。
张亚林讲到 , 如果所有的收购完成 , 今年在数据中心方面就会出现Intel、NVIDIA、AMD三强争霸的局面 , 由此看来 , 计算范式正在朝着数据中心系统化、整合化的方向进行变革 。
张亚林接着分析了数据中心产品正在发生的变化:
先从NVIDIA讲起 , NVIDIA推出了整个系统化的集群——SuperPOD , SuperPOD的整个元素是由DGX系统构成的 , 而在DGX中装入的是NVIDIA A100的板卡和芯片 , 完全遵循了自顶向下的设计原则 , 并以Turnkey(一站式方案)的方式进行SuperPod整个系统的推广 。
再来看AMD , AMD正在加速计算和图形结构的分离 。 从AMD发布MI100时的一张示意图来看 , 下图中灰色的部分表示其传统的GPU结构正在被抛弃 , 取而代之的是基于计算加速和优化的产品线和基于游戏加速和优化的产品线 , 在AMD的产品线中 , 它们分别被命名为RDNA GAMING-OPTIMIZED和CDNA COMPUTE-OPTIMIZED 。
燧原科技张亚林:解构数据中心AI系统“全垒打”和“全维度”|GTIC2020文章插图
AMD发布MI100时的示意图
同时 , 计算和图形的加速分离也导致了NVIDIA和AMD在两条线上进行布局 。