「」登陆云边端,AI芯片产业打响全线战争( 二 )


去年底 , 腾讯投资的燧原科技推出面向云端数据中心的AI训练加速卡云燧T10 , 单卡单精度算力达到20TFLOPS , 可以为大中小型数据中心提供了单节点、单机柜、集群三种模式 。 此外 , 像寒武纪、比特大陆也在去年从细分市场进入云端AI芯片市场 , 试图抢占一定的云端AI芯片的市场份额 。
【「」登陆云边端,AI芯片产业打响全线战争】Gartner数据显示 , 全球AI服务器及AI芯片市场规模自2016年到2020年都将保持持续的高速增长 , 而全球云端AI芯片当中GPU的市场份额却呈现出持续下滑的趋势 , 预计到2022年云端训练GPU占比将降至60% , 云端推理GPU占比更是只有30% 。
这意味着云端AI芯片的专用芯片的市场规模将进一步扩大 , 新入局玩家们特别是云服务厂商的巨头玩家们都会尽可能在自家的数据中心部署结合自身算法的AI芯片 。
2020年 , 随着高通、英特尔等芯片巨头、AWS、阿里、华为等云厂商以及芯片初创公司产品的落地 , 云端AI芯片市场的竞争将更趋激烈 , 未来将进一步削弱英伟达的话语权 。
从云端涌入的巨头玩家 , 搅动边缘AI芯片新战场
随着5G、自动驾驶、IoT等新技术普及和配套设备的海量涌现 , 接下来将为边缘侧AI芯片提供更大的发挥空间 。 特别是5G网络的普及将带来边缘侧数据处理方式的变革 , 为边缘侧AI的工作负载提供了更多需求 。
边缘计算正在被视为AI的下一个重要战场 , 原有的在云端、终端都有所积累的厂商 , 都希望通过边缘AI芯片的布局 , 完善云、边缘、终端生态 , 打造一体化的计算格局 。
早在2018年 , 谷歌就发布了用于边缘推理的微型AI加速芯片——Edge TPU , 专为企业在IoT设备中的机器学习任务而设计 。 在去年3月 , 谷歌还推出了千元级搭载Edge TPU芯片的开发板 , 可以加速硬件设备上的模型推理 。

「」登陆云边端,AI芯片产业打响全线战争
本文插图
(谷歌Edge TPU开发板)
似乎为回应谷歌的这一挑战 , 英伟达发布了面向嵌入式物联网的边缘计算设备Jetson Nano , 适用于入门级网络硬盘录像机、家用机器人以及具备全面分析功能的智能网关等应用 。 而在去年11月 , 英伟达又发布了边缘AI超级计算机Jetson Xavier NX , 能够在功耗10W的模式下提供最高14TOPS , 在功耗15W模式下提供最高21 TOPS的性能 , 为更小尺寸、更低功耗的嵌入式边缘计算设备提供了AI推理能力 。
「」登陆云边端,AI芯片产业打响全线战争
本文插图
(英伟达Jetson Xavier NX)
同样在去年底 , 寒武纪发布用于深度学习的SoC边缘加速芯片思元220 , 采用台积电16nm工艺 , 最大算力32TOPS , 功耗控制在10W , 支持Tensorflow、Caffe、mxnet以及pytorch等主流编程框架 。 根据其公布的数据 , 参数性能可以比肩英伟达去年发布的 Jetson 系统级模块——AGX Xavier 和Jetson Xavier NX 。
在去年7月的百度AI开发者大会 , 联合三大运营商、中兴、爱立信、英特尔等 , 发起百度AI边缘计算行动计划 , 旨在利用AI推理、函数计算、大数据处理和产业模型训练 , 推动AI场景在边缘计算的算力支撑和平台支持 , 加速百度AI应用生态在5G、物联网等新型场景下快速落地 。
在自动驾驶这类专用边缘场景上 , AI芯片也出现加速势头 。 目前 , 由于自动驾驶算法仍在快速更迭和进化 , 大多自动驾驶芯片使用 GPU+FPGA 的解决方案 。 最典型的产品如英伟达的DRIVE PX系列及后续的Xavier、Pegasus系列等 。 在去年 CES上 , 英伟达推出了全球首款商用L2+自动驾驶系统NVIDIA DRIVE AutoPilot 。 DRIVE AutoPilot的核心就是Xavier系统级芯片 , 其处理器算力高达每秒30万亿次 。