和讯名家|华为「硬」生生把AI搞出暴力美学

金磊发自凹非寺
量子位报道|公众号QbitAI
「华为速度」 , 在AI计算领域到底该如何评价?
一言以蔽之:暴力美学 。
和讯名家|华为「硬」生生把AI搞出暴力美学
文章图片
而且这种速度 , 由浅及深地拆分来看 , 可以分为两层 。
首先 , 是物理意义上的超高速度 。
这种能力在刚刚结束的第十六届全国高性能计算学术年会(CCFHPCChina2020) , 最能直接展现 。
在这场全球范围内、高性能计算领域最具影响力的三大顶会之一上 , 华为Atlas900凭借其超强的AI算力 , 打破自己创下的纪录 , 在ResNet-50上的跑分仅需28秒 。
其次 , 是更深层次的华为AI速度 。
从2018年华为全联接大会(HC)首次对外宣布AI战略开始 , 仅仅2年时间 , 便在技术、产业、人才和生态各方面 , 展露出了「领军姿态」 。
现在 , 是时候完整揭秘一下华为AI的暴力美学了 。
Atlas900速度如何问鼎业界第一?
Atlas900 , 从去年9月诞生开始 , 便打上了「世界最快AI产品」的标签 。
训练ResNet-50只需要59.8秒 , 比当时排名第二的选手快出了15%之多 。
而时隔短短一年 , Atlas900超越自己 , 再次创造了世界纪录 。
在HPC大会上 , 华为昇腾计算业务CTO周斌介绍道:
Atlas900凭借其超强的AI算力 , 使得ResNet-50的训练时间仅需28秒!相比去年59.8秒的测试成绩缩短一半以上 , 体现了Atlas900软硬件协同优化的持续演进能力 。
和讯名家|华为「硬」生生把AI搞出暴力美学
文章图片
△华为昇腾计算业务CTO周斌
据介绍 , 集群芯片数量仅为1024颗昇腾910芯片 , 而其它同类产品在芯片数量方面都要比Atlas要多 , 甚至达到了2倍 。
并且 , 从单芯片算力来看 , 昇腾910能够达到320TFLOPS的超高算力 。
在算力飞速迭代、发展的今天 , Atlas900能够保持业界第一 , 离不开其背后的一套「杀手锏」 。
这套「杀手锏」就是华为AI计算中心解决方案 。
和讯名家|华为「硬」生生把AI搞出暴力美学
文章图片
多样性算力方面 , 通过统一APIAscendCL+接口 , 支持GPU和NPU资源统一调度和管理 。
除此之外 , 还提供端边云协同、统一运维、全栈服务等能力 , 这就使得Atlas900在全球范围内具备竞争力 。
而这 , 就是华为在硬件方面的暴力速度 。
但在拥有了这样的速度之后 , 用来做什么 , 也是一个值得思考的问题 。
华为AI发力HPC , Why?
此次大会中 , 华为昇腾计算业务CTO周斌的一番演讲 , 道出了问题的答案 。
「我们处在爆炸式创新前夜」 , 这是周斌首先抛出来的一个观点 。
以数据量为例 , 从今年的44ZB , 预计到2025年 , 便会增长到180ZB;智能互联网设备将从340亿增长到1500亿;计算中心AI的工作量将从现在的小于10% , 增长到80%……
虽然高性能计算(HPC)在处理海量数据(603138,股吧)问题时 , 能够带来一定的优势 , 但面对如此爆炸性增长 , 还是远远不够 。
和讯名家|华为「硬」生生把AI搞出暴力美学
文章图片
新增的大量数据、接入设备 , 对计算带来了空前的挑战 。
对此 , 周斌在现场抛出了他的观察:
AI和HPC的融合 , 是未来发展的一大趋势 。
AI改变传统HPC计算的求解方法 。
例如 , 2018年入围「GordonBell」决赛的6个应用中 , 有半数用AI+HPC融合的应用示范 。
再者 , 在高性能计算领域著名榜单Top500中 , 近30%系统拥有加速卡/协处理器 。 换言之 , 越来越多的系统配有大量低精度算术逻辑单元 , 用来支撑人工智能计算能力需求 。