英伟达A100 GPU推理性能最高达CPU的237倍!临界点到来?
雷锋网消息 , MLPerf组织今天发布最新的推理基准测试(Benchmark)MLPerf Inference v0.7结果 , 总共有23个组织提交了结果 , 相比上一个版本(MLPerf Inference v0.5)的12个提交者增加了近一倍 。
文章插图
结果显示 , 今年5月英伟达(Nvidia)发布的安培(Ampere)架构A100 Tensor Core GPU在云端推理的基准测试性能是最先进英特尔CPU的237倍 。
文章插图
MLPerf Inference V0.7部分结果截图
最新的AI推理测试结果意味着英伟达未来可能在AI推理和训练市场都占据领导地位 , 给云端AI推理市场拥有优势的英特尔带来更大压力的同时 , 也将让其他追赶者面临更大挑战 。
MLPerf推理基准测试进一步完善的价值
与2019年的MLPerf Inference v0.5版本相比 , 最新的0.7版本将测试从AI研究的核心视觉和语言的5项测试 , 扩展了到了包括推荐系统、自然语言理解、语音识别和医疗影像应用的6项测试 , 并且有分别针对云端和终端推理的测试 , 还加入了手机和笔记本电脑的结果 。 扩展的测试项从MLPerf和业界两个角度都有积极意义 。
文章插图
MLPerf Inference v0.5测试项
文章插图
MLPerf Inference v0.7数据中心测试项
文章插图
MLPerf Inference v0.7边缘端测试项
任何一个基准测试都需要给业界具有参考价值的指标 。 MLPerf基准测试是在业界缺乏对AI芯片公认的评价标准的2018年诞生 , 因此 , MLPerf组织既需要给出各方都认可的成绩 , 还需要根据AI行业的发展完善评价标准 。
不过 , AI行业发展迅速 , AI模型的参数越来越多 , 应用的场景也越来越广泛 。 评价AI芯片和系统的推理性能需要涵盖可编程性、延迟、准确性、模型大小、吞吐量、能效等指标 , 也需要选择更具指导价值的模型和应用 。
此次增加的推荐系统测试对于互联网公司意义重大 。 在王喆的《深度学习推荐系统》一书中提到 , 2019年天猫“双11”的成交额是2684亿元 , 假设推荐系统进行了优化 , 整体的转化率提高1% , 那么增加的成交额大约为26.84亿元 。
另外 , MLPerf Inference v0.7中增加医疗影像3D U-Net模型测试与新冠大流行以及AI在医疗行业的重要性与日俱增密切相关 , 比如一家初创公司使用AI简化了超声心电图的采集工作 , 在新冠大流行初期发挥了作用 。
基准测试从v0.5到v0.7 , 能够为要选用AI芯片和系统的公司提供更直观和有价值的参考是MLPerf基准测试的价值所在 , 比如 , 帮助金融结构的会话式AI更快速回答客户问题 , 帮助零售商使用AI保证货架库存充足 。
与此同时 , 这也将促进MLPerf组织在业界的受认可程度 , 从接近翻倍的提交成绩的组织就能看出来 。
GPU云端推理性能最高是CPU的237倍
过去几年 , 云端AI训练市场英伟达拥有绝对优势 , 云端AI推理市场被英特尔赚取了大部分利润是事实 。 这让不少人都产生了GPU更适合训练而CPU更适合推理的认知 , 但MLPerf最新的推理测试结果可能会改变这一观点 。
MLPerf Inference V0.7的测试结果显示 , 在数据中心OFFLINE(离线)测试模式下 , 赛灵思U250和英特尔Cooper Lake在各个测试模型下与英伟达T4的差距不大 , 但A100对比CPU、FPGA和自家的T4就有明显的性能差距 。
文章插图
在SERVER模式下的推荐系统DLRM模型下 , A100 GPU对比英特尔Cooper Lake有最高237倍的性能差距 , 在其他模型下也有比较显著的差距 。 值得注意的是 , 英特尔的Cooper Lake系统的状态还是预览 , 其余三款芯片的系统都已经可用 。
文章插图
A100 GPU的优势也在边缘推理中也十分明显 。 在单数据流(Singel-Stream)测试中 , A100对比英伟达T4和面向边缘终端的英伟达Jetson AGX Xavier有几倍到十几倍的性能优势 。 在多数据流(Multi-Stream)测试中 , A100对比另外两款自家产品在不同AI模型中有几倍到二十多倍的性能优势 。
文章插图
在边缘OFFLINE模式下 , A100对比T4和Jetson AGX Xavier也有几倍到二十多倍的性能优势 。
- QuestMobile|QuestMobile:百度智能小程序月人均使用个数达9.6个
- 表达|重磅!2021世界安防博览会官方宣贯会正式召开,百余家企业表达参展意愿
- 星期一|亚马逊:黑五与网络星期一期间 第三方卖家销售额达到48亿美元
- 董事|运达科技:独立董事对相关事项的事前认可意见
- 缺点|骁龙865+12GB已降至2399,X轴马达+55W快充,缺点只有一个
- 纳闷|英媒纳闷:安道尔这个国家微信用户高达2000万,可只有8.5万人!
- 东南亚某国|海能达签订金额900万美元TETRA设备销售合同
- 中国|中国软件国际与深圳市政府达成战略合作协议 助力打造“创新之都“
- 卸任|今年以来刘强东卸任公司职务累计达 230 个
- 输送|新时达:“用于机器人码垛的输送系统”获发明专利