空枝|打破16项AI性能记录!英伟达A100 GPU要无人能敌?
雷锋网消息 , 2020年7月30日 , MLPerf组织发布第三个版本MLPerf Training v0.7基准测试(Benchmark)结果 。 结果显示 , 英伟达基于今年5月最新发布的Ampere架构GPU A100 , 和HDR InfiniBand实现多个DGX A100 系统互联的庞大集群——DGX SuperPOD系统在性能上分别开创了八个全新里程碑 , 共打破16项纪录 。
打破MLPerf Training最新基准测试16项记录
MLPerf是2018年5月成立的行业基准测试组织 , 在AI备受关注的当下 , 获得了芯片巨头和AI芯片公司以及AI业界的广泛关注 。 为了能够让机器学习处理器的基准测试也像CPU那样 , MLPerf组织囊括了该行业中的所有知名企业和机构 , 比如英特尔、英伟达、Google、亚马逊、阿里巴巴和百度、微软、斯坦福大学等 。
巨头公司们乐于通过MLPerf的成绩证明其AI实力 , 平头哥在去年11月MLPerf首个版本基准测试成绩公布之后就强调其自主研发的AI芯片含光800在Resnet50基准测试中获得单芯片性能第一 。
作为AI的领军者 , 英伟达自然也不会错过MLPerf的基准测试 。 2018年12月 , 英伟达首次在MLPerf训练基准测试中创下了六项纪录 , 次年7月英伟达再次创下八项纪录 。 在最新MLPerf Training v0.7基准测试中 , 有两项新的测试和一项经大幅修订的测试 。
【空枝|打破16项AI性能记录!英伟达A100 GPU要无人能敌?】其中一项基准测试对推荐系统的性能进行了排名 , 推荐系统是日益普及的一项AI任务 。 另一项基准测试对使用BERT的对话式AI进行了测试 , BERT是现有最复杂的神经网络模型之一 。 还有 , 强化学习测试中使用了Mini-go和全尺寸19x19 围棋棋盘 , 该测试是本轮最复杂的测试 , 内容涵盖从游戏到训练的多项操作 。
特别值得一提的是 , 英伟达是唯一一家在MLPerf Training v0.7测试中均采用市售商用产品的公司 。 其他大多数提交使用的要么是预览类别(preview category) , 其所用的产品预计需要几个月后才会面市 , 使用研究类别的产品 , 更是较长一段时间内都不会面市 。
另外 , 在此次提交结果的九家公司中 , 除英伟达外 , 还有六家公司多家生态系统合作伙伴也提交了基于英伟达GPU的MLPerf测试结果 。 包括三家云服务提供商(阿里云、谷歌云和腾讯云)和三家服务器制造商(戴尔、富士通和浪潮) 。
18个月内实现AI性能4倍提升
创造纪录的英伟达DGX SuperPOD系统是基于Ampere架构以及Volta架构 。 雷锋网此前报道 , 5月份发布的最近Ampere架构GPU A100基于台积电7nm工艺 , 面积高达826平方毫米 , 集成了540亿个晶体管 。 相比Volta架构实现了高达20倍的性能提升 , 并且可以同时满足AI训练和推理的需求 。
A100对比V100
由8个安培A100 GPU打造的NVIDIA DGX A100 AI系统单节点性能达到了创纪录的5 petaflops 。
此次 , 英伟达在Selene上运行了系统的MLPerf测试 , Selene是基于DGX SuperPOD的内部集群 。 DGX SuperPOD是针对大规模GPU集群的公共参考架构 , 可在数周内完成部署 。
根据测试结果 , 相较于首轮MLPerf训练测试中使用的基于V100 GPU的系统 , 如今的DGX A100系统能够以相同的吞吐率 , 在18个月内实现了4倍的性能提升 。
- 北京商报 “亦庄智慧”打破几何与三维技术应用瓶颈
- OMG战队|IG2:0OMG TS卢锡安打破质疑一脸淡定 Puff与宝蓝默契惊人TS却扎心
- 路人战队|打破SCI与“影响因子”的神话
- 空枝|后电商时代,商家以什么取胜?品道认为认清其本质是关键
- 跟着地铁圆太原安家梦|房价刚性打破,房子也有靠不住那一天!
- 空枝|两个月吃透阿里P9推荐260页SpringBoot2企业应用实战pdf入职定P6+
- 鲜闻说|唐嫣产后首次亮相,打破双胞胎传闻,完全看不出刚生完孩子的孕妈
- 宁夏|宁夏开展严打破坏生态环境及野生动物资源违法犯罪专项行动
- 因莫比莱|30岁神锋获生涯首个欧洲金靴,打破梅罗11年统治,再进2球创历史
- 乐乐足球|打破梅罗11年统治,再进2球创历史,30岁神锋获生涯首个欧洲金靴