算力|Meta首台AI超算出炉!1.6万块英伟达GPU加持,算力暴涨20倍


算力|Meta首台AI超算出炉!1.6万块英伟达GPU加持,算力暴涨20倍
文章插图
智东西(公众号:zhidxcom)
编译 | 赵迪
编辑 | 云鹏
智东西1月25日消息,据外媒报道,今日,Meta宣布建成一款新的AI超级计算机,名为“AI Research SuperCluster”,简称“RSC” ,目前第一阶段的RSC已建成,Meta表示其计算性能可提升20倍,但未说明其比较对象,Meta称,到第二阶段的RSC完成时,它将会是世界范围内速度最快的AI超级计算机。
AI超级计算机能在短时间内处理庞大数据集,训练更快、更好的AI模型,为Meta构建全新的AI系统。而沉浸式元宇宙在物理计算、图像渲染等方面对算力的需求庞大,高性能AI超级计算机的建设或能助力Meta进一步提升用户的元宇宙体验。
相较一般的超级计算机,AI超级计算机在高精确度上稍有欠缺,但对于AI模型训练来说,AI超级计算机能在不影响最终结果的情况下大幅度提高计算速度,优化AI模型的效率更高。
一、RSC问世,计算速度世界第五,Meta称其性能提升20倍今日,Meta宣称建造成一台AI超级计算机,这是一台专门为训练机器学习系统而设计的高速计算机,全称为“AI Research SuperCluster”,简写为“RSC”。该公司表示,目前RSC在世界上最快的超级计算机中排名第五,到2022年年中完工时,RSC将成为世界上最快的AI超级计算机。
约一年半以前,Meta开始了RSC的开发工作,Meta的工程师从头开始设计了RSC的各个系统,包括冷却系统、电力系统、网络系统和电缆系统等等。目前,第一阶段的RSC已经建造完成,它由760个英伟达DGX A100系统组成,配备了6080个GPU。Meta表示,在一般的计算机视觉研究任务里,RSC的性能表现已经提高了20倍,不过Meta未公布与RSC性能表现进行比较的实验对象。到2022年中,Meta将完成第二阶段的RSC开发工作。届时,RSC将配备约16000块GPU,能够在10亿字节的数据集上使用超过1万亿参数来训练人工智能系统,这一数据集的数据量相当于36000年的高质量视频。

算力|Meta首台AI超算出炉!1.6万块英伟达GPU加持,算力暴涨20倍
文章插图
RSC结构示意图
算力|Meta首台AI超算出炉!1.6万块英伟达GPU加持,算力暴涨20倍】此外,Meta的竞争对手——微软和英伟达等也已经宣布建成AI超级计算机,目前,微软的OpenAI研究实验室宣布其AI超级计算机配备了1万个GPU。这表明,人工智能在Meta这类公司中已经被视为研究的中心领域。
二、训练更优越的AI模型,提升元宇宙体验Meta表示,RSC将帮助Meta的AI研究员建立新的、更好的人工智能模型,提升Meta业务中的AI功能,比如检测Facebook和Instagram中不良信息的内容审核算法,未来还可能用于AR(增强现实)设备,提升用户在元宇宙中的体验。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)周一在Facebook上写道:“我们为用户提供的元宇宙体验需要计算机拥有强大的计算能力,支持数百种不同的语言,能够无缝分析文本、图像和视频,开发新的AR工具。”

算力|Meta首台AI超算出炉!1.6万块英伟达GPU加持,算力暴涨20倍
文章插图
“元宇宙”指的是共享虚拟环境的概念,人们可以通过不同的设备访问该环境,进行工作、娱乐和社交。沉浸式元宇宙的实现对物理计算、渲染、数据协调和同步、人工智能、动作捕捉和翻译等方面均有很高要求,为此,算力的提升就成为建设元宇宙的关键。AI超级计算机的出现为算力问题的解决提供了一个重要的突破口。
三、AI超级计算机准确度较低,但速度是第一要义AI超级计算机与通常人们认为的超级计算机不同。人们通常认为的超级计算机一般是由大学或政府主导建设的用于处理核物理、气候变化等复杂领域的大型计算机。AI超级计算机与之有相似之处,二者在尺寸和外观上都比单个计算机更接近数据中心,并依赖大量互连处理器以极快的速度交换数据。但二者也存在关键的区别。
由于机器学习对准确性的要求相对较低,在使用相同硬件的情况下,AI超级计算机的运算速度比传统的超级计算机更快。而浮点运算精度的区别决定了二者运算准确性的差异,一般的超级计算机采用IEEE (美国电气和电子工程师学会)规定的双精度 64 位浮点数的格式,而AI超级计算机通常采用单精度32位甚至16位浮点数的格式。虽然在精度上有所差别,但AI超级计算机在AI模型训练上效率更高,更适合企业应用。
结语:AI超级计算机提供算力基础,Meta联合英伟达出击元宇宙Meta的首台AI超级计算机为AI模型训练提供了强有力的运算基础,能够帮助Meta进一步发展AI相关业务,向元宇宙进军。预计2022年年中,Meta的AI超级计算机将配备约16000个GPU,比目前微软发布的AI超级计算机多出6000个。