按关键词阅读:
文章插图
NVIDIA NeMo Megatron是Megatron的基础上发展起来的。Megatron是由NVIDIA研究人员主导的开源项目,研究大型Transformer语言模型的高效训练。Megatron 530B是全球最大的可定制语言模型。
利用先进的数据、张量和管道并行化技术,它能使大型语言模型的训练有效地分布在成千上万的GPU上。
企业可以通过NeMo Megatron框架,进一步训练它以服务新的领域和语言。经优化,该框架可以在NVIDIA DGX SuperPOD的大规模加速计算基础设施上进行扩展。
除了NeMo Megatron外,NVIDIA还推出了一个开发Physics-ML模型的框架NVIDIA Modulus。
它使用物理原理及源自原理型物理和观测结果的数据训练Physics-ML模型,支持多GPU多节点训练,由此生成的模型,其物理仿真速度比模拟快1000-100,000倍。
文章插图
科学家可借助Modulus创建数字孪生模型,来解决预测气候变化等重要科学问题。
例如研究人员利用欧洲中期天气预报中心的ERA5大气数据训练Physics-ML模型,该模型在128个A100 GPU上训练需要4小时,训练后的模型能以30公里的空间分辨率预测飓风严重程度和路径。
原本需要7天才能完成的预测,现在在一个GPU上只需0.25秒,比模拟快了10万倍。
为了帮助企业加快AI之旅,NVIDIA宣布在全球范围内扩展其LaunchPad计划,它允许用户即时访问在加速基础设施上运行的NVIDIA AI软件。企业可使用NVIDIA LaunchPad免费体验开发和部署大型语言模型。
LaunchPad计划由Equinix服务支持,包括数据中心、连接和裸金属产品,获得LaunchPad体验后,企业可以在全球Equinix地点运行其NVIDIA加速的人工智能工作负载。
三、Riva定制语音:快速创建定制版品牌声音NVIDIA的Riva语音AI软件同样有了新进展,黄仁勋宣布了该软件一个新功能——Riva定制语音。
文章插图
Riva可识别英语、西班牙语、德语、法语、日语、普通话和俄语等7种语言,可以生成隐藏字幕、翻译、摘要、回答问题并理解意图。
只需训练30分钟的音频数据,企业即可构建属于自己品牌大使的声音,获得类似人类的表现力。
也就是说,用户根据特定的领域或行业术语,可以量身定制拥有独特声音的虚拟助理。
文章插图
不到三年间,NVIDIA的对话AI软件已被下载超过25万次,并被广泛采用到各个行业。
对于小规模研发,NVIDIA NGC容器注册表免费提供NVIDIA Riva,开发者可加入Riva开放测试版程序来试用该软件。
对于拥有大规模部署并寻求NVIDIA专家技术支持的客户,NVIDIA宣布了NVIDIA Riva Enterprise计划,该计划预计将于明年初推出。
四、Omniverse Avatar:构建生动的智能虚拟化身虚拟助手的下一步,是拥有常识、推理能力和生动的视觉形象。
在GTC大会上,黄仁勋宣布推出一个全方位的虚拟化身平台——Omniverse Avatar。
文章插图
它是NVIDIA一系列先进AI技术的集大成者,将Metropolis的感知能力、Riva的语音识别能力、Merlin的推荐能力、Omniverse的动画渲染能力等交汇于一体。
这使得开发者能构建出一个完全交互式的虚拟化身,它足够生动,能对语音和面部提示做出反应,能理解多种语言,能给出智能的建议。
黄仁勋展示了一些例子。
比如,其玩偶复制品可以跟人对答如流。
文章插图
Metropolis工程师用Maxine创建了Tokkio智能操作台应用程序,让操作台具有高度交互性,可快速做出对话响应。
在餐厅,两名顾客点餐时,一个客户服务虚拟化身可以跟他们交谈和理解他们的需求。
文章插图
这些演示由NVIDIA AI软件和Megatron 530B提供支持,Megatron 530B是目前世界上最大的可定制语言模型。
在DRIVE Concierge AI平台的演示中,中央仪表板屏幕上的数字助理,可帮助司机选择最佳驾驶模式,使其按时到达目的地,然后在汽车续航里程下降到100英里以下时,按他的请求设置提醒。
文章插图
Maxine项目更强调多种语言的实时翻译和转录。
借助Maxine,这个人的话不仅被转录,还能以相同的声音和语调被实时转换成德语、法语等多种语言。
稿源:(智东西)
【傻大方】网址:http://www.shadafang.com/c/1110952Y62021.html
标题:老黄数字人登场!英伟达秀“元宇宙”肌肉,推巴掌大AI超算和虚拟人平台( 二 )