框架|百度要为中国AI的黄金十年搭好桥造好路( 二 )


百度文心能够实现跨语言、跨模态的学习,让百度大脑更好地支持各种AI应用,满足各种场景需求。百度的知识增强跨语言大模型ERNIE-M可同时从多种语言中学习,提升跨语言理解能力;知识增强跨模态理解大模型ERNIE-ViL在视觉常识推理任务榜单获得第一名;知识增强跨模态生成大模型ERNIE-ViLG实现文图双向生成,是全球规模最大中文跨模态生成模型。
在百度Create 2021大会上,百度首席技术官王海峰便现场展示了百度的知识增强大模型的跨模态理解与生成能力,王海峰在现场说了一句:“百度大脑,我们一起创作一幅水墨画吧。这边是连绵的山脉,山上云雾缭绕,山脚下有一座草堂建在江边,江上有 一条船,一个人站在船头;然后这边有一行飞鸟掠过天空。”百度大脑即刻便将王海峰语言文字的描述转换为一幅颇有意境的中国画来展现。

框架|百度要为中国AI的黄金十年搭好桥造好路
文章插图
在知识增强大模型的支撑下,百度大脑更好地支持金融、医疗、保险、证券、办公、互联网、物流等各种AI应用,满足各种场景需求。
降低AI使用门槛,在AI时代打造自主的底层系统
百度知识增强大模型等技术能加速创新的背后,离不开国产自主的AI深度学习平台飞桨和强大算力底座在背后的支撑。
计算机编程的产品是“程序”,深度学习研究的产品是“模型”,深度学习平台及其背后的深度学习框架,就如同不同品牌的积木,积木的各个组件相当于不同的模型或算法的一部分,开发者可以根据自己的不同需求选择各深度学习框架来进行产品模型的研发。
用一个不算准确的比喻来简单说明,深度学习框架在AI领域的重要程度,可能相当于PC时代的操作系统。虽然不同的深度学习框架、不同的“操作系统”都能实现某一深度学习目标,但在人工智能时代提前做好AI的底层操作系统——深度学习框架,对我国在芯片、光刻机、手机电脑的操作系统等方面遭人“卡脖子”的当下异常重要。
深度学习和国有自主的深度学习框架也是推动人工智能进入工业大生产阶段的关键。早在2017年国务院就印发了《新一代人工智能发展框架》,明确提出在2030年中国要成为世界主要人工智能创新中心。面向技术和产业发展需求的AI大生产平台可以让AI技术以标准化、自动化和模块化的方式输出给千行百业,实现规模化应用,同时以平台为基础促进融合创新、共同发展。也因此,中国更需要本土的AI创新基础来为庞大的中国AI产业与开发集群服务。
其实深度学习框架本身的搭建并不算难,很多研究人员或公司都会自己搭建一个深度学习平台,但要想搭建一个通用性广的深度学习框架却是一件不容易的事。好的深度学习框架源于产业实践,一个深度学习框架只有参与过千行百业的AI模型部署实践,见过无数种千奇百怪的硬件组合,最后能使用于各种情况能搭配各类方案,像USB插口一般“即插即用”,使得让模型上线工作事半功倍,才能叫“产业级”的深度学习框架。
能做到这一点的深度学习框架并不多,如今全世界最为流行的深度学习框架有PaddlePaddle、Tensorflow、PyTorch、Caffe、Theano、MXNet、Torch等,前三者号称三大主流框架。其中PaddlePaddle飞桨便是百度自主研发的国内首个开源开放的产业级深度学习平台。
面向开发、训练和推理部署的全流程,飞桨提供了一整套降低门槛的技术和服务。在开发阶段,飞桨在业内率先实现了“动静统一”的核心框架,兼顾科研开发的灵活和产业开发的高效。飞桨提供丰富的API,支持开发者便捷、高效地开发深度学习模型。飞桨推出的系列科学计算API,支持量子计算、生命科学、计算流体力学、分子动力学等应用,助力中国科研实力的提升。
框架|百度要为中国AI的黄金十年搭好桥造好路】在训练阶段,飞桨发布了自适应大规模分布式训练技术,针对模型特点和硬件特点,搜索最优的机器组合和模型切分策略,并采用异步流水运行机制,以及高通信和高并发的方式,使大模型训练效率达到最优。百度文心知识增强大模型,正是基于这一核心技术训练的。
在推理和部署阶段,飞桨打造了推理部署工具链,使得高速推理引擎的多端多平台部署更加便捷。飞桨提供的模型压缩等辅助工具,将大模型参数规模压缩至1/1000,得到满足产业实际应用需求的小模型,帮助开发者加速业务落地。
如今,百度飞桨通过技术开源、零门槛开发等不断降低AI技术的应用门槛,让开发者甚至无须从第一行算法代码写起,就能进行技术创新和业务拓展,让工程师可以更专注于应用本身的开发,加速AI创新应用落地。