谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨( 二 )


本文插图
天津飞腾信息技术有限公司副总经理张志群在论坛中演讲 。
国内首个开源开放的产业级深度学习平台——百度飞桨
飞桨是百度自主研发 , 国内首个开源开放、技术领先、功能完备的产业级深度学习平台 , 2016 年正式开源 。
在深度学习模型开发、训练、预测和部署等方面 , 飞桨已可比肩 TensorFlow、PyTorch 等国际主流框架 , 并在多项技术上有优于后者的表现 , 打破了国内的 AI 开发者过度依赖国外开源深度学习框架的局限 , 有助于进一步培育自主可控的 AI 产业生态 。
在论坛中 , 吴甜介绍说 , 飞桨目前有四个方面的领先技术:开发便捷的产业级核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎以及覆盖多领域的工业级模型库 。
最近 , 飞桨又迎来全新升级 。 从技术层面出发 , 此次更新可形容为「动静统一、软硬融合」 。 在硬件上 , 飞桨目前已适配 22 种芯片型号 , 覆盖 15 家硬件厂商 , 对国产硬件的支持超过 TensorFlow 和 PyTorch;软件上 , 动态图功能升级实现了动静态的结合 , 让用户更容易开发模型;全面升级的 API 体系 , 则对于开发者更加友好 。 目前 , 飞桨可以与华为等硬件进行深度配合 , 让 AI 应用收获更强劲的效果 , 加速人工智能技术的进一步普及 。
如今 , 飞桨已经应用到金融、工业、城市治理等多个领域 。
在金融风控领域 , 使用飞桨可以将信贷风险判断准确率提升 21% , 飞桨中的语义理解模型 ERNIE 通过学习大量的文本和知识实现了语义理解性能的大幅提升 。
在计算机视觉领域 , 飞桨已经开始助力工业质检 , 比如笔记本外壳检测、总装车灯检测 , 帮助工厂在大面积的产品或小部件中找出微小的瑕疵 。
在智慧城市中 , 飞桨可以应用于城市治理、施工车辆追踪 , 车辆违章监测等场景 。
飞桨的成功秘诀:开源
和 AI 领域的其他技术一样 , 飞桨的成功 , 自然也离不开开源 。
作为开源软件 , 飞桨一直在建设开源社区 。 目前 , 飞桨已经凝聚了 230 万开发者 , 创造了 31 万个模型 , 项目数量总体超过 4.7 万 , 并且有多个项目登顶各大榜单 。 飞桨推出的飞桨开发者 PPDE 计划也共建了开源社区 , 组建了 22 个飞桨地方社群 , 100 多个高校社群 。
开源给飞桨的开发所带来的益处良多 。
首先 , 开源的环境对平台的开发提出了更高的要求 。 开源以后 , 社区里的开发者非常多 , 工程师把代码亮出来以后 , 大家都能知道你是如何设计的 , 以及你的代码、文档有没有问题 。 这就对整个编程的易用性、API 的完备性提出了新的要求 , 这些要求以前在不做开源时不会考虑太多 。
其次 , 开源是帮助构建生态的良好方式 。 深度学习框架的上下游生态非常复杂 , 需要和芯片、计算机系统做对接 。 在飞桨开源的生态系统中 , 第三方生态贡献扮演了很重要的角色 。 在飞桨这个项目中 , 很多的开发不是百度工程师做的 , 还有其他人在基于这个做出新的项目和更多的贡献 。
在论坛中 , 王海峰表示 , 百度十年以前开始全面布局人工智能的时候 , 就是本着开源、开放的精神 。 早在 2012 年 , 百度就开放了翻译的 API 。 如今 , 百度翻译每天的翻译量已经达到了 1000 亿字符 。 2013 年 , 百度又开放了语音平台 , 现在每天的调用量超过 150 亿 。
2016 年 , 在开源飞桨的同时 , 百度也开放了百度大脑的很多 AI 能力 。 发展到今天 , 百度大脑每天的调用量超过 1 万亿 , 很多开发者都在使用这些工具推动自己的业务 。
与此同时 , 企业对于开源的拥抱程度也是在持续增加的 。
一方面 , 企业自身所开发的软件平台、工具正在进行越来越多的开源工作 , 有 95% 的受访者认为企业开源是至关重要的 。 另一方面 , 企业在使用开源软件的时候 , 预期也在一直在发生变化 , 77% 的受访者表示他们希望增加对企业开源软件的使用 。 这些都说明 , 开源社区是在持续发展的 , 这反过来又会促进飞桨等开源平台的发展 。