「罗超频道」旷世的深度学习框架天元距离前辈们有多远?( 二 )


作为百度AI“压箱底技术” , PaddlePadde在2016年就已开源 , 经过四年发展已经在行业中占据一席之地 , 且在中国的深度学习框架市场具有优势 , IDC在2019年6月发布的报告显示 , 在国内深度学习综合市场中 , 谷歌、Facebook、百度三家共占据超过一半的市场份额 , 谷歌TensorFlow占据着主要市场 , 百度飞桨(PaddlePaddle)占据第三 , 增长势头明显 。 2019年PaddlePaddle入围世界互联网大会“世界互联网界领先成果”时 , 已服务150多万开发者 , 广泛应用于工业、农业、服务业等 , 从工厂中的质量检测和安全管理 , 到田野里的农药控制和虫情监测 , 到商品数据分析、诊疗辅助决策 , PaddlePaddle成为各行各业技术创新、智能化升级的基础底座 。
在技术层面旷视天元(MegEngine)相对于百度PaddlePaddle而言并没有什么明显优势 , 一方面百度在AI技术上布局更早 , 投入力度更大 , 且不只是聚焦机器视觉技术 , 而是较为全面地覆盖了自然语言处理、知识图谱、语音识别等关键AI技术 , 在这一过程中百度在百度大脑、PaddlePaddle等底层AI技术上一直在战略投入 。 另一方面百度拥有搜索、小度、Apollo等核心应用场景 , 且通过百度智能云构建了一个AI产业生态 , 给PaddlePaddle的普及奠定了很好的基础 , 反过来锤炼了PaddlePaddle的技术能力 。 实际上 , 天元(MegEngine)提出的“动静合一”、“训练推理一体化”这样的亮点 , 也一直是PaddlePaddle的重要特点 。
【「罗超频道」旷世的深度学习框架天元距离前辈们有多远?】不可否认 , 深度学习框架就像自主芯片或者操作系统一样对我国科技产业具有重要战略意义 , 正是因为此 , 百度后 , 阿里、旷视、华为等玩家布局深度学习框架都值得鼓励 , 不过不管谁来做框架 , 都应该凭技术实力和开源社区服务来吸引开发者 。 深度学习框架开源后 , 产品好用与否 , 开发者一看代码或者在社区一交流就知道 。
生态层面 , 真的可以一蹴而就吗?今天开发者可选的深度学习框架越来越多 , 同时随着AI产业化加速AI研发越来越复杂 , 因此开发者对深度学习框架的要求越来越苛刻:要易用上手、要功能模板丰富、更性能强大 , 要部署方案全面 , 要有前沿技术支持 。 可以说深度学习框架的门槛越来越高 , 任何框架要实现这些都不能一蹴而就 , 唯有花时间、投资源打磨积累 , 一行行堆代码才能满足开发者需求 。 这跟手机芯片的发展很相似:我们看到很多手机公司都在做芯片 , 但真正做得好的只有苹果、华为这样的领先对手十年甚至更早布局的公司 , 当它们建立技术壁垒后 , 后来者即便是砸钱也已无法赶超 。
还有一点至关重要:任何开源技术的竞争核心都不只是技术本身 , 最终一定会落到开源社区生态上 。 开发者的支持 , 上下游产业链伙伴支持 , 都是开源深度学习框架普及的关键 。 这一点就像操作系统 , 当华为手机面临安卓断炊问题时 , 最大的挑战不是代码本身 , 虽然华为推出了鸿蒙系统 , 但应用生态却很难一朝一夕建立 , 正是因为此华为正在力推HMS 。 同样 , 任何深度学习框架开源都要花时间去培育开发者生态 , 去获取开发者与产业的支持 。
在开源社区生态上 , 具有科技巨头背景的框架具有显著优势:
1、巨头背景意味着更多的社区资源支持 , 它们的深度学习框架团队可以把握技术趋势快速转化成产品 , 可以给予开发者教育、文档、工具、社区等方面更加全面的支持 , 初创公司很难具备这样的资源投入能力 。
2、巨头背景意味着更多的场景支持 , 巨头一方面有海量自有场景 , 另一方面拥有繁荣的开放生态 , 本身就有大量的开发者 , 因此具有各种业务场景来对框架进行打磨锤炼 , 初创公司应用场景则相对单一 。
3、巨头背景对开发者来说意味着一种“保险” , 初创公司的开源平台意味着更大的不确定性 , 开发者未来可能会面临支持资源匮乏等问题 , 切换成本会很高 , 而巨头的框架则可以给予开发者更大的选择信心 。