「罗超频道」旷世的深度学习框架天元距离前辈们有多远?

3月25日 , 旷视宣布开源新一代AI生产力平台Brain++的核心深度学习框架旷视天元(MegEngine) , 其前身是旷视内部自用的算法训练推理引擎MegEngine , 由旷视3名实习生在2013年启动研发 , 于2014年正式完成上线 , 支撑旷视6年以来在国际AI竞赛的表现 , 以及公司产品和业务的落地 , 目前服务于旷视研究院1400余名AI开发者 。
「罗超频道」旷世的深度学习框架天元距离前辈们有多远?
文章图片
Brain++是旷视自主研发的端到端人工智能算法平台 , 具备大规模算法研发能力 。 针对框架、算力和数据三个核心要素 , 旷视Brain++在总体架构上分为三部分 , 包括深度学习框架MegEngine、深度学习云计算平台MegCompute、以及数据管理平台MegData , 天元是旷视Brain++最核心的组件 。
有媒体报道称旷视天元(MegEngine)“重新定义AI基础设施” , 因为“国产自主可控的深度学习框架 , 将是中国打造数字基建中AI核心能力的底座 , 释放更多生产力 。 ”那么 , 作为后来者的天元(MegEngine) , 真的可以赶上谷歌Tensorflow和百度PaddlePaddle等先行者吗?
技术层面 , 已经达到世界领先吗?深度学习框架不是什么新鲜事物 。 所谓深度学习框架 , 相当于是AI操作系统 , 有了这个框架 , 机器视觉、语音和知识图谱等AI技术都可基于框架研发 , 避免后来者重复造轮子 。 早在2010年AI方兴未艾时 , 深度学习框架就已开始火热 , 谷歌和Facebook是先行者 , 2015年开源的谷歌Tensorflow流行于工业界 , 拥有业界最完善的工具链和生态;FacebookPytorch则以易用性著称 , 在科研界有较高占有率 。 在两者外 , 还有Amazon、微软、百度等科技巨头拥有自主深度学习框架 。 如今 , 深度学习框架在AI领域已经是基础设施 。
「罗超频道」旷世的深度学习框架天元距离前辈们有多远?
文章图片
科技巨头的深度学习框架的研发与开源的启动时间均比MegEngine早多年 , MegEngine公布的资料显示 , 其在自动求导、预训练模型、训练速度、部署效率、异构设备支持等深度学习框架的关键能力上 , 与发展多年的Tensorflow全都在一个级别 , 在一些维度比FacebookPytorch、百度PaddlePaddle等均表现更好 , 从技术实现来看这样的可能性不大 。 深度学习框架本质是将很多底层基础代码抽离出来 , 需要日积月累的研发 , 后来者除非有数倍于先行者的人力与研发资源投入 , 才有可能赶上 。 MegEngine虽然源自于独角兽旷视 , 但其研发资源显然不如世界级科技巨头充沛 。
深度学习框架的模型支持十分重要 , 模型意味着框架适应不同场景下AI实现的能力 , 比如机器视觉、语音识别等不同场景 , 而MegEngine目前自有模型跟先行者比少且缺乏亮点 , 只有少数几个视觉模型 , 或许正是因为自有模型数量相对较少 , MegEngine宣称“为了解决模型复现困难的问题 , 天元支持PyTorchModule导入 , 可针对计算机视觉任务进行优化 。 ”从MegEngine公布的路线图来看 , Beta版本的推出尚在6月份 , 不论是异构设备支持还是部署能力都还有待观察 。
「罗超频道」旷世的深度学习框架天元距离前辈们有多远?
文章图片
自主层面 , 真的是国产之光吗?有媒体报道称 , “旷视的加入 , 让国产自主深度学习框架再添一员 , 使中国的人工智能开发工具可以在国际上与谷歌的TensorFlow、Facebook的PyTorch对垒 , 相比国外的框架和平台 , 诞生于中国应用场景的深度学习框架与中国产业转型更适配 , 有望让更多中国的企业更快捷的获得AI研发能力 。 ”看上去 , 似乎想把旷视MegEngine打造成国产之光 。
如果了解过中国深度学习框架的发展 , 可能会有不同看法 。 AI产业化时代 , 我国已经将AI上升为国家科技战略 , 作为AI基础设施的深度学习框架确实具有战略价值 , 特别是在技术自主的大趋势下 。 正是因为此 , 作为AI技术领先者的百度 , 在2013年就已成立深度学习实验室 , 研发深度学习框架PaddlePaddle , 百度的语音技术、自然语言处理技术、计算机视觉技术等等 , 均是基于PaddlePaddle研发 。