[人工智能]AI 很棒,落地很难,所以旷视今天开了一个新思路


我没想做谷歌 。
围棋棋盘正中的黑点称为「天元」 , 也是旷视新发布的开源深度学习框架的名字 。 「天元」一方面致敬 AlphaGo 战胜李世石 , 另一方面也表明了其重要的战略意义 。
深度学习开源框架提供可复用的基础函数和功能 , 是人工智能技术得以走向产业的关键因素 , 避免重复造轮子 。 3 月 , 在疫情的刺激下 , 国家又提新基建 , 各地政策加速出台 。 在这场关于数字化基础建设的运动中 , 底层技术的建设是基础中的基础 。 旷视官方表示 , 这是其此次选择在这个时机发布开源框架的原因之一 。
和天元一同发布的 , 是旷视 Brain++生产力平台 , 它包括天元框架 , 同时也包括云计算平台和数据管理平台 。 旷视称其为算法、算力、数据能力三位一体的架构 , 目的是为使用者提供一站式解决方案 , 更进一步地让深度学习更易使用 。
当前世界范围内主流的开源框架大多由巨头掌握 , 且已经拥有较为成熟的生态基础 。 与巨头相比 , 旷视虽为国内计算机视觉行业的四小龙之一 , 但在可投入的精力和财力上还是会有一定差距 。
作为国内唯一一家发布开源框架的纯人工智能公司 , 旷视将其核心能力对外输出 , 这一动作的背后或许有更为长远的考量 。
一场与马太效应的赛跑 Google TensorFlow 是世界范围内第一款由巨头开源的主流框架 , 至今约有四年半的时间 。 其间多个框架层出不穷 , 比如贾扬清的 Caffe、被亚马逊选为官方深度学习框架的 MXNet、Facebook 的 PyTorch、微软 CNTK 等 。
国内最为大家所熟知的深度学习框架该属百度的 PaddlePaddle , 另外阿里开源了 XDL , 华为开源了 MindSpore 。 就在不久前 , 清华大学也开源了其深度学习框架 Jittor , 中文名计图 。
放眼望去 , 市面上并不缺开源的深度学习框架可用 , 且四年半时间过去 , 使用者愈发集中到两个头部框架的开源生态中——TensorFlow 和 PyTorch , 它们分别占据了易部署和可调试的两端 。 在学术界 , 研究人员正在从 TensorFlow 转向 PyTorch , 然而在工业界 , TensorFlow 的地位正越来越稳固 。
在多款开源框架中 , 开发者向头部靠拢 , 呈现出非常明显的马太效应 。 这其中的原因在于 , 开源框架并非代码本身 , 而是由学术界、工业界以及芯片厂商共同构建的技术生态 。
一款开源框架走向主流 , 需要经过三个阶段:学术界认可 , 研究人员使用该框架做实验;工业界认可 , 开发者们使用该框架构建产品;最后在学术界和工业界的共同推动下 , 芯片厂商认可 , 在其新品中提供对该框架的支持 。
这三个阶段呈现一种滚雪球的现象 , 形成一种引力 , 最终带来框架领域的马太效应 。 并且框架作为 AI 产品的基础 , 除非使用团队有强烈的理由和意愿 , 否则不会轻易迁移 。 这也为头部框架带来了时间壁垒 。
要让这个雪球滚起来 , 需要不小的投入 , 这也是为什么主流框架都由大公司或大组织运营的原因 。 框架开源是一码事 , 做成又是另一码事 。 社区需要人力维护 , 科研刷榜需要协调产业界和学术界的硬件资源 。 让框架更加普世通用 , 需要进行相应的研发调整 。
产业AI落地不易 旷视表示 , 发布开源框架并非为了和主流框架竞争 , 而是希望更多开发者和公司有能力加入 AI 的网络 , 让生态共同繁荣 。
从 2016 年 AlphaGo 战胜李世石以来 , AI 从一个新兴技术的代名词变为行业的代名词 , 现在演变成一种能力的代名词 。 换句话说 , AI 已经从实验室走向 AI 公司 , 现在又走向产业 。 现如今 , 「AI 落地」代替「准确率」成为新热词 。
广袤的传统行业正等待被数字化、智能化改革 , 那里是 AI 公司们的战场 , 旷视的技术就应用于此 。 然而 , 现在 AI 的产业落地处在一个非常尴尬的时间阶段 , 其中充斥着几类矛盾 。