学习|在“十四五”这个关键窗口,中国要怎么实现AI自主可控?

文 | 魏启扬
十九届五中全会公报提出 , 要“把科技自立自强作为国家发展的战略支撑 。 ”
公报更进一步强调了科技的自立自强 , 并明确提出到2035年关键核心技术要实现重大突破 。 这表明 , “十四五”期间 , 科技创新会被提升到一个更高的战略位置 , 以改变当前对美国技术依赖性强的被动局面 , 并成为拉动未来经济发展的重要力量 。
这也是公报首次将科技自立自强提高到国家战略的地位 , 这个变化给中国的创新力量们注入了一针强心剂 。 尤其是在过去的几年间 , 由于贸易保护主义与逆全球化抬头 , 众多领域都受到了来自外国产业链的掣肘 , 科技自立自强确实到了迫在眉睫的地步 。
必须承认 , 在PC时代与互联网时代 , 我们错失了关键的突围机会 , 那么 , 在世界公认的下一站AI时代里 , 我们必须掌握主动 , 拒绝“卡脖子” 。
被称为AI时代“操作系统”的深度学习框架的重要性被发掘了出来 。
作为自主可控核心技术诸多选项中的一个 , 深度学习在AI体系内的关键价值在于 , 它是AI向更深层次发展必经的技术壁垒 , 也是科技巨头转型角逐AI时代的核心内容 。
1
深度学习框架助燃新工业革命 , 自主可控是当务之急
深度学习到底有多重要?
我们先来看看人工智能的进化过程 , 从最开始的人工规则到机器学习 , 再到深度学习 , 非生物体有了思考和学习的方法路径 , 简单来说就是通过大量的数据“训练” , 然后做出决策和预测 。
深度学习框架则是对底层语言和重要算法模型进行封装 , 对于我们现实世界而言 , 其技术价值主要体现在通过专家经验的移植与复制 , 让机器进一步渠道低水平的重复劳动 , 从而提高整体效率 。
以上描述或许有些生涩 , 那么我们来看一个案例 。
河北工业大学教授刘晶两个月时间跑了一百多家钢铁厂 , 把老师傅们三十年时间积累的钢铁熔炼配料经验 , 在百度飞桨平台上用三秒就做出了最优配比AI模型 , 更厉害的是 , 这个模型每年可为钢铁企业节省10%的原材料 , 配料计算时间节省90% 。
将人类历史历次工业发展变革进行类比 , 深度学习框架实际上也提供了一个“标准化、自动化、模块化”的生产平台 , 只不过这个平台架构在虚拟的数字空间 , 生产的东西变成了“AI应用” 。
“得框架者得AI” , 巨头们开始在深度学习领域跑马圈地 , 靠的就是深度学习框架 。
Facebook推出了Caffe、PyTorch平台、Google推出了TensorFlow平台、百度推出了飞桨平台 , 亚马逊推出了MXNet平台……在目前大大小小几十种开源框架中 , Google 2015年开源的TensorFlow , 以及Facebook的PyTorch份额最大 , 几乎是当下使用最广的两个深度学习框架 。
根据IDC去年发布的《中国深度学习平台市场份额调研》显示 , 在AI技术使用方面 , 接受调研的企业和开发者中 , 86.2%选择使用开源深度学习框架 , 虽然Google、Facebook和百度占据了国内绝大部分市场份额 。
学习|在“十四五”这个关键窗口,中国要怎么实现AI自主可控?
图片
(IDC《中国深度学习平台市场份额调研》各家排名)
类似于操作系统和芯片 , 深度学习框架也具有赢家通吃的特征 。 一旦国外技术占据了上风 , 深度学习框架规则的制定也将具有排他性 , AI在深层领域的通用技术也将受到框架的规定和限制 。
虽然目前包括TensorFlow、PyTorch在内的深度学习框架都是开源的 , 但并不能排除哪一天停止开源 , 届时深度融入国外深度学习框架生态的中国公司将不得不面临研发停滞的局面 , 而切换新的深度学习框架 , 又要经历一段重新融入新生态的磨合 。
鉴于此 , 自主可控的深度学习框架对于中国来说 , 不但重要 , 而且必要 。
2
百度飞桨的自强之路 , 深度学习的“国货之光”分页标题
如果说中国有深度学习框架能和TensorFlow、PyTorch掰手腕 , 那应该是飞桨 。
作为中国首个开源开放、功能完备的深度学习平台 , 飞桨可以说凝聚了百度领先的人工智能技术 , 也是百度在AI赛道长期布局、开花结果的体现 。
1、技术沉淀深:率先起跑 , 一步领先步步先
“帮人做一件事”和“教人做一件事”在本质上是不同的 。
当我们用AI来解决问题时 , 如果将“帮人做一件事”比喻成AI应用 , 拿来即用 , 那么“教人做一件事”就是深度学习框架 , 告诉你如何来做一个可以用来解决问题的AI应用 。
很明显 , “教人做一件事”的路径更长 , 要求的能力更高 , 就像成为一名优秀的老师一样 , 需要长时间的积累和沉淀 , 才能完成能力的对外输出 。
飞桨的积淀来自于布局早 。
百度的深度学习历史可以追溯到2013年设立全球首个深度学习研究院 , 这个时间比大多数AI企业切入AI领域还要早 。
2016年飞桨正式开源 , 之后的2017年 , 百度又在国家发改委批复下牵头筹建了国内唯一的深度学习技术及应用国家工程实验室 。
起早布局的结果是百度形成了很难被追赶的深度学习积累 , 不论是率先开源还是筹建实验室 , 在国内都不存在对手 。 其他提供深度学习开发服务的AI企业 , 其发展阶段还远未到能够开源或被官方认可的程度 。
2、落地场景多:赋能百业 , 价值转化看得见
作为一项技术 , 其价值的大小与之落地对产业改变程度的多少是成比例的 , 这里有两个衡量维度 , 一是看赋能行业场景的多少 , 二是看每个落地场景效率提升的多少 。
飞桨作为深度学习框架“国货” , 推动产业应用是它的主力方向 , 迄今服务赋能涉及农林、医疗、工业制造、消费类电子、电力能源、交通、环保等多个领域 。
比如在林业管理中 , 红脂大小蠹是非常严重的害虫灾害 , 过去 , 林业管理系统需要通过人力监测来预报和治理虫情 , 现在 , 北京林业大学在百度飞桨支撑下研发的智能虫情监测系统 , 1小时可完成原本研究院一周的观察工作量 , 大大提升了灾害防治的效率;
又比如 , 飞桨携手国家电网和山东信通打造了电网智能巡检方案 , 其中分析准确率达到90% , 报警响应速度更是从小时级提升为秒级 , 再次证实了技术驱动的高效能力 。
【学习|在“十四五”这个关键窗口 , 中国要怎么实现AI自主可控?】再比如 , OPPO基于飞桨的大规模分布式训练技术研发的推荐系统 , 训练速度提升了8倍 , 模型扩大了20倍 , 推荐场景效果提升4%-5% , 内存节省90% , 为OPPO应用商店业务带来了巨大的价值转化 。
飞桨与华为达成合作 , 双方在硬件底层打通 , 可以为端侧AI提供强劲算力 , 这一点在输入法应用上体现得特别明显:性能提升25% , 内存节省22% , 功耗降低50% , 而且表现更加稳定 , 不会受到CPU的负载影响 。
学习|在“十四五”这个关键窗口,中国要怎么实现AI自主可控?
图片
(深度学习框架与硬件打通可以优化手机应用的使用体验)
飞桨所有的场景落地都是用可视化的数字让应用价值明明白白的被看见 , 这既是飞桨的能力 , 也是飞桨能够成为最受欢迎的中文深度学习框架的底气 。
3、易用易部署:开源开放 , 打造全产业生态
深度学习框架落地场景多说明它“好用” , 但若要完成大范围普及 , 深度学习框架还要做到“易用” , 在部署时也要尽可能简便 , 最好可以“开箱即用” 。
飞桨正是这样一个“宝藏”平台 , 对很多算法进行了完整封装 , 开发者只需要略微了解下源码原理 , 导入自己的数据就可以执行运行的命令 , 具备从开发到训练再到部署的全链条无死角的系统化能力 。
例如 , 在开发环节 , 飞桨已开源100多个经过真实业务场景验证的官方模型 , 涵盖视觉、NLP、推荐等AI核心技术领域 , 成为官方支持模型最多的深度学习平台 。 比如视频识别工具包 , 能为开发者解决视频理解、视频编辑、视频生成等一系列任务 , 可实现一键式的高效配置来做训练和预测;分页标题
在训练环节 , 飞桨在提升协同训练效率的通俗 , 还在大幅度放松训练所需求的软件、硬件、带宽环境 , 通俗理解就是在各种学习条件下都能“好好学习”;
在部署环节 , 飞桨的软硬一体能力起到了重要作用 , 有针对多硬件支持的底层加速库和推理引擎Paddle Mobile以及Paddle Serving等 , 打个比方就是 , 除了教会学生知识 , 还给他们快速适应环境、实践上手的能力 。
以上可以看到 , 飞桨在想方设法降低千行万业应用AI的门槛 , 让“用户”快速上手 , 实现生产力;让产业无缝进入AI时代 , 完成变革 。
3
成为产业的AI基座 , 中国技术自强的时代利器
在前三次产业革命中 , 中国都是被边缘化的看客 , 如今站在第四次产业革命的起点 , 我们显然不会错过这个“再次崛起”的机会 , 那么谁能承担起中国在AI时代的产业基座呢?
就目前来看 , 百度飞桨责无旁贷 。
特别是在“新基建”的风口之下 , 飞桨在获得发展机遇的同时也被寄予了更多的期望 , 中国技术自强的破局期望 。
平心而论 , 飞桨通过开放大规模深度学习模型训练技术 , 在训练规模和训练效率上(支持万亿级规模参数的模型训练)与TensorFlow和PyTorch不遑多让 , 特别是为了进一步降低人工智能的应用门槛 , 推出无需代码编写的人工智能建模工具EasyDL , 使用者通过页面拖拽操作和少量数据上传即可创造出定制化的人工智能模型 , 以此来平衡专业人才与AI需求之间的矛盾 。
百度飞桨技术领先、功能完备、便捷易用的特性 , 使其成为中国技术自强的代表 , 将视野放得更高一些 , 飞桨还将成为中国破局深度学习框架自主可控的一柄利器 。
在不久前的百度世界2020大会上 , 飞桨又迎来再次进化 。
作为百度大脑“软硬一体AI大生产平台”的“软”的层面 , 飞桨动态图功能升级实现了动静态的结合 , 让用户更容易开发模型;全面升级的API体系 , 则对于开发者更加友好 。 同时在硬件上适配22种芯片型号 , 覆盖15家硬件厂商 , 对国产硬件的支持超过TensorFlow和PyTorch 。
学习|在“十四五”这个关键窗口,中国要怎么实现AI自主可控?
图片
(飞桨深度学习平台在百度世界2020大会上发布更新)
此外 , 在“硬”的层面 , 此次大会百度自研的AI芯片百度昆仑2预发布 , 相比2018年发布的中国首款云端通用AI处理器“百度昆仑1” , 百度昆仑2的性能大幅提升 , 能够更好地满足各种场景的AI计算需求 。 百度飞桨 , 加上百度昆仑 , 软硬一体 , 使得中国在AI操作系统和AI芯片两大AI核心底层技术上拥有了自主知识产权 。
百度创始人、董事长兼CEO李彦宏也在百度世界2020上表示 , AI技术研发需要长期坚持 , 因为它的商业价值不可能在短短几年之内就体现出来 , 需要科技人员有雄心、有耐心、耐得住寂寞 , 而且要有坚定的信仰 , 相信自己一定要掌握这门技术 。 “‘没有一种坚持会被辜负’ , 我们坚信 , 只要坚持下去 , 一定会获得相应的成果 。 ”
操作系统上 , 我们错过了;芯片 , 我们也错过了 。
深度学习框架还没掉队 , 我们要挺住 。
*本文图片均来源于网络   本文首发于微信公众号:智能相对论 。 文章内容属作者个人观点 , 不代表和讯网立场 。 投资者据此操作 , 风险请自担 。
(责任编辑:王治强 HF013)