深度学习不懂AI的我,是如何搞开发的?( 二 )


EasyDL的能力是如何实现的?
表面上看起来、用起来越是简单的工具、平台 , 那它背后的设计可能越是复杂 。
百度EasyDL也是如此 。
平台内部采用了诸多复杂的深度学习算法和工程技术 , 而这一切 , 都是为了保证其简单、易用、低门槛的使用效果 。
EasyDL之所以能够在模型方面达到高精度 , 一个重要原因是其基于百度自主研发的深度学习平台飞桨 。 一站式模型训练和服务体验 , 则融入了更多百度长期积累的独有技术和工程化能力 。
深度学习不懂AI的我,是如何搞开发的?
本文插图
首先 , EasyDL预置了百度超大规模数据训练的预训练模型 。
在视觉任务中 , 图像分类训练任务内置百度基于海量互联网数据 , 包括10万+分类、6500万图片等训练的超大规模视觉预训练模型 , 平均精度可提升3.24%-7.73% 。
在物体检测训练任务方面 , 内置百度基于800+标签、170万图片 , 1000万+检测框训练的超大规模物体检测预训练模型 , 平均精度可提升1.78%-4.53% 。
在自然语言处理方面 , EasyDL预置了由百度自研、业界效果最好的预训练模型文心(ERNIE) , 将机器语义理解水平提升到一个新的高度 。
EasyDL还提供了自动数据增强、自动超参搜索等AutoML/DL自动化建模机制 , 对零算法基础的用户降低AI使用门槛 。
而且基于飞桨DGC加速机制 , 通过只传送重要梯度(稀疏更新)的方式来减少通信带宽使用 , 从而让EasyDL提升了分布式训练效率 , 相比传统分布式训练方式 , 有70%以上的训练速度增益 。
其次 , 在数据处理方面 , EasyDL建设了EasyData智能数据服务平台 。
在数据标注和数据清洗 , EasyData提供了11种数据标注模板 , 5种标准、高级的清洗方案 。
EasyData还提供了软硬一体、端云协同的自动数据采集方案 , 可以在数据采集时 , 免除繁琐耗时的设备选型、调试和集成开发工作 。
最后 , 在部署部署方面 , EasyDL提供了公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案 。
其中 , 公有云API可以支持弹性扩缩容;设备端SDK目前EasyDL提供了端模型适配服务 , 支持了15+芯片类型 , 4大常用操作系统 。
而这些 , 正是EasyDL强大能力的背后硬实力 。
Why EasyDL?
因为有需求 , 这就是问题的答案 。
人工智能引领的第四次工业革命正不断地渗透到各行各业 , 大企业往往具备了一定的人才储备、技术积累 。
但相比之下 , 中小企业在智能转型的过程中 , 往往处于碰壁的状态 , 智能化门槛过高 , 包括高级开发人员成本、技术能力等等 。
而中小企业在整个国民经济的发展过程中 , 却起着举足轻重的作用 。
因此 , 解决这样的问题 , 便成为了一种「刚需」 。
也正是因为这样 , EasyDL一经开放 , 便得到了中小企业的广泛认可和支持 。
而在2年多的时间里 , EasyDL也一直在持续升级和打磨 , 使整体的产品体验和功能更加完善 。
这也是让EasyDL与其它AutoDL平台相比 , 具有较为突出的优势 , 能够获得更好的效果 。
不仅如此 , EasyDL的更新迭代还在继续 。
例如 , 今年升级的最大亮点 , 就是五月份全新发布了EasyData智能数据服务平台 。
专注在AI开发场景在业内开放了提供一站式的数据采集、数据清洗、数据标注、数据回流的完整解决方案 。
内置的超大规模预训练模型也是今年核心的技术亮点升级之一 , 为提供更高精度的训练效果 。
而就在刚刚过去的9月 , 我们看到EasyDL又进行了一轮大幅升级 。
在EasyDL经典版NLP方向新增了定制情感倾向分析、文本分类多标签、文本实体抽取;全新推出表格数据预测分析的ML方向 , 进一步丰富了模型类型 。