『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术( 四 )


『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
实现完全 AutoML , 要突破全能、快速找解两大难题
谈完大佬的经历 , 现在回归技术本身 。 吴承霖说 , 虽然 AutoML 技术的出现很大程度上简化了企业部署 AI 的难度 , 但在他眼里 , 目前业界做 AutoML 的技术生态并不是很完善 , 因为企业所做的 AutoDL 大多是 Semi(半自动)AutoML , 只关注 NAS、超参调整等领域 , 但工业界的同学都很清楚 , 深度学习的落地还要解决非常多的现实问题 , 只做 Semi-AutoML 是不太好用的 。 一句话概括 , 自动化机器学习的未来 , 在于完全自动化 。
除此之外 , AutoDL 在底层技术上的不完美也是清晰可见的 , 核心还是模拟人类的“全知全能”需要很大的工作量 。 吴承霖说 , AI 还无法真正自主发现新的模式 , 需要先“人为的”全知全能才能学习、演化 。
其次 , 现实世界的数据往往是ill-posed(不适定)的 , 问题极多 , 而解这些问题的方法成百上千 , 很难做出选择 , 类似的问题叠加起来 , 可能有着 10^200 次方的解空间 , 那么找出最优解的开销 , 可想而知有多大 。
吴承霖解释到 , 这里他所说的“全知全能” , 是指清楚人类 AI 工程师做的所有(或大部分)工作 , 就是全知;把人类 AI 工程师做的所有工作抽象为标准化部件 , 就是全能 。
要实现完全自动化机器学习 , 吴承霖认为还需要克服两大难点:
首先 , AutoDL 要全能 。 AI 落地是不能有短板的 , 有一块短板就可能带来 20%-30% 的准确率损耗 , Semi-AutoML 存在着明显的短板 。
其次 , 找解的速度要非常快 。 解的空间很大 , 如何在巨大的解空间中快速找到最优解 , 这是一个非常核心的问题 。
当前 , AutoDL 的技术生态已经相对较完善 , 随着 2018-2019 年 BERT 的逐渐优化 , 各个领域的自监督模型逐步发展 , 吴承霖认为这个领域的产业化进程会加快 。
在落地层面 , 深度赋智的 AutoDL 主要应用于电商场景 , 未来还将向新零售、金融、工业领域拓展 。 吴承霖告诉 CSDN ,AutoDL 在真正落地时 , 其实还是面临着很多难点与痛点 , 最重要的在于场景的转化上 , 很多客户的需求需要被理解、转化成 AI 可解的问题 , 这样才能更好地解决现实问题 。
『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
AutoML 路在何方?
作为一项可能极大促进强 AI 发展的技术 , AutoML 被业界和学界所关注 , 其中关于效率和泛化性的问题更是人们研究的热点方向 。 在这一个问题上 , 深度赋智的做法可能会给研究人员带来一些启发 。
为提高模型和算法的效率和泛化性 , 深度赋智提出了上文中提到的 MetaAI 技术 , 这项技术的核心就在于模仿人类的优化操作 , 比如人类在做过一系列类似数据集之后就会有 sense , 知道 A pattern 要设置大 batch size、用 focal loss 做均衡 , B pattern 则要用 mish 做激活、radam 做优化器 。 而深度赋智的 AI 可以拟人化 , 学到这些操作 , 进而学习如何针对不同的数据集做泛化 。 随着 AI 见过的数据集越来越多 , 效果会随之越来越好 。 而在效率问题上 , 只要见过类似的数据集 , MetaAI 就可以即刻给出近似最优解 , 最快只需几秒 , 就可以实现人类的长周期效果 。
未来 , AutoML 会向着什么方向发展呢?这是所有人都关心的问题 。 对此 , 吴承霖给出了一个值得思考的回答:“可能 Full-AutoML 是一个真正的开始 , 我们真正走向AI演化AI的第一步 。 什么时候它能够演化自己 , 那可能奇点就到来了 。 ”
这个奇点何时才能到来呢?就要看各界专家的成果了 , 将来说不定你就是最终时刻催动质变的一份子!