『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术


『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
受访者 | 深度赋智创始人&CEO
采访人员 | 夕颜
出品 | CSDN(ID:CSDNnews)
「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分 。 通过对 AI 生态顶级大咖、创业者、行业 KOL 的访谈 , 反映其对于行业的思考、未来趋势判断、技术实践 , 以及成长经历 。
本文为 「AI 技术生态论」系列访谈第二十四期 , 通过背后的企业——深度赋智的创始人兼CEO 吴承霖 , 来了解一下这项技术的详细解读 , 以及在特殊时代背景下 , 这家 AutoML 公司的创业经历 , 揭开国内 AutoML 企业的技术“家底” , 折射 AutoML 技术本身的发展现状与趋势 。
百万人学 AI 你也有份!今日起 , 点击阅读原文报名「2020 AI开发者万人大会」 , 使用优惠码“AIP211” , 即可免费获得价值299元的大会在线直播门票一张 。 限量100张 , 先到先得 。
4 月 18 日 , 由 NeurIPS 举办历时四个月的 AutoDL 2019-2020(自动深度学习) 系列竞赛总决赛落下帷幕 , 冠军被一匹“黑马”——深度赋智的 DeepWisdom 团队夺得 。 该团队背后的企业此前并不为人所熟知 , 但提交的方案在 Feedback 阶段和 Final 阶段取得了双项总分第一的成绩 , 以两阶段平均排名 1.2 和 1.8 的分数稳定且大幅领先所有队伍 。
『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
Feedback-phase Leaderboard榜单
『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
Final-phase Leaderboard榜单
深入了解之后 , CSDN 发现 , 让这支团队获得冠军的核心技术 , 在于其独立研发的 Fully Automatic Machine Learning 系统(完全自动化机器学习系统) , 这套系统背后的研发团队更是不简单 , 他们有来自腾讯、Google、百度、华为的架构师、研究员 , 也有来自牛津、帝国理工、UCL、CMU、清华、北大、厦大等高校的学生 , 共同完成了这套量化了 AI 生产的所有环节的系统 , 可以全自动、端到端地生产全流程 AI , 摆脱了以往的 AI 设计需要诸多人类经验的过程 。
『人工智能』几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
本文插图
史上最难任务 , 代码已开源!
首先按照惯例 , 放上获得 NeurIPS-AutoDL 总决赛冠军的技术解决方案开源代码:https://github.com/DeepWisdom/AutoDL , 感兴趣的同学可以打开学习一下 。
据称 , 此次 AutoDL Challenge 竞赛堪称史上最难 , 参赛选手需要设计开发出能解决包括图像、视频、语音、文本和结构化表格数据等多模态、多领域的全自动多标签分类系统 , 无论是从数据还是评估方式(ALC(Area under ROC Learning Curve))上来说 , 挑战赛难度都很大 , 参赛选手需要面对如何在不同的数据中自动发现有效信息 , 如何为不同领域的任务自动提取有用特征 , 如何自动处理不同领域的数据 , 如何自动高效地选择恰当的机器学习模型与超参数等目前对于大多数 AutoML 方案来说难度极大的挑战 。
拿挑战中自动构建多模态、多领域的全自动多标签分类系统这一任务来说 , 吴承霖说 , 做到这一点实际上是很难的事情 , 比如金融的文本和法律的文本完全不同 , 需要用极大差异的模型来做 , 如何自动适配?人声的 REID 和乐曲的识别完全不同 , 但它们都是音频的多标签分类 , 应该怎么做?现实世界的类似问题很多 , 如何用一套方法全自动达到较好的效果?这些都是 AutoML 面临的难题 , 而只有 Full-AutoML 才可以解决这些问题 , 帮助企业在多模态、多领域做任意的多标签分类 。