『人工智能』如何为AI造“眼”?华为科学家带你“看懂”世界


距离华为开发者大会2020(Cloud)开幕还有一天 , 让我们揭开计算机视觉奥义的面纱 , 共同打开智慧之门 。
终于 , 计算机视觉技术在中国迎来了它最好的时代 。 智能图像采集设备的普及 , 使得机器能够“看清”世界——然而我们并不满足于此:我们的目标是利用人工智能技术 , 让机器能够真正“看懂”这个世界 。
这是一个充满挑战的任务 , 正如华为诺亚方舟实验室计算视觉首席科学家田奇博士指出的那样:
“基于标注数据的监督学习所带来的红利期已接近尾声 , 现在业界亟需高效利用海量无标注数据(数据高效)的新学习范式 。 ”
如今 , 越来越多的人工智能应用需要建立在“看懂世界”的基础上 。

  • 例如 , 受到广泛关注的L4/L5级智能驾驶 , 需要建立在强大的环境感知基础上——这对计算机视觉技术提出了极为苛刻的要求;
  • 又如智慧城市 , 如何能在人流密集的街头做到跨域行人重识别(ReID) , 同样是计算机视觉所面临的巨大挑战;
  • 同时 , 计算机视觉算法的成熟还将为终端视觉带来质的飞跃 , AI技术为图像视频质量增强提供了有力的武器 , 而超分辨率、失焦修复等也已成为手机摄像的标准配置 。
总之 , 面向场景应用的计算机视觉技术 , 不仅为人们的生活增添了更多便捷 , 也将进一步推动人类社会走向更加智能与精彩的未来 。
当然 , 这一切的背后少不了科学团队的支持 。
目前 , 田奇博士带领的团队主要研究重心聚焦在数据高效和能耗高效的计算机视觉基础研究 。
为了从海量无标签数据中挖掘有用的知识 , 就需要数据高效的学习算法;而为了让动辄上千万参数量的网络模型在各种终端设备中顺畅运行 , 能耗高效的模型适配也是他们的研究重点之一 。
落实到具体业务 , 计算视觉研究主要针对六大方向:底层视觉、语义理解、3D视觉、数据生成、视觉计算、视觉+X模态 。 得益于爆发式的应用场景以及AI人才红利 , 中国的计算机视觉研究也开启了加速模式 。
当前 , 由田奇博士带领的研发团队在许多方面已经居于世界领先地位 。
  • 例如 , 在业界公认最为重要的图像分类数据集ImageNet上 , 田奇博士的团队利用高效的数据扩增算法 , 在不使用额外训练数据的情况下 , 达到了85.8%的分类准确率 , 打破了谷歌多年来对这一赛道的垄断 。
  • 同时 , 利用在自动网络架构搜索方面取得的持续性突破(代表性工作包括P-DARTS、PC-DARTS、Stabilizing DARTS、Latency-Aware DARTS等) , 团队也能够完成从云侧大模型到端侧小模型的适配 , 在受限算力下依然保持业界领先水平 。
在过去一年多的时间里 , 他们还研发了许多先进技术并中稿了80多篇计算机视觉顶会论文 , 其中多项技术已经在华为内部多个应用场景中获得验证与应用 。
这些计算机视觉领域的创新研究进展将在华为开发者大会2020(Cloud)上与来自全球的科学家与优秀AI开发者共同分享 。
作为大会预告 , 田奇博士也提前剧透了一个令人满怀期待的消息:
此次他们将发布“华为视觉计划” , 他还进一步强调 , 这项计划的发布 , 标志着华为将以更积极的姿态 , 投身计算机视觉前沿探索 , 与业界一起迈向真正的人工智能时代 。
『人工智能』如何为AI造“眼”?华为科学家带你“看懂”世界
本文插图
华为开发者大会2020(Cloud) 3月27日~28日期间面向全球开发者开启线上直播
华为开发者大会HDC.Cloud是华为面向ICT(信息与通信)领域全球开发者的年度顶级旗舰活动 , 这也是一场包括田奇博士在内的众多大神云集的线上活动 。

『人工智能』如何为AI造“眼”?华为科学家带你“看懂”世界
本文插图