「微粒贷」阿里巴巴高德地图首席科学家任小枫QA答疑汇总丨视觉+地图技术有哪些新玩法?


「微粒贷」阿里巴巴高德地图首席科学家任小枫QA答疑汇总丨视觉+地图技术有哪些新玩法?
上周 , 阿里巴巴高德地图首席科学家任小枫在#大咖学长云对话#的在线直播活动上就计算机视觉相关技术发展以及在地图出行领域的应用与大家做技术交流 , 直播间互动火爆 , 尤其在QA环节 , 学弟学妹们纷纷就感兴趣的视觉应用、AR导航、定位技术、5G、职业发展等话题提问 , 任小枫做了精彩回答 。 我们整理了问答内容 , 分享给大家 。
视频回放地址:
https://vku.youku.com/live/ilproom?id=8064786


任小枫博士 , 现任阿里巴巴高德地图首席科学家 , 研究员 , 主要负责视觉技术在地图和出行领域的应用和创新 。 加入阿里巴巴前 , 他在2013到2017年间供职于亚马逊 , 是亚马逊的资深主任科学家和AMAZON GO的算法负责人 。 浙江大学本科毕业 , 加州大学伯克利分校博士 , 华盛顿大学计算机系客座教授 , CVPR/ICCV/AAAI等会议领域主席 , IEEE PAMI副主编 。
视觉技术发展及应用
提问:计算机视觉在高精度地图构建中的应用有哪些?
任小枫:视觉算法对于高精度地图构建是核心的技术 , 主要应用在资料对齐和精度保证、识别和地图数据自动化生成、视觉定位和高精地图更新等 。
【「微粒贷」阿里巴巴高德地图首席科学家任小枫QA答疑汇总丨视觉+地图技术有哪些新玩法?】提问:您觉得现有的基础学科研究水平与硬件水平能否保证视觉技术的快速发展?视觉技术发展在近期会不会遇到较难突破的瓶颈?
任小枫:经过了前几年深度学习技术在视觉各个领域的快速发展 , 一定程度上说 , 深度学习和视觉的基础技术现在都遇到了瓶颈 。 或者说 , 没有开始的时候发展的那么快 , 有很多难题需要解决 , 也可能需要创造新的技术 。 对于应用而言 , 我觉得基础技术和硬件水平目前大致是够用的 , 更重要的是如何把技术用好 , 有针对性的去突破技术瓶颈 。
提问:单目标跟踪SOT(给定模版跟踪单个目标 , 类别无关/可跨域)近两年的进展非常显著 , 具有解决快速跟踪的潜质 , 想请问目前有没有在地图业务这边比如视觉定位(VO中跟踪路标)/AR导航(短时跟踪)中应用的前景?如果有的话 , 请问需要解决什么样的需求问题(鲁棒/速度等)?
任小枫:跟踪是一个视觉基础技术 , 在很多场景都有应用 。 对于导航和出行 , 确实在AR导航、定位上能起到核心作用 , 减少识别(检测)的计算需求 , 并增加鲁棒性和平滑性 。 但是在很多实际应用中 , 跟踪的使用和需求和学术界单目标跟踪的设置会有所不同 。
提问:视觉特征是否能结合语义给地图的导航出行服务带来更好的体验呢?
任小枫:视觉可以提供高精度的定位 , 也可以提供场景的语义理解 , 肯定可以带来导航和出行更好的体验 。 但是具体的产品体验和技术实现还需要进一步的探索和积累 。
提问:计算机视觉下一步的重难点是哪个方向?未来的前景如何?
任小枫:计算机视觉是一种通用的感知手段 , 信息量很大 , 可以用于多种感知任务 , 可以远距离观测 , 应用的前景是很广阔和美好的 。 下一步的难点 , 除了基础技术需要进步和突破外 。 还有:如何找到视觉能发挥核心作用的应用场景 , 如何根据实际问题综合各类算法设计整体方案 , 如何较好的解决计算资源的问题 , 如何结合其他传感器和先验知识等问题 。