「微粒贷」阿里巴巴高德地图首席科学家任小枫QA答疑汇总丨视觉+地图技术有哪些新玩法?( 二 )


AR导航
提问:AR导航是实时图像计算的吗?设备算力可以打标吗?
任小枫:AR导航是实时图像计算 , 在低算力的条件下实现导航和辅助驾驶功能 。 我们也尽可能的进行“预计算” , 事先计算好环境中的一些元素 , 来配合实时计算 。
提问:AR导航最后通过什么来展示内容?显示屏还是HUD?
任小枫:AR导航有多种产品形态:中控屏、HUD、后视镜、仪表盘 , 这些都是正在使用/潜在使用的展示方式 。
提问:有一个非技术性的问题 , AR导航会不会过度吸引驾驶员的注意力 , 导致他/她忽略车辆两侧的交通?
任小枫:这是一个产品设计的好问题 , 也是我们一直在打磨和寻求平衡的问题 。 一个设计的好的AR导航产品 , 会考虑到不过多吸引注意力 。
提问:安全辅助驾驶会有疲劳驾驶检测吗?
任小枫:高德的AR导航目前只有朝外的单目相机 , 没有支持疲劳驾驶检测 。 对车内的监控 , 包括疲劳检测 , 是视觉技术在安全辅助驾驶的一个重要应用 。
定位技术
提问:室内定位现在主流实现技术有哪些?基于声信号的室内导航前景好吗?
任小枫:室内定位有多种基于传感器的技术 , 包括WiFiBluetoothRFIDUltra-Wideband , 也包括声信号 。 我觉得室内定位的发展 , 如果需要部署传感器 , 很大程度上不是取决于技术和定位精度 , 而是是否有好的应用 。 WiFi定位的普及是因为室内网络需要WiFi 。 iPhone 11装了UWB芯片可以近距离文件传输 。
提问:GPS定位那么大的差距是什么原因导致的?因为多路径效应吗?
任小枫:GPS定位不准有多个原因 , 主要是在“城市峡谷”(高楼林立)的场景 。 多路径效应是其中最重要的因素 , 因为环境的折射(特别是像玻璃这样的高反光材料) , 导致GPS位置计算不准 。 其他方面还有因为楼宇/高架桥的遮挡导致能观察到的卫星数降低 , 空气(特别是带电离子和水蒸气)的干扰 , 等多种原因 。
提问:高德如何解决GPS漂移的问题?
任小枫:这是一个复杂的问题 。 基于手机传感器 , 我们结合实际的驾驶和步行场景做了很多优化 , 包括GPS置信度分析 , 和IMU结合 , 和路网结合等 。 视觉定位是我们在开拓的解决定位不准的一个新方向 。
地图基础技术
提问:目前高德地图图层有哪些?是语义级高精度地图吗?
任小枫:高德地图有多种地图数据形态 , 从标准地图(高德App上看到的) , 到车道级地图 , 到高精地图 。 精度不同 , 对应的应用不同 。 多种地图中都有语义信息 , 但是语义信息的内容和精度会有不同 。
提问:深度相机和普通的相机有什么区别?
任小枫:普通相机获取的信息是二维RGB图像 , 没有三维信息 。 深度相机在每个像素上 , 除了RGB颜色之外 , 也同时获取深度(距离)信息 , 一般是利用主动模式(time-of-flight structured light等) 。 现在很多主流手机上都已经配备了深度相机 。
提问:高德地图对道路信息是怎么采集的 , 道路有变化地图会实时更新么?
任小枫:高德地图道路信息有多个来源 , 主要是依靠低成本的车载视频资料 。 道路相关信息是在随时变化的 , 我们会不断的采集最新资料并制作更新地图数据 , 及时上线应用 。
提问:室内三维空间(比如多层的商业大楼)地图绘制的难点有哪些?
任小枫:室内三维地图绘制最大的难点在于数据采集 。 三维重建的方法需要有多个角度的图像 。 基于深度相机的移动建模方法精度上不一定能满足需求 。
新人职业成长
提问:从视觉和图像领域的学术研究领域到公司商业计算机视觉应用技术开发需要补充哪些知识?
任小枫:我觉得主要要考虑的不是补充具体的知识 , 而是要注意培养自己的各方面的能力:(1)对实际问题的分析和解决的能力;(2)动手能力;(3)快速学习和拓展知识的能力 。