【右手网】特斯拉先进的计算机视觉技术让摄像头输出与激光雷达媲美的精度


在人工智能和神经网络方面的进步使得特斯拉在自动驾驶和完全自动驾驶解决方案中处于领先地位 , 而这在很大程度上归功于其人工智能高级总监安德烈·卡帕西(AndrejKarpathy)及其团队的出色工作 。 在2月份的ScaledMachineLearning大会上 , 卡帕西就展示了特斯拉训练人工智能的方法 , 在此过程中 , 他还分享了特斯拉如何仅用几个摄像头就能够获得传统激光雷达的精度 。
众所周知 , 相比于激光雷达 , 特斯拉更偏好于计算机视觉 。 通过将视觉传感器收到的视觉信息进行3D渲染、用AI软件将车道线、交通、行人等信息与进行匹配 , 最终使车辆作出决策 。 在特斯拉不断更新和发展的解决方案中 , 秘密武器不是摄像头本身 , 而是他们构建的神经网络 。 特斯拉的人工智能团队建造的一项新技术被称为"伪激光雷达" , 能够融合计算机视觉技术和激光雷达强大的3D点云的优势 。
传统激光雷达
传统的基于激光雷达的系统依赖于一系列激光雷达硬件 , 利用不可见的激光或类似的技术发出大量的脉冲信号来探测周围的物体 , 最终实现基于每个激光点的距离实时可视化车辆周围的世界 。 计算机将这些激光点转换成3D显示并识别出其他车辆、行人、道路、建筑物等 , 提升车辆行驶的安全 。
近年来自动驾驶的发展使得激光雷达单元以及与之相关的软件支持解决方案大幅增加 , 但即便如此 , 激光雷达仍然是目前最昂贵的技术方案 , 其成本令人望而却步 , 单个传感器的成本就高达数千美元 。 而另一方面 , 随着摄像头在智能手机、笔记本电脑和类似产品中的普及 , 每个摄像头的成本可能低至几美元 。
【右手网】特斯拉先进的计算机视觉技术让摄像头输出与激光雷达媲美的精度
本文插图
伪激光雷达
在硬件方面 , 特斯拉基于摄像头的方案不仅更便宜 , 也更容易实现 , 但需要极其复杂的计算机系统才能将原始的摄像头输入和车辆远程信息处理进行智能转化 。 目前 , 特斯拉将计算机视觉提升到了前所未有的水平 , 不仅能够分析图像 , 而且还能够分析图像中的单个像素 。 随着时间推移 , 这样做也许能够复制传统激光雷达系统的大部分功能 , 这意味着可以利用已经为激光雷达处理开发的所有软件解决方案 , 或将进一步提高特斯拉在3D物体探测方面的技术水平 。
【右手网】特斯拉先进的计算机视觉技术让摄像头输出与激光雷达媲美的精度
本文插图
【【右手网】特斯拉先进的计算机视觉技术让摄像头输出与激光雷达媲美的精度】总之 , 伪激光雷达的优点是其信号比激光雷达密集得多 , 并且与之具有较强的互补性 , 也许在将来能够推动计算机视觉领域在图像方案上与激光雷达之间的性能差距进一步缩小 。