雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后( 二 )


本文插图
视觉的瓶颈在算法 , 激光雷达的瓶颈在原理 。 显然 , 视觉具有更大的开发潜力 , 也拥有理论上更高的上限 。 做对的事情 , 不做容易的事情 , 也是一直以来马斯克的作风 。
至于在公开场合频繁唱衰激光雷达 , 就权当是特斯拉及埃隆·马斯克出色公关水平的一种体现 。
特斯拉如何克服视觉劣势? 从2D平面图像推断精确的3D立体实景 , 实际上是非常困难的 。
以下图中这辆MPV为例 , 如果只看左侧的2D图像 , 似乎用视觉和激光雷达标注的形状都是准确的 , 但是如果放在3D的场景中 , 就会发现使用视觉方案标注的形状不仅偏长、偏窄 , 而且缺少了汽车的侧面 。
雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后
本文插图
因为在2D图像中 , 很容易找到车辆的左前角和右后角 , 但是左后角却没有明显的特征 , 由于车辆尾部的倾斜、向上收窄 , 就会造成对整体宽度的低估 。 同时 , 依靠发动机舱盖超出车顶的部分估算车长 , 也会导致在纵深方向上的高估 。

雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后
本文插图
而这还仅仅是一个在高亮度环境下相对规则的物体 , 如果环境变暗 , 或是加入更多的遮蔽物、障碍物 , 情况会变得更加极端 。 比如在黑暗树荫中的二轮车 , 纯视觉方案很难分辨 。
雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后
本文插图
因此 , 从根本算法上解决视觉信息的准确处理 , 就是特斯拉自动驾驶体系的绝对核心技术 。
实现自动驾驶功能 , 更多的是技巧、记忆和经验 , 而不只是推理和计算 , 深度学习的算法就是为了提高自动驾驶的成熟程度 。 特斯拉完善视觉算法的一大优势 , 就是通过海量的车主驾驶数据 , 进行神经网络训练 , 从而不断覆盖更多的工况与场景 , 达到视觉算法无限接近人类判断的目的 。
这一方面取决于特斯拉自动驾驶硬件的高算力 , 另一方面是特斯拉在“模式识别模型”领域的绝对领先——超大的数据规模、多样化的数据覆盖度、真实的数据场景 。 归根到底 , 全世界超过百万辆的特斯拉车主 , 都是特斯拉自动驾驶算法训练的众测者 。
雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后
本文插图
这里不得不提的就是特斯拉独有的“影子模式” , 这是特斯拉在不影响算法训练的速度与准确性的基础上 , 大幅降低因数据量过大造成训练成本提升的关键 。
藏在驾驶员背后的“影子” , 始终在观察外部环境与驾驶员的动作 。 如果在某个特定场景中驾驶员的操作与“影子”预想的一致 , 那么数据不会被上报;如果“影子”发现它的判断与驾驶员操作不相符 , 那么这次的数据就会被送到特斯拉的服务器中 , 并对算法进行修正性训练 , 达到一定程度后再次下发到车辆中 。
雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后
本文插图
这个过程中 , 驾驶员不会有任何感知 , 但特斯拉事实上已经完成了“模式识别-算法学习-反馈-升级-应用”的闭环 。 正是在无数次的训练后 , 特斯拉不断提升视觉方案的精度 , 克服视觉方案固有的劣势 , 并且将算法优势变成牢不可破的技术门槛 。
用视觉替代激光雷达 , 可能吗? 特斯拉最终希望达到的目的 , 是让其视觉处理能力达到激光雷达的可见性 , 在行业中被称为“伪激光雷达” 。
激光雷达通过每个激光点的距离 , 实时还原环境 。 而特斯拉则是要去预测每个像素的深度 , 然后将其投射出来 , 从而复制激光雷达的功能 。
雷达马斯克疯狂diss激光雷达背后,为何特斯拉敢赌纯视觉方案?特斯拉为何不用激光雷达?特斯拉如何克服视觉劣势?用视觉替代激光雷达,可能吗?写在最后