特斯拉公开为什么干掉雷达!AI主管亲自演讲解读( 三 )


特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲神经网络架构
为什么要不断分离形成终端呢?Andrej解释道 , 研发人员可能对大量的输出结果感兴趣 , 但是不可能用一个神经网络单独输出每一项结果 。 同时 , 分支结构的另一个好处是它在终端解耦所有信号 , 所以当研发人员正在处理特定对象的速度、加速度等信息时 , 就能够拥有小神经网络 , 不用触及其他信号就能完成工作 。
最终结果是 , 这种架构能让工作效率更高 。 因为研发人员一致都在微调终端结果 , 从骨干到终端的修改则是偶尔进行 。
要处理如此多的数据 , 特斯拉搭建了一个世界排名第五的超级计算机 。
特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲特斯拉超级计算机
这个集群使用了720个节点 , 每个节点8个英伟达A100TensorCoreGPU(共5760个GPU) , 实现了1.8exaflops的性能 。
特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲英伟达A100TensorCoreGPU
这个超级计算机采用10PBNVME存储 , 读写速度能够达到1.6TB/s 。 Andrej介绍 , 这可能是全世界最快的数据存储设备 。
未来 , 特斯拉会让这台超级电脑运行Dojo项目 , 特斯拉希望通过Dojo不断训练其神经网络 , 帮助特斯拉Autopilot不断进化 。
三、纯视觉优势凸显270万公里自动驾驶0事故
在转向纯视觉感知后的特斯拉 , 效果如何呢?Andrej举出三个典型案例 。
第一个案例是前方车辆快速刹车时 , 视觉传感器和毫米波雷达出现了截然不同的表现 。
图中黄色线条代表毫米波雷达感知的距离、速度、加速度图像(从上至下) , 蓝色线条代表纯视觉传感器的感知结果 。 可以发现 , 毫米波雷达在其中有多次出现距离突然降低为0、速度突然提升、加速度突然为0的情况 。
特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲前车紧急制动时 , 两种传感器感知效果对比
这是因为突然减速之后 , 毫米波雷达并不能很好追踪前方车辆 , 因此多次重启 , 就像是车辆在短时间内重复消失 , 又出现了6次 , 这很可能误导自动驾驶系统 。
由纯视觉传感器感知的信息和毫米波雷达的信息大致重合 , 但是没有出现距离、速度、加速度突变的情况 , 表现非常稳定 。
第二个案例是路上常见的立交桥 。 由于毫米波雷达没有垂直分辨率 , 所以会认为立交桥是一个静止在前方的物体 。
特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲车辆感知到桥梁认为是静止物体 , 采取制动措施
传感器感知数据融合之后 , 车辆认为行驶前方存在静止物体 , 并判断紧急刹车 。 这种情况在高速公路上十分危险 。
第三个案例是行驶前方出现一辆停靠路边的大货车 。 此时 , 毫米波雷达无法判断前方究竟是一辆车还是一个普通的静止物体 。 因此 , 毫米波雷达将这项任务交给视觉传感器 , 最终在距离车辆110米的距离时 , 才感知到前方的卡车 。
特斯拉公开为什么干掉雷达!AI主管亲自演讲解读
文章图片
▲毫米波雷达感知距离不如摄像头
如果用纯视觉传感器 , 在180米的距离时感知到了前方的货车 , 并从145米处有明确的感知信息 , 开始减速 。
显然 , 纯视觉传感器的表现再次胜过毫米波雷达+视觉传感器的融合模式 。
Andrej介绍 , 类似的场景特斯拉一共总结了6000个 , 可以分70个类别 。 这些场景每天都会运行 , 不断提升神经网络的能力 。 除此之外 , 特斯拉还用仿真测试的方式 , 建立了1万个场景 , 不断测试 。 这些测试数据相当于人类10年的驾驶时间 。
同时 , 特斯拉也将纯视觉感知加入到影子模式的测试中 , 经过七轮影子模式的测试 , 已经相当于人类1000年的驾驶时间 。
在发布之前 , 特斯拉已经进行了1500万英里(约合2400万公里)的驾驶里程 , 其中170万英里(约合274万公里)都处于自动驾驶状态 , 目前没有出现过任何一起事故 。
Andrej也承认 , 一些遗留的堆栈还存在一些问题 , 每隔大约500万英里就会出现一次崩溃问题 。 但他相信 , 这些问题会被逐渐解决 。
在演讲的最后 , Andrej说道:“纯视觉能够精准感知深度、速度、加速度信息 。 实现纯视觉是一件困难的事情 , 并且需要大量的数据 , 不过纯视觉的方向至少是正确的 。 ”