按关键词阅读:
机器之心发布
机器之心编辑部
阿里巴巴达摩院在自动驾驶3D物体检测方面又有新成果发布 。 近日 , 计算机视觉顶会CVPR2020接收论文结果发布 , 达摩院一篇名为《StructureAwareSingle-Stage3DObjectDetectionfromPointCloud》的论文入选 。
该论文提出了一个通用、高性能的检测器 , 首次实现3D物体检测精度与速度的兼得 , 有效提升自动驾驶系统安全性能 。 目前 , 该检测器在KITTIBEV排行榜上排名第一 。
文章图片
3D目标检测需输出物体类别及在三维空间中的长宽高、旋转角等信息
和普通2D图像识别应用不同 , 自动驾驶系统对精度和速度的要求更高 , 不仅需要快速识别周围环境的物体 , 还要对物体在三维空间中的位置做精准定位 , 但仅靠传感器和传统算法模型无法平衡视觉识别的精度和速度 , 因此 , 全新的检测器成为提升自动驾驶系统安全性的关键因素 。
虽然 , 业界主流的单阶段检测器在检测速度上有不俗的表现 , 但其检测精度却差强人意 。 为此 , 达摩院提出了全新的思路 , 即将两阶段检测器中对特征进行细粒度刻画的思想移植到单阶段检测中 。 具体来说 , 达摩院在训练中利用一个辅助网络将单阶段检测器中的体素特征转化为点级特征 , 并施加一定的监督信号 , 同时在模型推理过程中辅助网络无需参与计算 , 因此 , 在保障速度的同时又提高了检测精度 。
该论文团队表示 , 「检测器是自动驾驶系统的核心组件之一 , 但这一领域一直以来缺少创新和突破 , 此次我们提出的检测器融合了单阶段检测器和两阶段检测器的优势 , 因此同时实现了3D检测精读和速度的提升 , 未来检测器的创新研究还可以解决自动驾驶产业的更多难题 。 」
研究结果显示 , 该检测器在KITTIBEV(bird`seyeview)排行榜上排名第一,检测速度达到25FPS , 同时精度也超过其他的单阶段检测器 。
文章图片
KITTIBEV排行榜 , 达摩院位居第一
据了解 , 该论文共有5位作者 , 第一作者为达摩院研究实习生ChenhangHe , 另外四位作者也为达摩院科学家 , 包括达摩院高级研究员、IEEEFellow华先胜 , 达摩院高级研究员、香港理工大学电子计算学系讲座教授、IEEEFellow张磊 , 达摩院资深算法专家黄建强 。
以下是论文一作对该论文做出的解读:
1.背景
目标检测是计算机视觉领域的传统任务 , 与图像识别不同 , 目标检测不仅需要识别出图像上存在的物体 , 给出对应的类别 , 还需要将该物体通过Boundingbox进行定位 。 根据目标检测需要输出结果的不同 , 一般将使用RGB图像进行目标检测 , 输出物体类别和在图像上2Dboundingbox的方式称为2D目标检测 。 而将使用RGB图像、RGB-D深度图像和激光点云 , 输出物体类别及在三维空间中的长宽高、旋转角等信息的检测称为3D目标检测 。
文章图片
从点云数据进行3D目标检测是自动驾驶(AV)系统中的的关键组件 。 与仅从图像平面估计2D边界框的普通2D目标检测不同 , AV需要从现实世界估计更具信息量的3D边界框 , 以完成诸如路径规划和避免碰撞之类的高级任务 。 这激发了最近出现的3D目标检测方法 , 该方法应用卷积神经网络(CNN)处理来自高端LiDAR传感器的点云数据 。
目前基于点云的3D物体检测主要有两种架构:
1)单阶段检测器(single-stage):将点云编码成体素特征(voxelfeature),并用3DCNN直接预测物体框,速度快但是由于点云在CNN中被解构,对物体的结构感知能力差,所以精度略低.
2)两阶段检测器(two-stage):首先用PointNet提取点级特征,并利用候选区域池化点云(Poolingfrompointcloud)以获得精细特征.通常能达到很高的精度但速度很慢.
文章图片
2.方法
目前业界主要以单阶段检测器为主 , 这样能保证检测器能高效地在实时系统上进行 。 我们提出的方案将两阶段检测器中对特征进行细粒度刻画的思想移植到单阶段检测中 , 通过在训练中利用一个辅助网络将单阶段检测器中的体素特征转化为点级特征 , 并施加一定的监督信号 , 从而使得卷积特征也具有结构感知能力 , 进而提高检测精度 。 而在做模型推断时 , 辅助网络并不参与计算(detached),进而保证了单阶段检测器的检测效率 。 另外我们提出一个工程上的改进 , Part-sensitiveWarping(PSWarp),用于处理单阶段检测器中存在的「框-置信度-不匹配」问题 。
文章图片
主体网络
用于部署的检测器 , 即推断网络 , 由一个骨干网络和检测头组成 。 骨干网络用3D的稀疏网络实现 , 用于提取含有高语义的体素特征 。 检测头将体素特征压缩成鸟瞰图表示 , 并在上面运行2D全卷积网络来预测3D物体框 。
来源:(奥秘世界)
【】网址:http://www.shadafang.com/c/gx0323R5aH020.html
标题:「奥秘世界」CVPR2020|阿里达摩院自动驾驶新成果,3D物体检测精度与速度的兼得