训练轮数降至1/10,商汤等提出升级版DETR目标检测器( 二 )


图 1:可变形 DETR 目标检测器图示 。
由于可变形 DETR 的快速收敛性和计算、内存高效性 , 它打开了探索端到端目标检测器的变种的可能性 。 此外 , 研究者探索了一个简单而有效的迭代式物体边界框细化机制来进一步提高检测性能 。 他们也尝试了两阶段可变形 DETR , 其中第一阶段的 region proposals 也是由可变形 DETR 的一个变种生成 , 然后被进一步输入到解码器进行迭代式物体边界框细化 。
研究者在 COCO 基准【3】上的大量实验展示了这一方法的有效性 。 与 DETR 相比 , 可变形 DETR10 训练轮数降至 1/10(见下图 2) , 但达到了更好的性能(尤其是在小物体上 , 见下表 1) 。 本论文中提出的两阶段可变形 DETR 变种可以进一步提升性能 , 可变形 DETR 的代码也将开源 。
实验结果
下面将介绍论文中的一些主要实验结果 。
可变形 DETR 与 DETR 在 COCO 2017 val set 上的性能对比如下表 1 所示 。
训练轮数降至1/10,商汤等提出升级版DETR目标检测器文章插图
表 1:可变形 DETR 与 DETR 在 COCO 2017 val set 上的比较 。
可变形 DETR 和 DETR 的收敛曲线对比如下图 2 所示 。
训练轮数降至1/10,商汤等提出升级版DETR目标检测器文章插图
图 2:可变形 DETR 与 DETR 的收敛曲线对比 。
可变形注意力模块的控制变量实验如下表 2 所示 。
训练轮数降至1/10,商汤等提出升级版DETR目标检测器文章插图
表 2:控制变量实验 。
可变形 DETR 与当前最为先进的目标检测器在 COCO 2017 test-dev 上的性能对比如下表 3 所示 。
训练轮数降至1/10,商汤等提出升级版DETR目标检测器文章插图
表 3:可变形 DETR 与当前最先进的方法在 COCO 2017 test-dev 上的比较 。
参考文献
【1】Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, and Sergey Zagoruyko. End-to-end object detection with transformers. In ECCV, 2020.
【训练轮数降至1/10,商汤等提出升级版DETR目标检测器】【2】Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, ?ukasz Kaiser, and Illia Polosukhin. Attention is all you need. In NeurIPS, 2017.
【3】Tsung-Yi Lin, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr Doll′ar, and C Lawrence Zitnick. Microsoft coco: Common objects in context. In ECCV, 2014.
【4】Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detection with region proposal networks. In NeurIPS, 2015.
【5】Jifeng Dai, Haozhi Qi, Yuwen Xiong, Yi Li, Guodong Zhang, Han Hu, and Yichen Wei. Deformable convolutional networks. In ICCV, 2017.
【6】Tsung-Yi Lin, Piotr Doll′ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature pyramid networks for object detection. In CVPR, 2017a.