PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显


PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显文章插图
本文首发于AI算法修炼营
作者 | SFXiang
编辑 | 青暮
本文介绍一篇收录于BMVC2020的论文 , 这篇论文的主要的思想是减少anchor-free目标检测中的label噪声 , 在COCO小目标检测上表现SOTA!
性能优于FreeAnchor、CenterNet和FCOS等网络 。
整体思路可以说相当简单 , 就是在原来的基础上增加了标签池化和目标框聚合操作 , 其实可以看作是tricks 。
PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显文章插图
论文地址:
代码地址(基于mmdetection实现):
当前的anchor-free目标检测器将空间上落在ground truth标签边界框box的预定中心区域内的所有特征标记为正 。
这种方法会在训练过程中引起标签噪音Label Noise , 因为其中一些带有正标签的特征可能位于背景或遮挡物上 , 或者根本不是有判别性的特征 。
在本文中 , 提出了一种新的标记策略 , 旨在减少anchor-free目标检测器中的标记噪声 。 具体将源于各个特征的预测汇总为一个预测 , 这使模型可以减少训练过程中非判别性特征(non-discriminatory features)的贡献 。
在此基础上 , 开发了一种新的单阶段anchor-free目标检测器PPDet , 以在训练过程中采用这种标记策略 , 并在推理过程中采用类似的预测合并方法 。 在COCO数据集上 , PPDet在anchor-free的自上而下检测器中实现了最佳性能 , 并与其他最新方法具有同等水平 。 它在检测小物体方面也优于所有最新方法(AP 31.4) 。
1 简介
早期的基于深度学习的目标检测器算法是两阶段的 , 在第一阶段 , 生成了一组稀疏的目标候选框 , 并在第二阶段将它们进行了卷积神经网络(CNN)的分类 。
后来 , 在单阶段目标检测的想法越来越引起人们的关注 , 在单阶段方法中 , 设置预定义的anchor替换了候选框 。
一方面 , anchor锚点必须密集地覆盖图像(例如位置 , 形状和比例等方面)以使召回率最大化 。
另一方面 , 应该将它们的数量保持在最小 , 以减少推理时间和在训练中造成的不平衡问题 。
目前主要有两类突出的方法来进行anchor-free的目标检测 。
第一类是基于关键点的、自下而上的方法 , 在开创性工作CornerNet之后流行起来 。 这类方法首先检测物体的关键点(如角点、中心点和极点) , 然后对它们进行分组得到整体物体的检测 。
第二类方法遵循自上而下的方法 , 直接预测每个物体上的类和边界框坐标并确定其在最终特征图中的位置 。
目标检测器训练的一个重要方面是用于标记目标候选者的策略 , 这些候选者可以是提案、锚或最终特征图中的位置(即特征) 。
【PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显】为了在训练过程中给候选目标贴上 "正样本"(前景foreground)或 "负样本"(背景background)的标签 , 已经提出了多种策略 , 例如有基于交并比(IoU)的方法、基于关键点和与ground truth box的相关位置的方法等 。
具体来说 , 在自上而下的anchor-free目标检测器中 , 当输入图像通过骨干网络中的特征提取器和FPN后 , 空间上落在ground truth框内的特征被标记为正值 , 而其他特征被标记为负值 , 当然在这两者中间还有一个 "忽略ignore "区域 。 其中 , 每一个正标签的特征都作为一个独立的预测对损失函数做出贡献 。 然而 , 这种方法的问题是 , 有些正样本标签中的可能是错误的或标记的质量较差 , 因此 , 它们在训练过程中注入了标签噪声 。
噪声标签主要来自:(i)物体上的非判别性特征 , (ii)框内的背景特征 , (iii)遮挡物(图1) 。