PP-YOLO超越YOLOv4-目标检测的进步


PP-YOLO超越YOLOv4-目标检测的进步文章插图
PP-YOLO评估指标比现有最先进的对象检测模型YOLOv4表现出更好的性能 。 然而 , 百度的作者写道:
本文不打算介绍一种新型的目标检测器 。 它更像是一个食谱 , 告诉你如何逐步建立一个更好的探测器 。
让我们一起看看 。
YOLO发展史YOLO最初是由Joseph Redmon编写的 , 用于检测目标 。 目标检测是一种计算机视觉技术 , 它通过在目标周围画一个边界框来定位和标记对象 , 并确定一个给定的框所属的类标签 。 和大型NLP transformers不同 , YOLO设计得很小 , 可为设备上的部署提供实时推理速度 。
YOLO-9000是Joseph Redmon出版的第二个“YOLOv2”目标探测器 , 它改进了探测器 , 并强调了该检测器能够推广到世界上任何物体的能力 。
PP-YOLO超越YOLOv4-目标检测的进步文章插图
YOLOv3对检测网络做了进一步的改进 , 并开始将目标检测过程纳入主流 。 我们开始发布关于如何在PyTorch中训练YOLOv3、如何在Keras中训练YOLOv3的教程 , 并将YOLOv3的性能与EfficientDet(另一种最先进的检测器)进行比较 。
然后约瑟夫·雷德曼出于伦理考虑退出了目标探测游戏 。
当然 , 开源社区接过了指挥棒 , 继续推动YOLO技术的发展 。
YOLOv4最近由Alexey AB在他的YOLO Darknet存储库中发表 。 YOLOv4主要是其他已知的计算机视觉技术的集合 , 通过研究过程进行了组合和验证 。 请看这里深入了解YOLOv4 。

YOLOv4论文的读数与PP-YOLO论文相似 , 如下所示 。 我们提供了一些关于如何在Darknet中训练YOLOv4的很好的训练教程 。
然后 , 就在几个月前 , YOLOv5被发布了 。 YOLOv5采用了Darknet(基于C)的训练环境 , 并将网络转换为Pytorch 。 改进的训练技术进一步提高了模型的性能 , 并创建了一个非常好用的开箱即用的对象检测模型 。 从那以后 , 我们一直鼓励使用Roboflow的开发人员通过这个YOLOv5训练教程将他们的注意力转向YOLOv5 , 以形成他们的自定义对象检测器 。
输入PP-YOLO 。
PP代表什么?PP是百度编写的深度学习框架PaddlePaddle的缩写 。
PP-YOLO超越YOLOv4-目标检测的进步文章插图
如果你不熟悉Paddle , 那我们就在同一条船上了 。 paddle最初是用Python编写的 , 它看起来类似于PyTorch和TensorFlow 。 深入研究paddle框架很有趣 , 但超出了本文的范围 。
PP-YOLO贡献PP-YOLO的论文读起来很像YOLOv4论文 , 因为它是计算机视觉中已知的技术的汇总 。 新颖的贡献是证明这些技术的集成可提高性能 , 并提供消融研究 , 以研究每一步对模型的帮助程度 。
在我们深入研究PP-YOLO的贡献之前 , 先回顾一下YOLO检测器的体系结构 。
解剖YOLO检测器
PP-YOLO超越YOLOv4-目标检测的进步文章插图
YOLO检测器分为三个主要部分 。
YOLO Backbone:YOLO Backbone(骨干)是一个卷积神经网络 , 它将图像像素合并在一起以形成不同粒度的特征 。 骨干通常在分类数据集(通常为ImageNet)上进行预训练 。
YOLO Neck:YOLO Neck(上面选择了FPN)在传递到预测头之前对ConvNet图层表示进行组合和混合 。
YOLO Head:这是网络中进行边界框和类预测的部分 。 它由关于类 , 框和对象的三个YOLO损失函数指导 。
现在 , 让我们深入了解PP YOLO做出的贡献 。
PP-YOLO超越YOLOv4-目标检测的进步文章插图