全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选( 二 )

----全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选//----

  3、面向密集多角度物体检测的动态修正网络

  Dynamic Refinement Network for Oriented and Densely Packed Object Detection

  目前主流的物体检测方法在旋转(rotated)及密集排列(densely packed)标场景下 , 检测性能显著下降 。 腾讯优图认为主要原因是:深度神经网络中同层神经元感受野、形状、角度单一 , 不适合处理多度、多形状的目标;模型学到的一般性知识不具备针对特定样本适应调整的能力 。 针对以上两点 , 优图提出动态修正络(Dynamic Refinement Network , 图1) 。 具体说来:(1) 设计了自适应感受野调整模块 , 使模型能够根据目标形状、旋转角度适应地调整感受野 , 缓解单一的感受野与多变的标之间的矛盾 。 (2)针对分类与回归任务设计了动态修正分类器 (图2(左))与动态修正回归器(图2(右)) , 使模型兼顾静态知识(statistic knowledge)和动态知识(dynamic knowledge)的学习 , 赋予模型依据样本自适应调整的能 。 结合以上两点 , 优图设计了统一的动态修正网络 。 在当前著名的密集旋转目标检测数据集 (DOTA、HRSC2016、 SKU110K)上 , 该法均取得了新的最佳性能 。


全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

----全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选//----

  4、自适应课程学习人脸识别函数

  CurricularFace: Adaptive Curriculum Learning Loss for Deep Face Recognition

  人脸识别中常用损失函数主要包括两类 , 基于间隔或者难样本挖掘 。 前一类方法对所有样本都采用一个固定的间隔值 , 忽略了样本自身的难易信息 。 后一种方法则在整个网络训练周期都强调困难样本 , 可能导致网络无法收敛问题 。 在工作中 , 优图基于课程学习的思路 , 提出了一种新的自适应课程学习损失函数 。 在训练初始阶段 , 方法主要关注容易的样本;随着训练进行 , 逐渐关注较难的样本 。 同时 , 在同一个训练阶段 , 不同的样本根据其难易程度被赋予不同的权值 。 在常用的多个人脸识别benchmark上 , 该方法相较于SOTA方法都取得了稳定一致的提升 。


全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

----全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选//----

  5、基于注意力卷积二叉神经树的细粒度视觉分类

  AttentionConvolutionalBinaryNeuralTree for Fine-Grained Visual Categorization

  本文由腾讯优图实验室和中科院软件所联合提出 。 细粒度视觉分类(Fine-Grained Visual Categorization , FGVC)因样本类间差异更加细微 , 往往只能借助微小的局部差异才能区分出不同的类别 , 使其成为一项重要但具有挑战性的任务 。 本文提出了一种基于注意力机制的卷积二叉神经树结构 。 具体来说 , 将传统的决策树与神经网络结合 , 在树的内部节点中使用路由来确定树内从根到叶的计算路径 , 并且在树的边上添加了卷积操作增强表示学习 , 最终决策融合了所有叶节点的预测 。 该模型以一种由粗到细的层次方式学习具有判别力的特征 。 此外 , 采用非对称的策略来增加多尺度特征提取 , 增强样本的区分性特征表示 。 采用SGD优化方法以端到端的方式训练整个网络 。 该方法在CUB-200-2011 , Stanford Cars 和 Aircraft数据集上进行了评估 , 显著优于当前其他的弱监督细粒度方法 。