来自Google:DELG,统一全局和局部特征的实例识别研究( 二 )


Tensorflow 2 的开源代码为了进一步的研究和复现 , 我们发布了代码 , 包括DELG和其他实例识别相关技术 , 如DELF和Detect-to-Retrieve 。 我们的代码采用了最新的Tensorflow 2 , 除了图像检索和匹配功能外 , 还提供了模型训练和推断的参考实现 。
实例识别的新挑战【来自Google:DELG,统一全局和局部特征的实例识别研究】在地标领域 , [谷歌地标数据集v2]( improvement .html) (GLDv2)是用于实例识别的最大的可用数据集 , 拥有500万张跨越20万个类别的图像 。 通过在该数据集上训练里地标检索模型 , 我们已经证明与早期数据集上训练的模型相比 , 提高了高达6%的平均平均精度 。
今年 , 我们还在地标领域发起了两个新的挑战 , 一个关注于识别 , 另一个关注于检索 。 这些比赛使用了新收集的测试集和新的评估方法:参赛者必须提交运行在Kaggle服务器上的模型和代码 , 而不是上传预先计算好的预测CSV文件 , 以计算预测的得分和排名 。 这种有限制的计算环境突出了高效和实用的解决方案 。
挑战赛吸引了1200多支队伍参赛 , 比去年增加了3倍 , 参赛队伍比我们强大的DELG基线取得了显著的进步 。 在识别任务中 , 得分最高的小组提交的平均准确率相对提高43% , 在检索任务中 , 获胜小组的平均准确率相对提高59% 。 后一种结果是通过更有效的神经网络、池化方法和训练协议的结合实现的(详见Kaggle竞赛网站) 。
通过这项研究、开放源代码、数据和挑战 , 我们希望能够推动实例识别的进步 , 并使来自不同社区的研究人员和机器学习爱好者能够开发出跨不同领域的泛化方法 。
英文原文:
更多内容 , 请关注微信公众号“AI公园” 。