如何斩获KDD Cup两冠一季?美团广告团队公开解决方案( 七 )


确定了一个小的参数搜索子空间 , 以便执行线上搜索 。 由于时间预算相对较少 , 没有充足的时间在参数上做完整的训练验证搜索 , 因此该团队设计了一个快速参数搜索方法 。
对于每个模型的超参空间 , 通过少量 epoch 的训练来比较验证集精度 , 从而确定超参数 。 如图 13 所示 , 该团队通过 16 轮的模型训练 , 来选取验证集精度最优的学习率 0.003 , 此举意在确定哪些超参数可使模型快速拟合该数据集而不追求选择最优的超参数 , 以加快参数搜索和模型训练 。
如何斩获KDD Cup两冠一季?美团广告团队公开解决方案
本文插图
图 13:少量 epoch 模型训练下不同学习率的验证集精度
通过快速超参搜索 , 该团队保证每个模型在每个数据集上均能在较短时间内确定超参数 , 从而利用这些超参数进行每个模型的训练 。
3. 多级鲁棒模型融合
由于该次竞赛通过数据集排名平均来确定最终排名 , 故而鲁棒性是特别重要的 。 为了达到鲁棒效果 , 该团队采用了一个多级鲁棒模型融合策略 。
如图 14 所示 , 在数据层面进行切分来进行多组模型训练 , 每组模型包含训练集及验证集 , 通过验证集精度使用 Early Stopping 来保证每个模型的鲁棒效果 。 每组模型包括多种不同的图模型 , 每种图模型训练 n 次进行均值融合得到稳定效果 。 由于不同种类图模型的验证精度差异较大 , 因此需要对不同种类的图模型根据图的稀疏性以及验证集精度进行稠密度自适应带权融合 , 以便利用不同模型在不同数据集上的差异性 , 最后再对每组图模型进行均值融合来利用数据间的差异性 。
如何斩获KDD Cup两冠一季?美团广告团队公开解决方案
本文插图
图 14:多级鲁棒模型融合
评估结果
表 5 展示了不同图模型在五个离线图数据集上的测试精度:与「图神经网络模型」章节所描述的一致 , GCN 在各个图数据集上有较好的效果 , 而 TAGConv 在稀疏图数据集 1、2、5 有更优异的效果 , GraphSAGE 在稠密图数据集 4 上取得最好的效果 , GAT 在有特征的数据集 1、2、4 中表现较为良好 , 而模型融合在每个数据集上均取得更稳定且更好的效果 。
如何斩获KDD Cup两冠一季?美团广告团队公开解决方案
本文插图
表 5:不同图模型在五个离线图数据集上的测试精度
如表 6 所示 , 该团队的解决方案在每个图数据集上均达到鲁棒性效果 , 每个数据集的排行均保持较领先的水平 , 并避免过度拟合 , 从而在平均排行上取得第一 , 最终 aister 团队在 KDD Cup 2020 AutoGraph 赛题上获得冠军 。
如何斩获KDD Cup两冠一季?美团广告团队公开解决方案
本文插图
表 6:Top 5 参赛队伍在最后 5 个数据集上所有图数据集的平均排行及在每个图数据集的单独排行
Multimodalities Recall 赛题
赛题介绍与分析
多模态召回赛题由阿里巴巴达摩院智能计算实验室发起并组织 , 关注电商行业中的多模信息学习问题 。
2019 年 , 全世界线上电商营收额达到 3530 亿美元 。 据相关预测 , 到 2022 年 , 总营收将增长至 6540 亿美元 。 大规模的营收和高速增长预示着 , 消费者对于电商服务有着巨大需求 。 跟随这一增长 , 电商行业中各种模态的信息越来越丰富 , 如直播、博客等等 。 怎样在传统的搜索引擎和推荐系统引入这些多模信息 , 更好地服务消费者?这值得相关从业者深入探讨 。 基于此背景 , 主办方发起了该赛题 。
主办方提供了淘宝商城的真实数据 , 包括两部分:一是搜索短句(query)相关 , 为原始数据;二是商品图片相关 , 考虑到知识产权等 , 提供的是使用 faster rcnn 基于图片提取出的特征向量 。 两部分数据被组织为基于 query 的图片召回问题 , 即有关文本模态和图片模态的召回问题 。