广告系统位置偏差的CTR模型优化方案


坚强 胡可 庆涛等 美团技术团队
总第457篇
2021年 第027篇
广告系统位置偏差的CTR模型优化方案
本文插图
美团到店广告平台算法团队基于多年来在广告领域上积累的经验 , 一直在数据偏差等业界挑战性问题不断进行深入优化与算法创新 。 在之前分享的《KDD Cup 2020 Debiasing比赛冠军技术方案与广告业务应用》一文[4]中 , 团队分享了在KDD Cup比赛中取得冠军的选择性偏差以及流行度偏差的解决方案 , 同时也分享了在广告业务上偏差优化的技术框架 。
本文基于这一技术框架进行继续介绍 , 聚焦于位置偏差问题的最新进展 , 并详细地介绍团队在美团广告取得显著业务效果的位置偏差CTR模型优化方案 , 以该方案为基础形成的论文《Deep Position-wise Interaction Network for CTR Prediction》也被国际顶级会议SIGIR 2021录用 。

  • 1. 背景
  • 2. 深度位置交叉网络(Deep Position-wise Interaction Network)
    • 2.1 基础模块(Base Module)
    • 2.2 深度位置交叉模块(Deep Position-wise Interaction Module)
    • 2.3 位置组合模块(Position-wise Combination Module)
  • 3. 实验
    • 3.1 实验设置
    • 3.2 离线评估
    • 3.3 服务性能
    • 3.4 在线评估
  • 4. 总结与展望
近些年来 , 由于人工智能技术的高速发展 , 所带来的公平性问题也愈发受到关注 。 同样的 , 广告技术也存在着许多公平性问题 , 由于公平性问题造成的偏差对广告系统的生态会产生较大的负面影响 。 图1所示的是广告系统中的反馈环路[1] , 广告系统通过累积的用户交互反馈数据基于一定的假设去训练模型 , 模型对广告进行预估排序展示给用户 , 用户基于可看到的广告进行交互进而累积到数据中 。 在该环路中 , 位置偏差、流行度偏差等各种不同类型的偏差会在各环节中不断累积 , 最终导致广告系统的生态不断恶化 , 形成“强者愈强、弱者愈弱”的马太效应 。
广告系统位置偏差的CTR模型优化方案
本文插图
图1 广告系统中的反馈环路 , 各种偏差被不断循环累积
由于偏差对广告系统和推荐系统的生态有着极大的影响 , 针对消除偏差的研究工作也在不断增加 。 比如国际信息检索会议SIGIR在2018年和2020年组织了一些关注于消除偏差主题的专门会议 , 同时也给一些基于偏差和公平性的论文颁发了最佳论文奖(Best Paper)[2,3] 。 KDD Cup 2020的其中一个赛道也基于电子商务推荐中的流行度偏差进行开展[1] 。
1. 背景
美团到店广告平台广告算法团队基于美团和点评双侧的广告业务场景 , 不断进行广告前沿技术的深入优化与算法创新 。 在大多数广告业务场景下 , 广告系统被分为四个模块 , 分别是触发策略、创意优选、质量预估以及机制设计 , 这些模块构成一个广告投放漏斗从海量广告中过滤以及精选出优质广告投放给目标用户 。 其中 , 触发策略从海量广告中挑选出满足用户意图的候选广告集合 , 创意优选负责候选广告的图片和文本生成 , 质量预估结合创意优选的结果对每一个候选广告进行质量预估 , 包括点击率(CTR)预估、转化率(CVR)预估等 , 机制排序结合广告质量以及广告出价进行优化排序 。 在本文中 , 我们也将广告称之为item 。