「」一文梳理主流的排序模型,浅谈深度学习在花椒直播排序算法中的应用( 五 )
本文插图
传统的CVR任务 , 只考虑从浏览到转化的过程 , 即
本文插图
而本模型还考虑了点击的过程 , 并引入了浏览转化率(pCTCVR)的概念 , 即为在浏览的条件下既点击又转化的概率 , 即
本文插图
也就是下面的公式:
本文插图
根据这个公式设计的模型如下图:
本文插图
- 用两个任务共享底层embedding的方式 , 然后将各自的logit进行相乘来拟合pCTCVR的过程 。
本文插图
模型特点:
在全样本空间进行建模 , 避免了“样本选择偏差”问题 , 充分利用了业务数据 。
共享底层embedding向量 , 因为推荐中转化率是很低的 , 对应的数据很少 , 这种共享特征表示的机制使CVR网络也能够从只曝光没点击的样本中更新embedding向量 , 有利于缓解CVR训练数据稀疏的问题 。
ESMM中的子网络可以不止局限于本文中的MLP , 可以随意替换成其他模型 , 也就是说本文为我们提供了一种可扩展的多任务模型架构 。 阿里后面还有一篇
本文插图
的论文也是类似的套路 。
MMOE
本文插图
论文指出:一般的多任务模型结构如上图(a)所示 , 即对于不同的任务 , 底层的参数和网络结构是共享的 , 然后上层经过不同的神经网络得到对应任务的输出 , 缺点是模型的效果取决于任务的相关性 , 如果多任务之间关联较小 , 采用这种结构甚至会出现互相拖后腿的情况 。
因此本论文提出了基于图(b)的OMOE和图(c)的MMOE两种结构 , 主要思路是每个任务有一个独立的expert中间网络 , 类似于“开关”的功能 , 通过模型学习 , 不同的任务可以从相同的底层embedding中提取到侧重点不同的特征 , 而不是完全共享底层 , 即达到了“各取所需”的效果 , 有点类似于上面提到的attention网络 。
之后每个任务接各自的tower模型 , 得到logit , 再和label一起计算loss , 然后多目标的loss直接可以用类似weighted sum的方式结合起来组成总的loss 。
小结
推荐系统的多任务模型 , 虽然是排序模型的一大发展趋势 , 但多目标学习的难处在于 , 每个目标的样本比例是不同的 , 训练时如何融合loss、何时停止训练以及线上各目标的分数如何组合、A/B test如何衡量总体效果等方面 , 都要经过比较复杂的衡量和考虑 , 这些都还有很大的发展空间 , 需要我们来尝试 。
三、排序模型在花椒直播中的实践
近两年来 , 花椒直播紧跟业界潮流 , 在排序阶段进行了多种多样的尝试 , 如(GBDT+)LR , Wide&Deep , (x)DeepFM , DIN , ESMM , MMOE等 。 下面以Wide&Deep模型为例 , 简单介绍下我们的整个排序系统 。
本文插图
首先是离线部分 , 我们主要用spark/hdfs来处理、存储数据 。 主要包括用户数据、主播数据、实时数据、行为序列等等 。 下面是我们用到的部分特征:
- [悠家娱乐]三年负债降至4000亿!一文读懂恒大战略转型的深层逻辑
- 海外网@美国疫情为何大面积暴发?美智库梳理3个月来政府应对失误
- 中商情报网:一文了解石墨烯是什么?我国口罩产能有多大?,新型石墨烯口罩面世
- 【腾讯】一文读懂腾讯会议在复杂网络下如何保证高清音频
- 【掘金企服】一文看懂,阿里京东的“共享员工”怎么玩?点进来
- 『跨境电商』跨境物流的几种模式|跨境电商全球开店
- 跳槽那些事儿@阿里京东的“共享员工”怎么玩?点进来,一文看懂
- 【物理】自然界中湍流无处不在,但现在才终于揭示:主动湍流的普遍性质!
- Wind资讯@全面梳理细分领域新风向,新基建5年
- 万得资讯■全面梳理细分领域新风向,新基建5年