新闻个性化推荐系统源代码系列之推荐流程设计( 二 )
4. 多路召回
基于模型的离线召回 我们可以根据用户的历史点击行为来预测相似用户 , 并利用相似用户的点击行为来预测对文章的偏好得分 , 这种召回方式称为 u2u2i 。 获取用户历史点击行为数据 , 利用 ALS 模型计算得到用户对文章的偏好得分及文章列表 , 读取并过滤历史召回结果 , 防止重复推荐 , 将过滤后的偏好得分最高的 K 篇文章存入 Hbase 的召回结果表中 , key 为 als , 表明召回类型为 ALS 模型召回 , 并记录到 Hbase 的历史召回结果表 。
基于内容的离线召回 我们可以根据用户的历史点击行为 , 向用户推荐其以前喜欢的文章的相似文章 , 这种方式称为 u2i2i 。 读取用户历史行为数据 , 获取用户历史发生过点击、阅读、收藏、分享等行为的文章 , 接着读取文章相似表 , 获取与发生行为的每篇文章相似度最高的 K 篇文章 , 然后读取并过滤历史召回结果 , 防止重复推荐 , 最后将过滤后的文章存入 Hbase 的召回结果表中 , key 为 content , 表明召回类型为内容召回 , 并记录到 Hbase 的历史召回结果表 。
基于内容的在线召回 和上面一样 , 还是根据用户的点击行为 , 向用户推荐其喜欢的文章的相似文章 , 不过这里是用户实时发生的行为 , 所以叫做在线召回 。 读取 Kafka 中的用户实时行为数据 , 获取用户实时发生点击、阅读、收藏、分享等行为的文章 , 接着读取文章相似表 , 获取与发生行为的每篇文章相似度最高的 K 篇文章 , 然后读取并过滤历史召回结果 , 防止重复推荐 , 最后将过滤后的文章存入 Hbase 的召回结果表中 , key 为 online , 表明召回类型为在线召回 , 并记录到 Hbase 的历史召回结果表 。
基于热门文章的在线召回 读取 Kafka 中的用户实时行为数据 , 获取用户当前发生点击、阅读、收藏、分享等行为的文章 , 增加这些文章在 Redis 中的热度分数 。
基于新文章的在线召回 读取 Kafka 中的实时用户行为数据 , 获取新发布的文章 , 将其加入到 Redis 中 , 并设置过期时间 。
5.排序
不同模型的做法大致相同 , 这里以 LR 模型为例 。
基于 LR 模型的离线训练 读取 Hive 的用户历史行为数据 , 并切分为训练集和测试集 , 根据其中的用户 ID 和文章 ID , 读取 Hbase 的用户特征数据和文章特征数据 , 将二者合并作为训练集的输入特征 , 将用户对文章是否点击作为训练集的标签 , 将上一次的模型参数作为 LR 模型的初始化参数 , 进行点击率预估训练 , 计算得出 AUC 等评分指标并进行推荐效果分析 。
基于 LR 模型的在线排序 当推荐中心读取 Hbase 的推荐结果表无数据时 , 推荐中心将调用在线排序服务来重新获取推荐结果 。 排序服务首先读取 Hbase 的召回结果作为测试集 , 读取 Hbase 的用户特征数据和文章特征数据 , 将二者合并作为测试集的输入特征 , 使用 LR 模型进行点击率预估 , 计算得到点击率最高的前 K 个文章 , 然后读取并过滤历史推荐结果 , 防止重复推荐 , 最后将过滤后的文章列表存入 Hbase 的推荐结果表中 , key 为 lr , 表明排序类型为 LR 排序 。
6. 推荐中心
流量切分(ABTest) 我们可以根据用户 ID 进行哈希分桶 , 将流量切分到多个桶 , 每个桶对应一种排序策略 , 从而对比不同排序策略在线上环境的效果 。
推荐数据读取逻辑 优先读取 Redis 和 Hbase 中缓存的推荐结果 , 若 Redis 和 Hbase 都为空 , 则调用在线排序服务获得推荐结果 。
兜底补足(超时截断) 当调用排序服务无结果 , 或者读取超时的时候 , 推荐中心会截断当前请求 , 直接读取 Redis 中的热门文章和新文章作为推荐结果 。
【新闻个性化推荐系统源代码系列之推荐流程设计】合并信息 合并物品基础信息 , 将包含完整信息的物品推荐列表返回给客户端 。
- 智能手机|斗球新闻:Reliance Jio与Vivo合作在印度推出Jio独家智能手机
- 美国|知名科技博主:“想法采用曲线”与新闻媒体的未来
- 新闻记者|媒体融合背景下新闻记者如何转型
- 短板|年底换机好推荐,真无短板机称号iQOO 5拿下了
- 最新|2020年12月最新购机推荐,这六款各有优点,实用党首选
- 持续|十一月推荐手机系列,iQOO今年多款机型热度持续
- 极客|极具黑科技含量的AI录音笔推荐:搜狗AI录音笔S1,极客最爱
- 算法|为什么长视频没有强算法推荐的产品
- 效果|这个让你相见恨晚的技巧,能让PPT排版更加有设计感,推荐学习
- 于无声处听好声,三款颈挂式降噪蓝牙耳机推荐