在推荐系统中,我还有隐私吗?联邦学习:你可以有( 八 )


在推荐系统中,我还有隐私吗?联邦学习:你可以有
本文插图
表 3. FL-MV-DSSM 在 MovieLens 数据集上的推荐性能及其变体方法、已有联邦推荐算法的性能对比
此外 , 本文作者为了评估 FL-MV-DSSM 的冷启动性能 , 构建了三个冷启动实验场景:冷启动用户(CS-Users)、冷启动 item(CS-Items)和冷启动用户 item(CS-Users-Items) 。 对于冷启动用户 , 在模型训练过程中完全排除了 10% 的用户及其交互数据 , 并用剩余 90% 的用户及其交互数据学习模型参数 。 对于冷启动 item , 在模型训练期间 , 忽略 10%item 的随机子集 , 剩下 90% 的 item 学习模型参数 。 对于冷启动用户 item , 从模型训练中排除 10% 的用户和 item 的随机子集 , 并与其他用户、交互数据和 item 一起学习模型参数 。
表 4 给出了三次冷启动的实验结果 。 结果表明 , FL-MV-DSSM 在保持通用性的前提下 , 可以可靠地用于冷起动推荐系统 。 此外 , FL-MV-DSSM 对新用户具有良好的冷启动预测性能 , 这对于隐私保护的推荐服务具有重要的意义 。 然而 , 冷启动 item 和用户 item 的性能低于冷启动用户 。 作者认为 , 其原因可能是 , 在本文使用的实验数据集中 , 用户之间(考虑年龄、性别、职业等)的差异小于 item(电影标题、流派等)的差异 , FL-MV-DSSM 可以正确地了解这种差异并以更高的精度推荐 。
在推荐系统中,我还有隐私吗?联邦学习:你可以有
本文插图
表 4. FL-MV-DSSM 在 MovieLens 数据集上的冷启动推荐性能
本文提出了第一个通用的基于内容的联邦多视图框架 FL-MV-DSSM , 它可以同时解决冷启动问题和推荐质量问题 。 此外 , 本文还将传统的联邦设置扩展到了一个新的联邦多视图环境中 , 这可能会在推荐场景中启用新的 FL 模型 , 并带来新的安全挑战 。 针对这些安全挑战 , 本文还提出了一种新的解决方案来满足安全需求 。
五、本文小结
我们在这个联邦学习推荐系统的专题中具体讨论了联邦学习框架系列中的 “推荐系统” 问题 。 我们从第一个基于协作过滤 CF 的联邦推荐系统谈起 , 具体分析了其在推荐问题中的有效性 。 从作者原文给出的实验结果可以看出 , FCF 具有与 CF 相当的推荐性能 , 也就是说联邦学习的架构并未对推荐模型本身造成太多的影响 。
但是 , FCF 也存在一些问题 , 例如要求用户和 item 信息都是已知的 , 要求每个用户和每个 item 都参与到训练过程中来学习它们的嵌入等等 。 这些问题阻碍了 FCF 在实用场景中的推广 。 接下来 , 我们具体分析了在新闻学习中的联邦推荐系统 Fed-NewsRec , 它能够很好地解决 FCF 的上述问题 , 利用海量用户的行为数据训练出准确的新闻推荐模型 。
Fed-NewsRec 是专门为新闻推荐构建的方法 , 其中使用的新闻模型、用户模型都仅限于该领域 。 在第四节中 , 我们进一步分析了一个普适的基于内容的联邦多视图推荐框架 FL-MV-DSSM 。 该方法可以将用户和 item 映射到共享的语义空间 , 以便进一步实现基于内容的推荐 。 此外 , 该方法也是基于多视图进行模型训练的 , 能够进一步提升推荐系统的性能 。
当然 , 除了我们上述介绍的文章 , 还有很多基于矩阵分解(Matrix Factorization)、元学习(Meta-Learning)的联邦推荐系统也都在不同的实验、应用场景中获得了较好的效果 。 联邦推荐系统具有很好的、巨大的应用前景 , 我们将会在联邦学习系列专题中继续关注和报道相关的研究进展 。
机器之心联邦学习系列文章:
《打破数据孤岛:联邦学习近期重要研究进展》
《当传统联邦学习面临异构性挑战 , 不妨尝试这些个性化联邦学习算法》
《联邦学习 OR 迁移学习?No , 我们需要联邦迁移学习》