推荐算法进阶手册:2大篇章10大模块51份学习资料

推荐算法进阶手册:2大篇章10大模块51份学习资料
作者|刑无刀编辑|Monica

时至今日,推荐系统已然成了一门显学,个性化推荐成了互联网产品的标配。为此,我知道,好学的你肯定在收藏着朋友圈里流传的相关文章,转发着微博上的相关讨论话题,甚至还会不断奔走在各种大小行业会议之间,听着大厂职工们讲那些干货。

但,今天如果你足够幸运,能看到这篇文章,那你就不必如此麻烦地到处找,到处打听,到处参加各类线下活动来获取最前沿最有价值的信息。因为在这里,链家网资深算法专家刑无刀花费 3 个月的时间为你整理了 51 份推荐算法的学习资料,覆盖有“原理篇”、“工程篇”两大篇章,“近邻推荐”、“常见架构”、“深度学习”、“内容推荐”等十大模块,包含 Facebook 开源的文本处理工具 fastText 背后原理、YouTube 视频推荐系统在深度神经网络上的尝试、腾讯内部实时推荐系统架构的剖析等等案例。

当然,如果你订阅了极客时间上线的

《推荐系统 36 式》

,这些资料可能你早已获得并已阅读,获取里面的知识精华。

但现在也不晚,推荐算法入门干货今天都分享给你。

推荐算法入门干货集锦

(刑无刀语)在专栏写作的过程中,我阅读了很多业界公开的资料,我觉得有必要整理出来,供想深入阅读的人继续去找虐。

整体来说,在选择参考文献时,我偏爱那些由公司发表的。因为推荐系统本质上还是一种非常依赖实践的算法应用方向,并且,这些商业公司论文中的技术内容也在他们实际的场景中经过了检验。

现分享给大家。

我已经把这些资料整理一个压缩包中,并上传载百度云盘中,若想要以下全部资料,可在 InfoQ 后台回复:“推荐系统”。

推荐算法进阶手册:2大篇章10大模块51份学习资料

推荐算法进阶手册:2大篇章10大模块51份学习资料

原理篇(部分展示)

内容推荐

题目:Bag of Tricks for Efficient Text Classification

类型:论文

作者:Facebook

说明:

Facebook 开源的文本处理工具 fastText 背后原理。可以训练词嵌入向量,文本多分类,效率和线性模型一样,效果和深度学习一样,值得拥有。

题目:The Learning Behind Gmail Priority Inbox

类型:论文

作者:Google

说明:

介绍了一种基于文本和行为给用户建模的思路,是信息流推荐的早期探索,Gmail 智能邮箱背后的原理。

题目:Recommender Systems Handbook(第三章,第九章)

类型:书

作者:Francesco Ricci 等

说明:

这本书收录了推荐系统很多经典论文,话题涵盖非常广,第三章专门讲内容推荐的基本原理,第九章是一个具体的基于内容推荐系统的案例。

题目:文本上的算法

类型:网络文章 (网络免费版,已有成书《文本上的算法: 深入浅出自然语言处理》,内容更丰富)

作者:路彦雄

说明:

介绍了文本挖掘中常用的算法,及基础概念。内容涉及概率论,信息论,文本分类,聚类,深度学习,推荐系统等。

题目:LDA 数学八卦

类型:网络文章

作者:Rickjin(@靳志辉)

说明:

由浅入深地讲解 LDA 原理,对于实际 LDA 工具的使用有非常大的帮助。

近邻推荐

题目:Amazon.com recommendations: item-to-item collaborative filtering

类型:论文

作者:Amazon

说明:

介绍 Amazon 的推荐系统原理,主要是介绍 Item-Based 协同过滤算法。

题目:Item-Based Collaborative Filtering Recommendation Algorithms

类型:论文

作者:Badrul Sarwar 等

说明:

GroupLens 的研究团队对比了不同的 Item-to-Item 的推荐算法。

……

深度学习

题目:Deep Neural Networks for YouTube Recommendations

类型:论文

作者:Google

说明:

介绍 YouTube 视频推荐系统在深度神经网络上的尝试。能从中看到 wide&deep 模型的影子。

题目:Efficient Estimation of Word Representations in Vector Space

类型:论文

作者:Google

说明:

Word2Vec 的作者在这篇文章中提出了一种词嵌入向量学习方法,也就是把开源工具包 Word2Vec 背后的模型详细介绍了一次。理论上很简单,更多是一些工程技巧的分享。Word2Vec 给推荐系统带来了一种新的隐因子向量学习方法,深陷评分预测泥潭的矩阵分解被开拓了思路。

推荐算法进阶手册:2大篇章10大模块51份学习资料

可后台回复“推荐系统”领取

工程篇(部分展示)

常见架构

题目:Activity Feeds Architecture

类型:演示文稿

作者:Etsy

说明:

本文非常详细地介绍了社交动态信息流的架构设计细节。

题目:Beyond the 5 stars(Netflix Recommendations)

类型:网络文章

作者:Netflix

说明:

Netflix 详细宏观上介绍了自家推荐系统的产品形态,不只是比赛中的评分预测那么简单的。

推荐算法进阶手册:2大篇章10大模块51份学习资料

可后台回复“推荐系统”领取

关键模块

题目:Overlapping Experiment Infrastructure- More, Better, Faster Experimentation

类型:论文

作者:Google

说明:

ABTest 实验平台的扛鼎之作,Google 出品,值得拥有。

题目:TencentRec:Real-time Stream Recommendation in Practice

类型:论文

作者:腾讯

说明:

介绍了腾讯内部的实时推荐系统架构。

……

其他书目

  • Pattern Recognization and Machine Learning(机器学习基础,有此一本足够了)。

  • 推荐系统实践(国内唯一一本非翻译的推荐系统书籍,入门必选)。

  • 信号与噪声(介绍贝叶斯统计的一本科普书)。

  • 复杂(推荐系统面对的是复杂网络,了解复杂系统和复杂网络的特点,有助于开脑洞)。

  • 信息简史(既然是信息经济,当然要读一本关于信息的历史)。

  • 知道你们不会读的,所以就不推荐太多了。但愿我这个激将法有助于你学习进步。

    以上资料,可后台回复“推荐系统”,即可领取。

    欢迎大家订阅我的专栏 --《推荐系统 36 式》。山高水长,我们江湖再见。

    推荐算法进阶手册:2大篇章10大模块51份学习资料

    也可点击“

    阅读原文

    ”,订阅或浏览此专栏