推荐算法进阶手册:2大篇章10大模块51份学习资料
作者|刑无刀编辑|Monica
时至今日,推荐系统已然成了一门显学,个性化推荐成了互联网产品的标配。为此,我知道,好学的你肯定在收藏着朋友圈里流传的相关文章,转发着微博上的相关讨论话题,甚至还会不断奔走在各种大小行业会议之间,听着大厂职工们讲那些干货。
但,今天如果你足够幸运,能看到这篇文章,那你就不必如此麻烦地到处找,到处打听,到处参加各类线下活动来获取最前沿最有价值的信息。因为在这里,链家网资深算法专家刑无刀花费 3 个月的时间为你整理了 51 份推荐算法的学习资料,覆盖有“原理篇”、“工程篇”两大篇章,“近邻推荐”、“常见架构”、“深度学习”、“内容推荐”等十大模块,包含 Facebook 开源的文本处理工具 fastText 背后原理、YouTube 视频推荐系统在深度神经网络上的尝试、腾讯内部实时推荐系统架构的剖析等等案例。
当然,如果你订阅了极客时间上线的
《推荐系统 36 式》
,这些资料可能你早已获得并已阅读,获取里面的知识精华。但现在也不晚,推荐算法入门干货今天都分享给你。
推荐算法入门干货集锦
(刑无刀语)在专栏写作的过程中,我阅读了很多业界公开的资料,我觉得有必要整理出来,供想深入阅读的人继续去找虐。
整体来说,在选择参考文献时,我偏爱那些由公司发表的。因为推荐系统本质上还是一种非常依赖实践的算法应用方向,并且,这些商业公司论文中的技术内容也在他们实际的场景中经过了检验。
现分享给大家。
我已经把这些资料整理一个压缩包中,并上传载百度云盘中,若想要以下全部资料,可在 InfoQ 后台回复:“推荐系统”。
原理篇(部分展示)
内容推荐
题目:Bag of Tricks for Efficient Text Classification类型:论文
作者:Facebook
说明:
Facebook 开源的文本处理工具 fastText 背后原理。可以训练词嵌入向量,文本多分类,效率和线性模型一样,效果和深度学习一样,值得拥有。
题目:The Learning Behind Gmail Priority Inbox类型:论文
作者:Google
说明:
介绍了一种基于文本和行为给用户建模的思路,是信息流推荐的早期探索,Gmail 智能邮箱背后的原理。
题目:Recommender Systems Handbook(第三章,第九章)类型:书
作者:Francesco Ricci 等
说明:
这本书收录了推荐系统很多经典论文,话题涵盖非常广,第三章专门讲内容推荐的基本原理,第九章是一个具体的基于内容推荐系统的案例。
题目:文本上的算法类型:网络文章 (网络免费版,已有成书《文本上的算法: 深入浅出自然语言处理》,内容更丰富)
作者:路彦雄
说明:
介绍了文本挖掘中常用的算法,及基础概念。内容涉及概率论,信息论,文本分类,聚类,深度学习,推荐系统等。
题目:LDA 数学八卦类型:网络文章
作者:Rickjin(@靳志辉)
说明:
由浅入深地讲解 LDA 原理,对于实际 LDA 工具的使用有非常大的帮助。
近邻推荐
题目:Amazon.com recommendations: item-to-item collaborative filtering类型:论文
作者:Amazon
说明:
介绍 Amazon 的推荐系统原理,主要是介绍 Item-Based 协同过滤算法。
题目:Item-Based Collaborative Filtering Recommendation Algorithms类型:论文
作者:Badrul Sarwar 等
说明:
GroupLens 的研究团队对比了不同的 Item-to-Item 的推荐算法。
……
深度学习
题目:Deep Neural Networks for YouTube Recommendations类型:论文
作者:Google
说明:
介绍 YouTube 视频推荐系统在深度神经网络上的尝试。能从中看到 wide&deep 模型的影子。
题目:Efficient Estimation of Word Representations in Vector Space类型:论文
作者:Google
说明:
Word2Vec 的作者在这篇文章中提出了一种词嵌入向量学习方法,也就是把开源工具包 Word2Vec 背后的模型详细介绍了一次。理论上很简单,更多是一些工程技巧的分享。Word2Vec 给推荐系统带来了一种新的隐因子向量学习方法,深陷评分预测泥潭的矩阵分解被开拓了思路。
可后台回复“推荐系统”领取
工程篇(部分展示)
常见架构
题目:Activity Feeds Architecture类型:演示文稿
作者:Etsy
说明:
本文非常详细地介绍了社交动态信息流的架构设计细节。
题目:Beyond the 5 stars(Netflix Recommendations)类型:网络文章
作者:Netflix
说明:
Netflix 详细宏观上介绍了自家推荐系统的产品形态,不只是比赛中的评分预测那么简单的。
可后台回复“推荐系统”领取
关键模块
题目:Overlapping Experiment Infrastructure- More, Better, Faster Experimentation类型:论文
作者:Google
说明:
ABTest 实验平台的扛鼎之作,Google 出品,值得拥有。
题目:TencentRec:Real-time Stream Recommendation in Practice类型:论文
作者:腾讯
说明:
介绍了腾讯内部的实时推荐系统架构。
……
其他书目
Pattern Recognization and Machine Learning(机器学习基础,有此一本足够了)。
推荐系统实践(国内唯一一本非翻译的推荐系统书籍,入门必选)。
信号与噪声(介绍贝叶斯统计的一本科普书)。
复杂(推荐系统面对的是复杂网络,了解复杂系统和复杂网络的特点,有助于开脑洞)。
信息简史(既然是信息经济,当然要读一本关于信息的历史)。
知道你们不会读的,所以就不推荐太多了。但愿我这个激将法有助于你学习进步。
以上资料,可后台回复“推荐系统”,即可领取。
欢迎大家订阅我的专栏 --《推荐系统 36 式》。山高水长,我们江湖再见。
也可点击“
阅读原文
”,订阅或浏览此专栏- 4大民间最猛减肥偏方+网友推荐月瘦30斤秘方,不瘦才怪!
- 专注尿道修复技术 世界顶尖专家推荐上海六院Dr.Fu
- 吃100瓶胶原蛋白不如敷1次猪皮面膜,自用3年的好物诚意推荐
- 明天周五,推荐28道香喷喷的下饭菜,素菜也能吃下两大碗饭!
- 中医师承从什么书读起?97位名老中医联合推荐!
- 美食推荐:豆腐皮超好吃20种吃法,出锅满屋飘香
- @黄山想买二手车的,这有5辆不同车子推荐(附实拍图)
- 【推荐】国画圣经,孕育出无数国画大师!
- 【9月4日】吕梁推荐招聘信息
- 孩子们开学了推荐几种不重样的早餐,不在为吃什么而犯愁