你是怎样突破「信息茧房」的( 七 )


我理解推荐系统本质是解决了人,物,场的关系和协同问题,大大的缩短了人与物的链接路径,建立了基于多维内容标签的检索路径,和搜索一样,都是解决信息过载问题,让人们更便捷准确的获取信息。
下边这个视频很好地介绍了什么是信息茧房,以及为什么推荐算法能解决信息茧房这个问题:

你是怎样突破「信息茧房」的
https://www.zhihu.com/video/1181180824517619712二,推荐系统如何破除信息茧房:
推荐系统的核心就是数据+算法,说到数据,随着大数据场景的丰富,获取的数据越来越多,越来越精准,比如在app中我们的每一个行为,都可以认为是事件和属性,比如浏览 点击,收藏,评论等等,也就是用户的行为数据。每一个用户又有一些自然属性比如教育 年龄 性别等等。而具体的物 又可以是商品属性和特性,内容的属性和特征等等;场,物所在的时间和空间,比如地理位置 手机品牌 网络连接等等。有了这些人物场的属性和特征数据,我们可以设计和验证不同推荐理由,给用户不同的体验。
今天,以今日头条为代表的算法主导下的内容平台,也开始饱受茧房论批评,但稍了解其内容分发模式即可知道,它其实是这场进化过程中的又一次加速。
与批评者的猜测相反,算法平台不可能「观众爱看什么就一直给他们什么」,它们和网络诞生以来的一切成功者一样,需要不断为用户带来他们自己都还不知道会感兴趣的新鲜内容,才能保证用户的长期使用。
具体操作中,这是通过「协同过滤」、或者说「模型泛化」来实现的。
这些概念的意思是,为了满足用户动态、变化的需求,在为其推荐内容时,除了考虑他们的历史行为,还要分析不同用户间的相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似等,以扩展推荐的探索能力,为用户提供很可能会激起他们兴趣的新鲜信息。
根据今日头条公开介绍过的「协同推荐」算法机制,如果A用户的兴趣标签里有科技、财经和娱乐,而B用户的标签有科技、财经,系统会尝试将娱乐内容推送给B。用户给出良性反应后,便向他们推荐新的内容,再进一步扩大试探范围。
其中大家最熟悉的协同过滤又分为基于用户的协同过滤和基于物品的协同过滤。简单的理解就是以先找到和用户A有相似兴趣的用户C,然后将这个用户C感兴趣的物品、而目标用户A还没有查看或者购买的物品D推荐给用户A。下图表示: 红色的表示浏览。

你是怎样突破「信息茧房」的

那简化的公式就是: