人间悲欢不相通出自(蜉蝣为什么要比喻爱情)

内容提要:社交媒体逐渐成为当今人们生活的一部分,而它也成为心理学家们进行研究的重要数据来源 。与此同时,研究者也尝试利用自然语言处理、机器学习技术,来预测社交媒体用户的情绪波动 。

原创:HyperAI超神经

关键词:自然语言处理 心理学

去年突如其来的新冠疫情,深刻地影响着人们的生活 。这一特殊的历史时期,社会大众的心理都变得敏感脆弱 。

疫情期间减少外出和接触,使得民众把更多时间花在社交网络上 。有些人不可避免地将工作和生活中的不如意,通过网络发泄给了别人 。恐慌、焦虑、悲伤、无助等不良情绪也有所加重 。


人间悲欢不相通出自(蜉蝣为什么要比喻爱情)

文章插图
面对突发公共事件,社交媒体用户普遍出现了包括愤怒、害怕、担心、迷惘、悲伤等负面情绪

据调查显示,全球互联网用户平均每天花在社交媒体上的时间,达到 2 小时 22 分钟,社交媒体已经不限于社交功能,它们还成为了很多人记录心情、倾诉心事的阵地 。

无论是国内的微信朋友圈、微博、QQ 空间等,还是国外的 Twitter、Instagram、Facebook,都承载了万千用户的状态 。

而对于心理学研究者来说,这些社交媒体上的帖子,无疑为其提供了数量可观的研究数据 。

来自斯坦福大学的研究员 Johannes Eichstaedt 和密歇根大学的 Aaron Weidman,在其最新研究中,使用自然语言处理工具,对 Facebook 用户的帖子进行分析 。

研究表明,机器学习模型可以通过社交媒体洞察一个人的情绪与波动,其准确度与传统心理学的度量结果相当 。

从字里行间,读懂你的喜怒哀乐近年来,网络上的大量资料,已经成为人格科学中一个重要的数据来源 。大量的研究表明,使用社交媒体资料,对人格相关维度进行分类十分有效 。

Eichstaedt 和 Weidman 的最新研究,则为利用社交媒体大数据分析、跟踪人的心理状态,提供了一个前沿案例 。


人间悲欢不相通出自(蜉蝣为什么要比喻爱情)

文章插图
使用社交媒体语言跟踪心理状态的波动:基于每周情绪波动的案例研究

取样校准

作者使用「效价」和「唤起」这两个基本情绪维度,来评价 Facebook 上帖子的情绪 。

注:「效价」和「唤起」是心理学中评价情绪的两个维度,前者表示感受到的积极/消极程度,区分正面和负面情绪;后者表示冷静/兴奋的程度 。

他们首先让已经有心理学研究基础的人类研究助理,给一项早期研究中的 2895 条公开 Facebook 帖子做注释 。

研究助力给每一条帖子的「效价」(valence)和「唤醒」(arousal)进行打分 。采用 9 分制(对于「效价」,1=「消极」,9=「积极」,同样地,对于「唤起」,1=「低」,9=「高」) 。


人间悲欢不相通出自(蜉蝣为什么要比喻爱情)

文章插图
心理学研究助理为帖子所作出的「效价」和「唤起」注释

该情绪跟踪数据集已经公开:https://osf.io/pbjer/files/

完成这些评价之后,这些帖子被用于训练机器学习模型,该模型将能够预测哪种语言传达了哪种情感 。

然后作者对这些评分数据进行了一系列模型的拟合,每一个模型都显示,「效价」和「唤起」之间可能存在的明显联系 。

对于国内的 NLP 研究者来说,中文情感分析数据集则更为适用 。因此,超神经为大家推荐一个来自 2014 NLPCC 的中文微博情感分析数据集 。

该评测数据来自新浪微博,对于输入的整条微博,任务要求判断出该微博是否包含情绪 。对包含情绪的微博,要求判别其情绪分类输出为 anger(愤怒)、disgust(厌恶)、fear(恐惧)、happiness(高兴)、like(喜好)、sadness(悲伤)、surprise(惊讶) 。

数据集详细信息如下:


人间悲欢不相通出自(蜉蝣为什么要比喻爱情)

文章插图
下载地址: