本文建立情感倾向模型,进行文本情感倾向判断,首先,做商品评论情感分析,构建情感字典,建立情感倾向性分析模型,将小米10手机评论的情感分为积极情绪、中性情绪、消极情绪三种情感,分别占总体情绪分布的60.07%、17.91%、22.01%,
1. 情感词典构建
本文构造情感词、辅助词两个情感词典集,各个词典集之间的关系如下图所示 。
文章插图
图1 词典集结构关系图
首先,构造一个积极的基本情感词典,删除并合并极性为“1”的单词,记这些情感词典为“+1”,例如积极情感词典,积极评价词典和情感词汇本体 。然后形成一个否定的基本情感词典,删除并合并极性为“2”的单词,记这些情感词典为“-1”,例如消极情感词典,消极评价词典和情感词汇本体 。
2. 文本情感分析实现
情感倾向性将文本分为正面、负面、中性三种情感属性,通常由正、负面,以及强弱程度来衡量 。本文通过中文分词处理,基于情感词典构建情感表,为每一个分词打分,从而判断判别情感倾向,文本情感分析的流程如下图所示 。
文章插图
【评论(淘宝怎样评论)】图2 文本情感分析的流程图
构建情感字典后,导入情感分析表,为每一个语料评分,将小米10手机评论的情绪倾向分为正面,中性和负面情绪,其中正面,中性和负面情绪分别占总体分布的60.07%,17.91%和22.01%,以积极情绪占比最多 。
统计积极情绪分布情况,其中,一般(0—10)、中度(10—20)、高度(20以上)积极情绪分别占比33.02%、16.04%、11.01% 。
统计消极情绪分布情况,其中,一般(-10—0)、中度(-20—-10)、高度(-20以下)消极情绪分别占比19.40%、1.12%、0.00% 。
具体分析出来的结果如下表所示:
文章插图
文章插图
图3 情绪分布玫瑰图
积极情绪分段统计结果如下:
文章插图
文章插图
图4 积极情绪分布玫瑰图
消极情绪分段统计结果如下:
文章插图
文章插图
图5 消极情绪分布玫瑰图
猜你喜欢