学术探索 已发表论文 版本 1 Vol 3 (6) 2018
下载
基于情感模型的评论情绪挖掘与分析——以豆瓣书评为例
Emotion Mining and Analysis of Comments Based on Emotional Model——A Case Study on Book Reviews of Douban
: 2018 - 09 - 07
: 2018 - 11 - 22
105 0 0
摘要&关键词
摘要:[目的/意义] 旨在探索从非结构化用户生成内容中提取及可视化用户情绪的方法,从感知层面深入分析用户生成的内容,对其应用前景进行探讨与展望。[方法/过程] 以豆瓣网站书籍评论为分析对象,借助中文领域的情绪词典与LDA隐主题建模方法实现细粒度情感要素提炼,并采用可视化技术对评论内容中反映的情绪要素进行分析。[结果/结论] 研究发现,主题分析法和词典法均能有效提炼评论内容中的用户情感要素,但存有差异,情感主题建模能够提供更细腻的用户情绪以及感知信息。通过应用场景的微调,本研究所涉及方法可应用于体验型产品推荐等多种形式的评论感知效用挖掘任务。
关键词:用户生成内容;情绪感知;评论挖掘;信息可视化
Abstract & Keywords
Abstract: [Purpose/significance] This study aims to explore the methods on extracting and visualizing users’ emotions from unstructured user-generated content, analyze user-generated content from a perceptual level, and discuss the related application prospects. [Method/process] The research took book reviews of Douban as analysis object. Emotional dictionary in Chinese domain and LDA latent topic model were used to refine the fine-grained emotional elements. And further, visualization techniques helped to analyze the emotional elements reflected in the review content. [Result/conclusion] The study found that both latent topic model and emotion dictionary can effectively extract the user emotion elements in the content of the review, even though some difference still exists, such as the emotional topic model can provide more exquisite results. By fine-tuning the application scenario, the methods used in this study can be applied to various forms of perceived utility mining tasks about reviews, like experience-based products recommendation.
Keywords: user-generated content; emotion perception; review mining; information visualization
1   引言
随着用户生成内容的急剧增长,情感分析的理论研究和实践应用越来越普遍。广义情感分析,是通过识别、抽取和分类等方法对文本表达观点、情感、情绪以及态度的计算研究[1],涵盖主客观分析、态度分析、情绪分析、观点挖掘等一系列研究任务,被广泛应用于舆情监控[2]、市场预测[3]、客户满意度调查等多个领域。
整体来看,情感分析研究经历了从篇章到语句、从词频到主题、从两极情感到多维情绪等一系列转变。但多数情感分析研究主要还是褒贬倾向的判断,关于情感程度量化以及情感状态(如快乐、愤怒、焦虑、悲伤等)的分析仍比较少见,尤其在中文领域。英文领域在这方面有更多积极的探索,如以下代表性研究关注了细粒度情感状态(或称情绪)对用户评论感知有用性的影响:L. Martin与P. Pu[4]证明了情绪特征对评论质量预测起积极作用;A. Felbermayr与A. Nanopoulos[5]的研究则指出细粒度的情绪特征,对评论感知有用性的影响力显著高于其他结构类文本特征要素;D. Yin等[6]发现“焦虑”会显著提升评论的感知有用性,“愤怒”则不然。这些最新研究均指出:蕴含在用户生成内容中的更细化的情感状态会对接收者的感知与行为产生显著而直接的影响,细粒度情感对用户评论的生成、传播及有效利用的作用不容忽视。
笔者围绕这一研究主题,以中文领域用户书评为分析对象,探讨从书评中提炼细粒度情感的方法,通过引入LDA模型来建立书评的情感主题,并可视化用户生成内容中的情感状态。另外,本研究也以文学作品评论的情绪分析为例,展望细粒度情感分析的应用前景。
2   相关研究
2.1   情感分析与情绪词典
早期的情感分析以篇章为分析粒度,情感只考虑正负两种状态。后续的研究深入语句,除了情感极性,开始进一步强调情感程度,同时关注情感对象,乃至上下文情境。史伟等[7]借助自建的模糊情感本体来识别手机与婚纱摄影评论中的产品特征、辨别情感极性,并通过引入修饰词等语义元素,精细化情感强度计算;聂卉[8]针对数码商品评论,借助隐主题模型凝聚用户观点,同时利用句法分析进行情感量化,实现了商品在线口碑的凝练与汇总;金燕[9]探索情感因素对微博中的用户生成内容质量的影响,在积极(正向)、中性、消极(负向)情感量化基础上再将正负情感各自细分为高、中、低三档,引入研究模型,进而使用ROST内容挖掘系统进行情绪分析处理。
随着情感分析研究的深入,研究者借鉴心理学领域的研究,开始将正负情感细化为情绪特征。心理学领域对“情绪(emotion)”有明确的界定,R. Bagozzi等[10]认为情绪是 “人们对事件进行认知评论所产生的精神状态”,“具体、来源明确并能导致特定行为倾向”。依据对“情绪”的认知,心理学领域的学者提出了“情绪”模型。其中,最具代表的Plutchink情感模型[5]将8个基本情感类描绘成著名的“情绪轮盘(Wheel of Emotions)”。情感模型在心理学领域有着广泛的应用。
心理学理论研究促进了情绪词典的发展。在英文领域,普遍公认的是NRC (National Research Council Canada)词典。借助情绪词典,细粒度情绪分析得以开展。R. Ullah等[11]利用SentiWordNet情绪词典对亚马逊上17种产品评论中的用户情绪分布进行了深入分析。L. Martin与P. Pu[4]基于GALC情绪词典等探究情绪变量对多种评论质量的预测效果,发现多维情绪分析效果较二维情感极性分析效果更好。在中文领域,大连理工大学信息检索实验室中文情感词汇本体(http://ir.dlut.edu.cn/)参考Ekman情感模型[12]将情感分为乐(joy)、惧(fear)、惊(surprised)、哀(sadness)、恶(disgusted)、怒(anger)和好(goodness)7个大类21个小类,在情感分析领域应用广泛。曹宇等[13]则从表情符号入手,通过识别语句中的情感词,同时结合《同义词词林》,实现了对现有多元情感本体库的扩充。
2.2   评论分析
产品评论是评论分析的主要对象。产品评论根据产品类型区分为搜索型(以电子产品为代表)与体验型(以电影图书为代表)两类评论[14],其中前者关注产品特点,偏向使用客观指标描述,而后者关注用户参与感受,偏向主观感知描述,含有大量个人感受及体验的描述,情感内容丰富。S. M. Mudambi与D. Schuff[14]研究了评论长度,用户星级评价对评论感知有用性的影响,发现使用体验型产品评论与搜索型产品评论所分析得出的结论不同;A. Ghose与P. G. Ipeirotis[15]研究了语法错误、词语、句子长度等可读性要素对影评质量的影响;J. H. Lee等[16]关注的是情感的作用,发现删除负面评论对提升电影票房作用不大;M. Ko等[17]基于影评内容中的细节,筛选具有正向情感的关键特征,进行影片的精细化推荐。在这些研究中,情感指标常以用户评分为代表或通过褒贬词汇统计来获得。
在国内研究中,体验型产品评论分析主要以评论质量影响因素分析、信息抽取及意见挖掘为主题。殷国鹏等[18]引入了评论人特征,以从众视角探索包括基于评论星级的用户情感在内的多种电影评论要素对评论感知有用性的影响;薛博召[19]基于文本挖掘工具Ling Pipe,将亚马逊书评数据中的情感特征细化为正向情感差异、主观表达度、评论评分与产品评分差异等若干指标,引入研究模型;张丽等[20]通过对当当网书评高频词的人工辨识,从情感强度、主客观表述、评价、图书内容等维度对书评内容进行用户关注度分析,发现最受关注的是图的内容;祝振媛[21]分析亚马逊上不同类型书籍的评论,基于分类、句法分析与SentiWordNet情绪词典从评论中提炼内容、情感倾向、读者、评论人等共9类要素,经过量化整合,生成书评摘要。可以看到,相关研究对书评或影评这类体验型产品评论的挖掘进行了深入探索。只是这类研究侧重考量的评论特征宽泛,内容之外的因素较多,内容部分涉入则不深。更没有专门基于内容,针对细粒度主观情绪的分析和研究。
3   研究核心与框架
作为针对主观性文本的分析任务,本研究的重点是基于内容的情感要素的分析。旨在探索从评论内容中提炼“情绪”的方法,并以用户感知为视角对书评进行情感主题分析。这一研究是对中文领域情感分析研究的拓展,通过案例分析,对细粒度情感分析的应用前景进行展望。
研究选择豆瓣网(https://www.douban.com/)的长篇幅书评为分析数据,主要围绕解决3个核心问题展开:①如何有效提炼文本内容中的情绪特征;②如何凝练情绪特征,构建基于评论内容的情感模型;③如何可视化评论内容中蕴含的用户情感与主题。
整个研究流程分数据采集、预处理、情感与情绪特征提取、情感主题建模、情感主题描述及可视化6个模块,如图1所示。采集模块选择第三方评论网站为数据源,并于采集阶段对采集数据进行基于票数与有用性的评论质量过滤,以减少噪音,确保后期建模效果。其次,对原始语料进行分句/分词、停用词过滤、词性标注等预处理。情感与情绪特征的识别分别通过基于词性的过滤以及基于情感与情绪词典的比对实现。而已识别的情感与情绪特征将进一步用于情绪分类的计算以及情感主题的构建,并汇总各类特征结果,以可视化形式输出,从而实现从自然语言形式的评论信息到结构化商品特性的凝练。


图1   研究流程及框架
4   研究方法
4.1   情感理论与情绪词典
情绪代表着人的主观感受与想法[22]。由于人的感情的复杂性,情绪分类一直是相关研究探讨的重点。著名的Plutchik情绪轮盘[5],将情绪分为生气(anger)、厌恶(disgust)、恐惧(fear)、悲伤(sadness)、期待(anticipation)、快乐(joy)、惊讶(surprise)、信任(trust)8个基本类型,两两相对(如快乐—悲伤),且情感程度不同。复杂情绪派生于基本情绪,如兼具“快乐”和“信任”的情感就是“爱(love)”。依据情感理论,情感与情绪词典应运而生。在中文领域,大连理工大学的“中文情感词汇本体”与NRC词典情感结构近似,标注完整,是目前应用较广的中文情感/情绪词典。该词汇本体在借鉴Ekman情感模型[12]的6类情绪分类(即乐(joy)、惧(fear)、惊(surprised)、哀(sadness)、恶(disgusted)、怒(anger))的基础上增添了“好(goodness)”,“好”类词汇再进一步细分为一组正向的情感状态,包括尊敬、赞扬、相信、喜爱等。整个词典涵盖词条27 466个,分7个大类、21个小类,且每个词条详细标注了词性、情感类型、情感强度和极性等属性。笔者利用中文词典采用匹配方式从评论内容中的辨别情感词,并依据其在词典中的情感归属进行分类统计,获得基于评论内容的情绪状态分布。


图2   普拉切克的情绪轮盘(Wheel of Emotions)[5]
4.2   LDA隐主题模型
LDA (Latent Dirichlet Allocation)是一个多层产生式概率模型,包含词、主题和文档3个层次。在LDA模型中,D为文档集(|D|=N),W为词集(|W|=M),表示隐主题(||=K)。文档dDi 随机混合生成,表示成词集上的序列模式d{w1 ,w2 ,…,wi ,…},wiW;而主题i (i=1,2,…,K)则是W上的多项式分布,LDA的图模型如图3所示:


图3   LDA的图模型表示[8]
是模型的重要参数。与主题的先验分布Dirichlet有关,反映文档集D中隐主题的相对强度;刻画主题自身的概率分布。在主题层,i (i=1,2,…,K )为“主题—词”分布,由K×M的矩阵参数化。在文档层,d (d=1,2,…,N)为“文档—主题”分布,表征文档d在主题空间上的分布,由确定;在词层,zi (i=1,2,…,M)表示文档d分配在每个词项上隐主题分量,服从参数为d 的多项式分布。构造LDA模型的核心是推断隐变量,即确定。在已知文档集词分布W的前提下,逆向推导zi (i=1,2,…,M),进而推断t (t=1,2,…,K )和d (d=1,2,,N )。模型构建涉及多个未知量,一般采用近似方法求解,如利用Gibbs抽样估计w的主题分布[8]
本研究借助“中文情感词汇本体”,提取情感词,构造基于情感词序列的评论描述。再利用LDA隐主题模型对评论集进行情感主题分析,挖掘评论内容中的用户情绪。
4.3   情绪可视化
可视化作为一种能够直观展现数据特征的方法,为人们整合海量数据并从中提炼模式与规律提供了便利。信息可视化模型很多,较经典的是S. K. Card提出的信息可视化参考模型[23](见图4)。信息可视化参考模型涉及数据收集、数据处理与变换、可视化映射以及人体视觉感知4部分。可视化映射是转换过程的关键。可视化技术根据数据对象特征进行开发,基础的统计可视化方法包括条形图、饼图、雷达图等,而关注于如何形象展现文本中的语义特征以及这些语义特征随时间的演变规律等的文本可视化方法则有静态的词云以及动态的主题河等。
本研究涉及的可视化技术包括基于统计的条形图、饼图以及基于文本的词云与主题聚类可视化。对于主题聚类可视化,笔者应用了LDAvis[24]。LDAvis是C. Sievert与K. E. Shirley基于R语言开发的一个交互式LDA隐主题建模结果可视化工具,可动态展现LDA隐主题聚类的直观效果,采用交互方式调整参数,观察主题汇聚效果及主题上关键词项的分布。


图4   S. K. Card的信息可视化参考模型[23]
5   实验与分析
本研究以书评为对象,对评论中的用户情绪进行识别、抽取、汇聚及可视化分析。研究涉及3个主要实验:基于情感词典的情绪提炼、基于情感主题建模的用户情绪挖掘与分析以及相关可视化。分析语言采用R,数据可视化部分主要运用Tagxedo (http://www.tagxedo.com/)的词云以及LDAvis图。
5.1   数据获取与基于情感词典的用户情绪识别
语料源自豆瓣读书(https://book.douban.com/)。豆瓣为第三方评论平台,可信度普遍高于电商平台的评论。依据主流购书网站的图书口碑排名,本研究选择了《白夜行》等12本文学类畅销书为分析对象。于2016年10月至11月间,用爬虫抓取相关图书页面“书评”区评论(区别于“短评”区评论),实际抓取评论共23 683条。其中字数大于300的长篇幅评论共12 316条,约占抓取评论数量52%。为了确保评论质量,实际分析语料仅保留有用性投票量大于5的评论,共1 555条评论数据,约占长篇幅评论数据的13%。12本书平均有效数据约为126条。
原始书评经过分词、分句、词性标注等预处理,保留名词、形容词以及动词作为候选,采用词典匹配模式,对候选词项进行情感词辨别,依据词典标注赋予词条情感类标及情感强度。相关实验涉及情感本体词汇1 829项,约占情感本体词汇总量7%。
5.2   情感主题建模
在识别情感词的基础上,本研究采用了隐主题模型LDA,对情感内容描述进行主题聚类,以更好地凝聚评论内容中蕴含的情感特征。
5.2.1   建立情感主题模型
首先进行模型的优选参数实验。依据胡吉明与陈果[25]的研究,LDA的超参数与分别取{0.1, 0.5, 0.9}与{0.01, 0.1}时模型效果较好,故本研究组合两组取值,对6种参数设置进行效果对比,以明确最优参数。模型评价采用主题间相似度,见公式(1):
公式(1)
其中,ci、cj分别对应聚类主题ti、tj的特征向量,win为词语n在主题i中的权重。模型的相似度为聚类主题相似度的均值,该指标越小,表明主题聚类差异显著,聚类效果好。以《小王子》为例(见图5),当=0.9且=0.01时,主题模型的聚类效果最佳。图中,X轴对应主题数,Y轴对应模型中主题间相似度。进一步,利用LDAvis,通过动态参数调整,确定最佳主题数K。如图6所示,当K=5时,LDA模型中的各个主题之间相离较远,主题凝聚的效果最佳。
图5   参数设置与模型相似度指数分布


图6   主题聚类可视化LDAvis(K=5)(运行截图)
5.2.2   基于LDA模型的书评情感主题
实现结果展示,主题聚类揭示出人们对作品的感知与情绪。以《小王子》与《白夜行》为例,表1和表2分别列出两本书书评的情感主题分析结果。尽管长评中词语的分布会比较分散,前几项占比偏低,但在一定程度上仍可反映出评论表达的情感色彩。如表1显示,《小王子》书评中的用户情绪主要是喜欢、友谊、孤独、爱情以及回忆,整体是正向情感状态。而内容为凄凉爱情和冷静推理的《白夜行》书评中的用户情感则是绝望、理解与肯定、失去与不幸以及献身,整体表现为负面的情感状态,如表2所示。可见,从阅读感受上看,书评情感主题聚类结果与书的内容是十分吻合的。
表1   《小王子》情感主题与例句
主题主要关键词前20项占比例句
1喜欢、理解、纯真、享受、珍惜32.4%“……或许不同的人会有不同的理解……长大后才读完这本书,所以不可避免地喜欢那只狐狸……爱童话的人是拿一颗赤诚的心去读童话的……”
2重要、朋友、心灵、仰望、美好32%“……人们不再有时间去了解事情了,他们总是到商店里买现成的东西,却没有一家店贩卖友谊……真正重要的东西是肉眼看不到的……”
3孤独、奇怪、痛苦、寂寞、亲爱13.1%“……小王子与玫瑰花就此道别,他们彼此回到他们所习惯的,孤独的常态中……”
4幸福、爱情、美丽、愿意、耐心11.5%“……狐狸被这样的幸福淹没了。这就象花一样。如果你爱上了一朵生长在一颗星星上的花,那么夜间你看着天空就感到甜蜜愉快……”
5希望、喜欢、快乐、微笑、骄傲11%“……回忆的味道,就像柠檬草的香味。但是,是放下了的,还是会有余香的……”
表2   《白夜行》情感主题与例句
主题主要关键词前20项占比例句
1爱情、绝望、希望、失去、伤害35.1%“……爱情是自私的,而感情,却真的真的,可以是无限大的。大于原罪和赎回,也大于希望与生命……”
2重要、理解、肯定、相信、获得19.4%“正好看到城下的分析,和我的理解基本相似……”“中文版白夜行的成功,50%的归功于原作,50%归功于翻译……”
3幸福、失去、伤害、不幸、伪装19%“……毫无疑问,她是一个受害者。但是在被禽兽折磨的过程中,她也异变成了一个禽兽,一个遗传了她母亲卑贱品格的女人……”
4怀疑、离婚、强暴、杀害、窃取14.6%“……怀疑雪穂把事件伪装成事故死,并且故意推迟了死亡的发现时间……高宮雪穂找到女性律师商量离婚的事……”
5人物、犯罪、献身、凶手、诡计12%“……唐泽和桐原都是彼此在黑暗中宝贵的第二道阳光,纵然桐原舍身,唐泽也只能毅然转身离去……
5.3   基于情感词典与情感主题的用户情绪提炼内容可视化
为了更加直观地反映研究结果,进一步的实验通过可视化方法,对基于情感词典与情感主题的用户情绪提炼内容进行可视化描述。
在基于情感词典的评论内容情感分析方面,以展现人类孤独寂寞又讴歌真善美的《小王子》为例,评论内容情感分布示意如图7所示。由图7可见,该书以正向温暖的情绪(乐、好)为主,同时包含有一定的悲伤情绪(哀)和负面情绪(恶),用户评论中的情绪与书籍内容呈现情感状态基本一致。但具体到个体评论,笔者随机提取两个案例,用饼图绘制评论中的情感类型分布(见图8)。显然,左边评论人感受到的是伤感,而右边评论人则更多感受的是美好和善良。借助可视化,可清晰地观察到读者感知状态的差异。


图7   《小王子》每条评论情绪属性统计(分开)


图8   《小王子》评论情绪属性分布(个例分析)
进一步用词云分析书评情感分布,如图9所示。图左边是基于全体实体词生成的词云,右边为基于情感词生成词云。从词云中观察到《小王子》带给人们的是“幸福”“孤独”“美好”“快乐”等感受,与作品主题一致。而对比左右两个词云可以看出,情感词云能更直观展现书评中读者的感受。显然,对于体验型产品评论,基于情感词的分析能够更好地刻画主题。




图9   《小王子》全体实词词云与情感词词云比较
在基于情感主题的评论内容情感分析方面,使用词云可视化聚类主题。由图10可见,《小王子》情感主题3的词云直观地将对应主题中最核心词语“孤独”呈现在读者面前,同时还包括“朋友”“寂寞”“痛苦”等重要的主题词。可见,情感主题分析能更好地揭示出评论人对书籍的感知,不仅是对图书的整体感知,甚至是对书中情节或人物的感知。


图10   《小王子》情感主题3词云
6   讨论
对书评进行细粒度情感分析,使我们能够获悉用户对书的感知,从而从用户感知的视角描述书籍,进而实现基于评论的图书风格对比、争议书籍的主流观点追踪、评论关注点分析及评论质量分析等应用。
6   . 1基于用户感知的图书风格对比
书的情感风格不同,带给读者的感知情绪亦不同,用户感知情绪与图书内容的情感状态具有一致性。通过分析评论的情感分布与主题,能够提炼书的风格,实现基于感知的书籍检索与推荐。图11为12本书的情感极性分布对比图,直观地呈现出不同书籍在情感风格上的差异。如《白夜行》《百年孤独》《活着》等书籍的情感偏负向,而《岛上书店》《解忧杂货铺》等书籍的情感偏正向,结论基本符合图书主题内容反映的情感状态。图12为12部书细粒度情感分布对比图,更细致地刻画出书带给读者的感受。以“爱”为主题的《小王子》融合的是欢乐与忧伤的情感;《百年孤独》与《活着》是国内外社会变革背景下人的故事,描绘人与家族之间的兴衰变更和苦难历史,“悲伤”成为两部作品的主要基调;而《平凡的世界》反映的是沉重生活中的真善美,获得了更多的读者正面的认知和感受。


图11   十二本书情感属性统计正负情感倾向对比


图12   用户评论的情绪分布(百分比图)
6.2   争议书籍的主流观点追踪
通过对存在争议的书籍进行评论情绪挖掘,可以获取读者的主流观点的流动方向与原因,进而对书籍的评价与营销行为产生积极作用。以《三体》为例,由图13可知,读者对本书的意见呈现两极化,但正反意见在不同时间段对立出现,并逐渐趋于统一。而差异的减少或增加可能与本书的获奖、电影化等行为息息相关。


图13   《三体》正负面情感追踪
6.3   基于情感特征的评论分析
情感为主观性文本所特有,细粒度情感分析在主观性文本挖掘中有着重要应用价值,如不同星级评价下读者感知情绪的差异及关注点分析。以《白夜行》为例,如图14可知,在5星评价中,评论者倾向于对自己的感知进行更加细致的描述,而在1星评论中,评论者倾向于宣泄自己的不满。从这点来看,对体验型产品,商家可以从好评中获得更多用户在使用过程的不同体验,因而好评的利用价值更高。由此,我们认为,情感特质是富含用户观点的主观性评论资讯的本质特质,一但把握这一特质,就能够对其进行有效的控制与管理,从而更好地发挥主观评论类资讯的信息价值。


图14   《白夜行》用户平均情绪值与评价星级的关系
7   结论和后续研究计划
本研究以豆瓣网站书评为分析对象,借助中文领域的情绪词典与LDA隐主题建模方法实现细粒度情感要素提炼,并采用可视化技术对评论内容中反映的情绪要素进行分析。
研究发现:①主题分析法和词典法均能有效提炼评论内容中的用户情感要素并各有所长,前者可以提供更细腻的情感描述、用户感知,后者能够直观地呈现评论内容中蕴含的情感分布。②从全体用户评论中提炼的情感状态与书的主题情感具有一致性,可基于评论中的情感状态明确书的情感风格定位。同时,读者感知情感存在差异,需进一步获悉读者在阅读中的情感诉求。结合两者,商业领域对体验型商品可以实现基于情感的广告推荐与情感营销等。③基于情感特征的词云、条形图、饼图等多种可视化方法是呈现用户感知的更好方式。④基于用户情绪感知描述书籍,是探究实现基于情绪的书籍分析、检索、推荐的有效方法。
今后,笔者将进一步完善实验,尝试识别情感本体现有7种情感以及情感主题的对立关系,进而在词匹配的基础上尝试引入程度副词与否定词等语法特点,更加精确真实地揭示评论所反映的情绪特点,并尝试引入更多的可视化方法。同时,将探索细粒度情感挖掘的一些实际应用,如基于用户感知情绪的图书风格等多种对比、争议书籍的主流观点追踪等,并对更深入的应用提出建议。另一方面,笔者还会将细粒度情感分析引入搜索类商品评论分析,从商业运营角度,对情感营销的有关问题进行探索分析。
[1]
RAVI K. A survey on opinion mining and sentiment analysis: tasks, approaches and applications[J]. Knowledge-based systems, 2015, 89(C):14-46.
[2]
兰月新, 夏一雪, 刘冰月,等. 面向舆情大数据的网民情绪演化机理及趋势预测研究[J]. 情报杂志, 2017, 36(11):134-140.
[3]
张信东, 原东良. 基于微博的投资者情绪对股票市场影响研究[J]. 情报杂志, 2017, 36(8):81-87.
[4]
MARTIN L, PU P. Prediction of helpful reviews using emotions extraction[C]// Twenty-Eighth AAAI conference on artificial intelligence. Palo Alto: AAAI Press, 2014:1551-1557.
[5]
FELBERMAYR A, NANOPOULOS A. The role of emotions for the perceived usefulness in online customer reviews[J]. Journal of interactive marketing, 2016, 36(11):60-76.
[6]
YIN D, BOND S D, ZHANG H. Anxious or angry? effects of discrete emotions on the perceived helpfulness of online reviews[J]. MIS auarterly, 2014, 38(2): 539-560.
[7]
史伟, 王洪伟, 何绍义. 基于语义的中文在线评论情感分析[J]. 情报学报, 2013, 32(8):860-867.
[8]
聂卉. 隐主题模型下产品评论观点的凝聚与量化[J]. 情报学报, 2017, 36(6):565-573.
[9]
金燕. 基于情绪分析的UGC质量评判模型[J]. 图书情报工作, 2017, 61(20):131-139.
[10]
BAGOZZI R, GOPINATH M, NYER P U. The role of emotions in marketing[J]. Journal of the academy of marketing science, 1999, 24(3):149-167.
[11]
ULLAH R, AMBLEE N, KIM W, et al. From valence to emotions: exploring the distribution of emotions in online product reviews[J]. Decision support systems, 2016, 81(5):41-53.
[12]
EKMAN P. An argument for basic emotions[J]. Cognition & emotion, 1992, 6(3/4):169-200.
[13]
曹宇, 王名扬, 贺惠新. 情感词典扩充的微博文本多元情感分类研究[J]. 情报杂志, 2016, 35(10):185-189.
[14]
MUDAMBI S M, SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[J]. Social science electronic publishing, 2010, 34(1):185-200.
[15]
GHOSE A, IPEIROTIS P G. Estimating the helpfulness and economic impact of product reviews: mining text and reviewer characteristics[J]. Social science electronic publishing, 2010, 23(10):1498-1512.
[16]
LEE J H, SUN H J, PARK J H. The role of entropy of review text sentiments on online WOM and movie box office sales[M]. New York:Elsevier Science Publishers B. V. ,2017.
[17]
KO M, KIM H W, YI M Y, et al. MovieCommenter: Aspect-based collaborative filtering by utilizing user comments[C]// International conference on collaborative computing: networking, applications and worksharing. Piscataway :IEEE, 2012:362-371.
[18]
殷国鹏, 刘雯雯, 祝珊. 网络社区在线评论有用性影响模型研究——基于信息采纳与社会网络视角[J]. 图书情报工作, 2012,56(16): 140-147.
[19]
薛博召. 图书领域消费者在线评论的有用性影响因素研究[D]. 哈尔滨:哈尔滨工业大学,2011.
[20]
张丽, 张蕾, 张阳, 等. 基于中文分词和词频统计的图书在线评论文本分析[J]. 信息系统工程, 2011(7):71-73.
[21]
祝振媛. 基于信息分类的网络书评内容挖掘与整合研究[J]. 图书情报工作, 2016,60(1):114-124.
[22]
LIU B. Sentiment analysis and opinion mining[J]. Synthesis lectures on human language technologies, 2012, 5(1): 1-167.
[23]
CARD S K, MACKINLAY J D, SHNEIDERMAN B. Readings in information visualization - using vision to think[C]// Series in interactive technologies. San Francisco:Morgan Kaufmann Publishers Inc.,1999.
[24]
SIEVERT C, SHIRLEY K E. LDAvis:A method for visualizing and interpreting topics[EB/OL].[2018-01-23].https://www.researchgate.net/publication/265784473_LDAvis_A_method_for_visualizing_and_interpreting_topics.
[25]
胡吉明, 陈果. 基于动态LDA主题模型的内容主题挖掘与演化[J]. 图书情报工作, 2014, 58(2):138-142.
稿件与作者信息
聂卉
Nie Hui
论文整体设计构思指导,数据收集整理,论文修改
issnh@mail.sysu.edu.cn
副教授,博士
0000-0001-8567-3084
刘梦圆
Liu Mengyuan
实验分析,论文初步撰写
硕士研究生
0000-0003-0562-4245
基金项目: 本文系国家社会科学基金项目“面向用户感知效用的在线评论的质量与控制研究”(项目编号:15BTQ067)和广东省哲学社会科学规划项目“基于情境和用户感知的知识推荐机制研究”(项目编号:CD13CTS01)研究成果之一。
出版历史
出版时间: 2018年11月22日 (版本1
参考文献列表中查看
知识管理论坛
Knowledge Management Forum