在线评论

2024-06-23

在线评论(精选八篇)

在线评论 篇1

1. 在线商品评论的概念

在线评论做为互联网与电子商务时代的发展产物, 在虚拟购物领域发挥了不可小觑的作用。它首次出现在易趣 (e Bay) 上。现在几乎所有的购物网站都提供在线评论的功能, 并有一批专业第三方点评网站纷纷成立。由此可见, 在线评论的巨大信息价值已广为人们所认识和接受。

本文所探讨的在线商品评论的概念为:由消费者、专家、商家、专业测评人员等多种信息发布者, 通过电子商务网站或者专业的第三方评论网站, 公开发表关于企业所出售的商品或服务、具有不同情感倾向的个人看法与意见。我们认为在线商品评论属于在线评论的一种组成成分, 其特殊点主要在于评论的对象必须是企业明价出售的商品或服务, 对于企业行为、名誉、品牌等方面的评价我们不纳入研究范畴。

2. 相关概念比较

目前, 已有大量研究成果集中在对在线口碑、网络口碑上, 然而在线评论与在线口碑存在紧密联系。针对在线评论与在线口碑的关系问题上, 众多学者基本已达成一致的观点, 即在线评论 (Online Review) 是一种重要的在线口碑 (Online Word-of-Mouth, Electronic Word-of-Mouth) 形式。然而, 仍有部分学者在其研究中将在线口碑与在线评论等价替换。为进一步深入探究在线评论的特征要素以及研究结果的借鉴上, 本文给出下表对在线商品评论与在线口碑的异同进行比较。

二、在线商品评论的类型体系构建

目前从已有学者研究成果可以发现, 对在线评论的分类角度大致集中在:发布者、发布平台、情感倾向、主客观性、表现形式、发布动机等。基于在线商品评论信息的发布者拥有能够联网设备并具备自主完成评论的编辑和发送能力的假设, 本文给出了在线商品评论的“要素模型”:

1. 发布者

根据发布者不同, 可以将在线商品评论分为分为消费者评论、商家评论和第三方评论;消费者评论是指有过消费体验的或参考他人消费经历而发表的个人评论。商家评论由生产商和经销商发布, 内容一般是对商品或服务的质量、价格等基本信息的介绍, 往往带有宣传广告色彩。第三方评论指由在某一领域具备一定的知识水平和权威性的或者不以盈利为目的的独立第三方评级机构所发布的对某一商品或服务的评价。如国内的ZAEALER (电子产品测评网站) 。第三方评论一般发表在第三方评价网站, 涉及的内容大多是客观的商品属性信息, 一般在商品未上市之前或上市前期出现。

2. 评论对象

根据评论对象的类别不同, 可以将在线商品评论分为有形产品评论、无形产品评论、综合类评论。有形产品评论的评价对象是指商家出售的真实存在的、具有实体形式的物化产品, 例如服装、水果、图书、电子设备等大部分常见商品。这类评论主要关注产品的外形、质量、包装、品牌等等客观产品属性, 虽然也会因消费者的个人偏好使得对产品的评价有所不同, 但基本上评论的可信度还是较容易判断的。有形产品评论的评价对象是具有价值和使用价值属性的非物质的劳动产品。例如软件、电影、音乐、电子读物、娱乐类产品、信息服务等等。这类评论的发布者注重的是使用过程的服务体验以及商家进行服务时的整体形象, 因此影响此类评论生成的因素也较为复杂。综合类评论是指一次性消费的产品中既包含有形又包含无形产品, 例如婚纱摄影服务, 其中可能既包含钻戒、服装等有形产品, 又包含摄影服务、化妆服务等无形产品, 故是对前两种评论的综合。

3. 发布动机

根据发布动机的不同, 可以将在线商品评论分为单纯评价型评论、感受分享型评论和利益驱动型评论。单纯评价型评论是指以产品的客观属性为立足点, 秉持理性的态度来分析产品优劣的评价信息, 这类评论的发布者大多为专家、测评人员或对产品了解较为深入的消费者, 常存在于在第三方点评网站。感受分享型评论是购买和使用过产品的消费者, 对整个过程体验产生的满意或不满意的情绪所引发的评价信息, 可以是正面、负面或中性评价。利益驱动型评论是发布者通过对该产品的评价来刻意维护或打击产品形象, 从而能达到争取自身利益的目的。这类评论因受利益驱动, 所以丧失了绝大部分的真实性和客观性, 例如竞争对手对本企业产品的评价。

4. 表现形式

根据表现形式的不同, 可以将在线商品评论分为文字型评论、打分型评论、标签型评论、混合型评论。通常在线商品评论或在线商品评论的主体基本上都是以文字的形式出现。目前的电子商务网站及第三方评论网站增添了多种形式的评论方式, 除了文字评价, 这些网站还提供一些指标供消费者选择1~5星进行打分, 例如淘宝网餐饮类服务提供有服务、口味、环境和总体四类指标, 分值分成5个级别。打分型评论不仅可以为消费者节省时间和精力, 而且还作为一些学者研究在线评论情感倾向的代理。除此之外网站还会提供一些常用评论词语, 即标签的形式供消费者选择。例如大众点评网在餐厅特色一项指标中, 罗列了“可以刷卡”“无线上网”“免费停车”“可送外卖”等29个标签。相比较打分型评论的形式, 标签所表达的信息更加详实和全面, 也为学者对评论数据挖掘的研究带来了便利。

5. 情感倾向

根据情感倾向的不同, 可以将在线商品评论分为正面评论、负面评论和中立评论。正面评论是指对产品或服务持积极态度、对其进行正面评价的信息, 是颂扬该产品或服务的, 能够起到劝说其他消费者购买该产品或服务的正面效应。例如“一直比较喜欢在京东买东西, 质量靠谱, 不用那么纠结假货, 重要的是快递比较快, 这点比较舒服”。负面评论是指对产品或服务持消极态度、对其进行负面评价的信息, 是投诉该产品或服务的, 能够起到劝说其他消费者避免购买该产品或服务的负面效应。例如“真的不想给差评, 但是确实不怎么样, 服务完全不到位, 下次再也不来了”。中立评论是指对产品或服务持客观态度、对其进行客观评价的信息。例如“目前硬件上面看起来是没有问题, 只是偶尔会出现蓝屏的现象, 不知道是不是因为我安装了WIN7的系统, 原装配置的系统是LINX的。”

三、结论及展望

本文在梳理已有研究成果的基础上, 从在线评论的信息结构入手, 以发布者、评论对象、发布动机、表现形式、情感倾向类型依据, 对在线评论类型进行了探讨。本文局限性在于仅从理论上进行了论述, 在实证研究上存在一定局限性。未来研究在于利用文本挖掘与分词技术搜集大量评论语料, 对不同类型的评论特点进行挖掘, 以及对概念要素之间的相互影响进行论证, 从而为消费者购买和商家营销提供具体建议。

摘要:本文首先阐明了在线商品评论的概念界定, 并以比较分析的角度探讨了与在线口碑的区分。在此基础上, 根据在线评论的五个概念要素:发布者、评论对象、发布动机、表现形式、情感倾向类型依据, 按照每个要素的不同特征对在线评论进行类型的划分。文章最后提出未来研究将在于对不同类型的特点与购买作用上, 从而为消费者购买和商家营销提供建议。

关键词:在线商品,在线评论,概念要素,类型划分

参考文献

[1]孟美仁.虚假商品评论信息发布者行为动机分析[J].情报科学, 2013, 31 (10) :100-103.

[2]杨铭, 祁巍等.在线商品评论的效用研究[J].管理科学学报, 2012, 15 (5) :66-69.

[3]李实, 叶强等.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报, 2009, 12 (2) :142-144.

[4]郝媛媛.在线评论对消费者感知与购买行为影响的实证研究[D].哈尔滨:哈尔滨工业大学, 2010.

[5]李慧颖.在线评论对消费者感知及企业商品销量的影响研究[D].哈尔滨:哈尔滨工业大学, 2013.

[6]张紫琼, 叶强等.互联网商品评论情感分析研究综述[J].管理科学学报, 2010, 13 (6) :84-87.

[7]李杰, 张向前等.C2C电子商务服装产品客户评论要素及其对满意度的影响[J].管理学报, 2014, 11 (2) :261-263.

巧用“在线评论”提升图书网上销量 篇2

关键词:在线评论;医学类图书;网上销售

网上书店是利用互联网信息技术通过网络完成图书交易的一种在线营销模式。近年来,互联网技术不断改革发展,网上书店迅猛发展。与实体书店相比,网上书店拥有诸多优势,如图书种类更为丰富,价格更便宜,读者查找更方便,服务无时间限制,等等。医学类图书与其他图书相比,具有高度的专业性和权威性。对图书营销者而言,如何巧用“在线评论”提升医学类图书的销售量,可从以下几方面开展工作。

一、及时更新产品,充实产品信息

医学类书刊目标受众大多想获取医学专业信息,加强学习,对他们而言,书刊种类以及书籍自身内容介绍很有价值。如果店家在网页上对书刊信息介绍粗略不详,那么购买者购书后就有可能无法获取所需要的信息,读者因无法达到预期,在撰写评论时,其所写内容很可能为负面信息,不利于其他读者购买,反之则有助于提升销量。

以北京大学医学出版社《中国食物成分表》为例,该书共二册,第一册为2002年出版的《中国食物成分表2002》第一版,后于2009年修订后推出了第二版;第二册为2005年出版的《中国食物成分表2004》。这两本书虽已出版了10年左右,但目前仍是当当网、亚马逊等几大图书网站的常销产品,究其原因,除了产品内容的排他性,同时也与我们一直对网络信息进行补充有关。因不断更新,读者可以更加全面地了解该书的内容特点等信息,这样购买完毕后不会出现太大的心理反差,在线评论自然比较理想。

二、发布购书活动,引导读者发布正面评论

举办配套活动是刺激消费者购买欲的一个重要手段,现在很多商家都会发布一些好评有礼、折扣、书评、征文有奖等活动,以获取消费者的正面评论。医学类图书也一样可以发起这些活动来刺激读者群。《中国食物成分表》出版后,我们在关注常规宣传的同时,结合国内几家大型图书销售网站开展的店庆、“双十一”等活动,适时推出系列优惠措施,在让利读者的同时最大限度地配合了网店的促销活动,取得了多赢的局面。值得一提的是,《中国食物成分表2002》第一版和《中国食物成分表2004》上市之初,我们密切关注网络信息和库存信息,保证信息完整和供货的及时性,并与网站开展首页推荐、邮件发布、专家解读等宣传和促销活动,经过这些努力,这两本书在网络上的销售量均超万册,顺利进入各网站畅销排行榜。《中国食物成分表2002》第二版于2009年出版,我们把该书和《中国食物成分表2004》一起作了宣传,积极引导网络评论,突出《中国食物成分表2002》在第二版修订的新内容,凸显该领域新的研究进展和成果,同时删除部分与《中国食物成分表2004》重复的部分,充分体现两书内容的互补性。结果,不仅《中国食物成分表2002》第二版在网络上取得销售2万册的业绩,《中国食物成分表2004》的销售又顺利增加万余册。

三、加强服务质量,积极应对负面评论

在线评论内容有正面、负面之分,如果读者购书体验愉快、获取到了需要的信息,在线评论的内容多为正面,但如果读者在购买后发现书籍内容与网页介绍不符,发表的评论往往是反面的。因此,我们应该从几个方面加强服务质量:第一,确保网上信息的真实和尽量翔实;第二,图书发放前仔细检查,避免出现图书损坏、缺页等情况,减少客户售后投诉;第三,如果开通在线咨询或者是电话咨询,务必对客服人员进行培训,同时将他们的服务效果列入考核范畴;第四,很好地与相关环节(比如物流)协调,同步提升服务;第五,提高危机处理能力,以应对各种投诉,减少负面评论。

四、发起网络活动,提升书店关注度

在线评论并非只是书刊购买后的行为,其涉及不同方面的内容,关键在于网上书店如何利用。比如在线投票、医学知识讨论、书籍推荐,等等。

由于书籍营销需要结合医学类读者实际,因此出版方可以在各大博客、论坛或书店页面发起投票。比如医学研究生考试类图书,目前市场上品类繁多,通过在线投票,不仅可以提升网店的关注度,而且可以了解市场反馈信息,为下一步营销打下基础。

购买医学类书籍的读者大多为医疗机构从业人员、卫生人员或医学生,他们的求知欲非常强。结合读者特点,我们可以定期发起一些医学知识话题供读者讨论,这也是人与人之间的非正式沟通,读者讨论期间往往会谈及医学类书籍购买或相关商家的信息,以此扩大书籍销售量。

目前网络销售渠道主要是线上线下联动营销,因此,如果可以把这两种形式很好地融合起来运用,对引导正面评论,进而提升销量是有很大帮助的。此前恰逢营养学年会召开的契机,我们结合会议议程,在线下对参会代表进行分析和调研,区分有效潜在客户,有针对性地利用微博、微信等形式发布了《中国食物成分表》图书信息,并提供了网络销售平台推荐。由于线上信息完备、对该书的评论大多为正面信息,加上会议推荐,那段时间不管是实体店还是网上书店,该书销售均取得不错的业绩。

书籍推荐大多是在商家店面发布的,根据读者特征,可以定期发布一些推荐书籍的信息,如毕业前季可以推荐一些医学类考试书籍,每年年初可以推荐一些临床医药书籍。当然,推荐书籍和其他书籍还应有其他方面的区别,例如价格,这是刺激消费者购买欲的重要手段。其次是推荐理由,这又和在线评论直接关联在了一起,推荐理由一定要符合读者心理和需求。如发布2014年医学类考试用书的主要内容,帮助读者获取备考信息,等等。这样一来读者在观看推荐理由时就犹如查看在线评论内容一样,进而根据自身实际综合抉择。

五、微营销环境下的注意事项

随着网络技术和传播手段的进步,如今微营销扮演着重要的角色。微营销是有别于传统互联网营销方式的一种以移动互联网为平台的营销过程。微营销主要在智能手机、平板电脑等新兴平台上进行有策略、可持续、可管理的线上和线下沟通,以此建立、转化并强化客户关系。目前,医学图书网络销售商用比较普遍的是微博营销和微信营销,而微视营销由于前期费用较高,目前还未普遍用于医学图书销售。

在微营销环境下配合在线评论应注意以下事项:第一,客户筛查应有针对性。互联网技术给广大网络用户带来了很多便利,但同时也带来了各种干扰,大家普遍反感垃圾信息,因此,我们在筛查客户的时候应奉行谨慎原则,既不能落下潜在客户,又不可网络过多的无关客户,以免引起反感。第二,信息的发布要更加精确、更有针对性。不管是微薄还是微信平台,都属于点对点的平台,是一种更加直接、更加私密性的联系平台。如果平台上的无用信息过多,客户的关注热情就会降低,甚至取消关注。因此,我们在发布医学图书信息的时候,一定要有针对性。第三,切实加强服务工作,引导正面评论。由于微平台点对点的特殊性,很容易找到上游终端。因此,网店运营者要及时处理各种反馈意见,强化正面信息,及时消除负面影响。

(林强庆,北京大学医学出版社市场营销部主任)

中文在线评论中产品特征抽取研究 篇3

随着电子商务的兴起,越来越多的用户从网上购买商品并发表购后评论。与此同时,用户在购买商品之前,也都会查看其他用户对所购商品的评论,试图发现其他用户对商品的总体意见及各属性的意见,从而决定其购买行为。由此, 近年来许多学者对在线评论展开了研究, 意见挖掘就是这类研究的热点之一, 其目标是从海量的在线评论中分析每个用户对于商品的态度。现有的评论挖掘研究主要包含四个任务:产品特征抽取;评论观点抽取;评论观点的极性以及强度判断;评论挖掘结果的汇总以及按用户观点排序[1]。特征抽取是整个意见挖掘的基础,只有全面准确地抽取出用户评论中所涉及的产品特征,之后的分析才能有的放矢。因此,本文将尝试探讨中文在线评论中产品特征抽取研究。

2 相关研究

目前,已有不少学者针对英文产品评论中特征词抽取方法进行研究。文献[2-3]首先对评论语料进行词性标注, 提取出所有的名词和名词短语构成事务文件, 然后利用Apriori关联规则抽取高频的特征词, 最后通过修剪规则提高准确率和覆盖率。文献[4]提出了一种双向传播方法(DP, Double Propagation), 根据词汇依赖关系, 并考虑了代词和否定词的影响, 进行特征词和感情词的抽取。文献[5]引入句法特征使用基于条件随机场模型的监督学习方法实现评价对象抽取,明显提高了评价对象的抽取召回率。国内也有不少学者对中文产品评论属性词抽取方法进行研究。文献[6]抓取大量介绍产品的网页,从中手工整理构建属性词表。文献[7]首先应用中文分词工具对网络评论信息进行分词和词性标注,得到最初的产品特征名词集合,然后采用潜在狄利特雷分布文本训练模型筛选出候选产品特征词集合,进而通过同义词词林拓展和过滤规则得到最终的产品特征集合,通过实验对比分析验证了所提方法的有效性。

因为现有产品特征抽取方法的准确率和召回率都不太高,所以有必要进行深入研究,该文主要工作如下:(1)设计词性序列模板产生候选特征集,词性序列模板不仅包含了名词和名词短语,还包括字符串、非及物动词和动词短语模板。(2)利用PMI-IR方法筛选候选特征集,构建产品特征集。

3 特征抽取

3.1 抽取流程

1) 首先利用北京理工大学张华平博士开发的NLPIR汉语分词系统(又名ICTCLAS2013)对在线评论进行分词及词性标注;

2) 定义词性序列模板,对词性标注后的评论进行筛选,产生候选特征集;

3) 给定种子集,利用PMI-IR算法对候选特征集进行抽取,获得产品特征集。

3.2 词性序列模板

将实验语料中的前200条评论进行分词及词性标注,进行仔细分析后,发现特征词不但包含名词和名词短语,还包含字符串、不及物动词和动词短语。这些词语组合形成表1所示的词性序列模板。

在线评论中用户主要是对商品的特征进行评论,因此特征词会频繁出现。所以候选特征词在语料中出现次数越多,它是特征词的可能性越大。首先利用词性序列模板对语料进行匹配获得符合模板的词条,并统计在语料中的出现次数,把出现次数大于2的词条作为候选特征词。

3.3 PMI-IR算法

实验发现有些词汇虽然在评论语料中出现频繁,例如,“东西”、“时候”、“问题”等,但这些词汇跟笔记本电脑是不相关的,不是真正的特征词。点互信息PMI(Point—wise Mutual Information) 通过搜索引擎检索时的共现条目来度量两个词语之间的联系,可以较好地过滤掉与领域不相关的候选特征词。PMI-IR的计算[1]如下:

其中,Seeds = {屏幕,win8,硬盘,显卡,键盘,笔记本},是从语料中出现次数超过20次的候选特征词中手工挑选出的领域性种子集;hits(w1&w) 表示在搜索引擎中同时搜索w1和w时返回结果的数目,hits(w1)和hits(w) 表示单独搜索w1或w时返回结果的数目。不难看出,若候选属性词和种子属性词的共现次数越多,它们的PMI值可能就越大,候选属性词是真正属性词的可能性就越高。设定一个阈值,当PMI值大于阈值的为属性词。

4 实验及结果分析

实验采用Python开发环境,利用百度搜索引擎作为信息源计算PMI值。

4.1 实验语料

从亚马逊(http://www.amazon.cn/)网站上抓取用户最近对联想Y400系列笔记本电脑发表的500条评论作为实验语料。通过人工标注的方法对评论中所涉及的产品属性进行识别, 得到35个产品特征。

4.2 性能评价

利用召回率R(recall)、准确率P(precision)及调和平均值F评估方法的性能。

4.3实验结果

对词性标注后的评论采用词性序列模板过滤后,计算PMI-IR值获得产品特征集,其召回率、准确率及调和平均值随阈值的变化趋势如图2所示。当阈值在-27.8时,调和平均值达到最高值0.571。

为便于比较,将文献[2]方法在本语料上进行实验,得到调和平均值为0.556,略低于本文方法。由此可见,该文方法对于中文在线评论的产品特征抽取是有效的。

5 总结

在线评论 篇4

关键词:酒店预订,在线评论,市场销售

0 引言

在线预订也称为网上预订, 是指消费者通过网络向产品或服务提供商预订所需产品或服务并通过线上或线下的方式进行支付。随着网络的普及, 越来越多的消费者根据需求选择了在线预订。据CNNIC发布的最新消息显示, 截至到2015 年6 月, 我国网民规模达6.68 亿, 互联网普及率为48.8%, 给在线预订提供了广阔的发展基础[1]。酒店的异地性和体验性特征更加适合在线预订。酒店的预订形式主要有三种:一种是第三方平台预订, 第二种是酒店官方直销模式, 第三种是代理模式[2]。目前酒店预订模式最常用的是第三方平台预订。本文的研究主要基于这种第三方平台的在线预订来研究酒店市场销售的在线信息影响因素。酒店的体验性特征使得顾客无法在消费之前获知消费过程的全面信息, 因此, 为了降低感知风险, 顾客往往倾向网络口碑获取参考信息 (Wirtz和Chew, 2002) [3]。本文在梳理已有文献的基础上, 对第三方评论网站上影响消费者在线预订酒店的评论相关信息进行了建模分析。并为酒店管理者提高酒店的市场销售提出新思路。

1 文献综述

酒店是典型的体验性服务, 其各方面质量在消费之前往往是未知的。因此, 为了降低感知风险, 消费者从各方面搜索信息为其决策提供参考[4]。而所有在线信息中在线评论又是消费者最为关注的。Gretzel和Yoo (2008) 指出有四分之三的旅游者在做决定之前会将在线评论作为一个信息来源来支持选择[5]。同样, Hankin L (2007) 基于在Biz Rate上的调查, 发现大约有近一半的人购物前会查询在线评论, 有一半以上的人认为消费者评论比专家评论更有价值[6]。消费者在预定酒店之前也必定搜寻在线评论 (Kim等, 2011) [7]。Karen (2014) 根据Trip Advisor, 2013 指出53%的游客直到读了在线评论之后才会预订酒店, 而77%的游客“常常”在预订前查看酒店评论[8]。

在线评论与消费者预订紧密相连的同时, 自然与相关产品的销售密切相关。已有研究充分论证了在线评论对销售的重要影响。Ghose和Ipeirotis (2006) 指出在线评论可以降低消费者缺乏产品信息而产生的忧虑, 从而有利于促进销售[9]。同样, 已有研究发现, 在线评论在酒店行业销售方面也起着关键的作用 (Cheng和Loi, 2014) [10]。魻gut觺和Tas (2012) 指出消费者评分增加1%, 在巴黎酒店销售量会增加2.68%, 伦敦酒店销量会增加2.62%[11]。

同样Ye等 (2011) 研究了在线评论对酒店经营绩效的影响, 并通过实证研究发现在线评论的数量增加10%, 在线预订就会增加5%[12]。Torres等 (2015) 指出公司的财务状况能通过酒店的顾客在线评级来反映。研究收集了Tri-p Advisor上178 家酒店信息对酒店排名和在线评论数量对酒店交易产生的影响进行了研究。结果表明, 评分和评论的数量与酒店在线预订交易的平均规模正相关[13]。

已有文献对在线评论的研究主要集中于以下几个方面:评论极性 (Chintagunta等, 2010[14];Sun, 2012[15];Tirunillai和Tellis, 2012[16]) 、评论数量 (Chintagunta等, 2010[14];Dellarocas等, 2007[17]) 和评分方差 (Chintagunta等, 2010[14];Sun, 2012[15];Markopoulos和Clemons, 2013[18]) 。

通过以上文献可以看出, 关于在线评论的理论研究已经比较丰富, 而实证研究却十分有限, 根据第三方平台的预订信息来分析评论信息对销售影响的文献更是寥寥无几。在此方面具有开创性的Qiang Ye等 (2009) 从携程网上搜集数据, 建立了一个对数线性回归模型, 分析了评分均值、评分方差、最低价格、城市等级、酒店星级对酒店预订数量的影响。研究结果表明, 评分与评论数量正相关, 评分方差与评论数量负相关, 城市等级对酒店的预订也有一定的影响[7]。Xie等 (2014) 从Trip Advisor上收集数据, 分析了消费者评论和商家反馈对企业绩效的影响。结果显示总体评级, 购买价值、位置、清洁度的属性评级, 消费者评论的变化和数量, 管理者回应的数量与酒店表现强烈相关。此外, 消费者评论的变化和数量对总体评分和酒店表现之间的关系有调节作用[20]。

无论任何交易, 价格都是最为重要的因素, Cezar等 (2012) 通过研究国内酒店预订得出价格和在线评论数量显著负相关[21]。在以上研究的基础上, 本文对影响消费者在线预订和酒店销售的评分、评论数量、评分方差、价格等几个关键因素进行建模分析, 以期丰富该领域的研究成果并为酒店经营人员提供更恰当的在线管理策略。

2 实证分析

2.1 构建模型

本文使用多元线性回归模型研究评论分数、评分一致性以及价格对酒店预订数量的影响。由于酒店的预订数量与酒店的评论数量存在线性关系[19], 因此在本模型中我们使用评论数量来代替酒店实际销售数量。模型构建如下:

以上模型中的变量说明如表1。

2.2 收集数据

大众点评是国内领先的生活信息及交易平台。截止到2015年第一季度, 大众点评月活跃用户数超过2亿, 收录商户数量超过1400万家, 覆盖全国2500多个城市及美国、日本、法国等近百个热门旅游国家和地区。除上海总部之外, 大众点评已经在北京、广州、天津、杭州、南京等160多座城市设立分支机构。目前大众点评月综合浏览量 (网站及移动设备) 超过150亿, 其中移动客户端的浏览量超过85%, 移动客户端累计独立用户数超过2亿[22]。考虑到不同档次的酒店对影响其销售的信息可能不同, 因此, 我们从大众点评网上搜集了北京地区经济型酒店、四星级酒店和五星级酒店数据, 用于此模型的对比分析。在分析中, 经济型酒店自成一类, 四星级和五星级酒店分为一类, 属于高档型酒店。

在搜集数据过程中, 我们根据各类型酒店的标准和2014 年中国酒店的平均入住率 (56%) 来筛选酒店数据。经济型酒店中, 我们将“青年旅社”等一类的酒店排除在外, 由于很多青年旅社只为背包客提供床位, 服务质量和价格均远远低于一般经济型酒店, 因此, 在本文研究的经济型酒店中只包含品牌经济型酒店, 诸如7 天、如家、汉庭、锦江之星、速8 等各种品牌酒店。

经过数据的搜集与整理, 最终整理出808 家酒店作为研究样本。其中经济型酒店348 家, 所占比例43.07%;高档型酒店460 家, 所占比例56.93%, 其中四星级酒店285家, 所占比例35.27%, 五星级酒店175 家, 所占比例21.66%。在此数据信息中, 评分采用各酒店的平均评分计算得来。平均分相对于1~5 刻度的评分更利于准确的分析。

2.3 结果分析

本文使用spss20.0 进行数据分析, 为避免多重共线性因素影响分析结果, 首先进行了多重共线性诊断。诊断结果如表3 所示。

从表3 中可以看出, 方差膨胀因子VIF远小于10, 因此, 此模型不存在多重共线性问题。通过数据分析, 最终得出两种类型酒店的模型结果, 如表4。

从模型1 中可以看出, 价格和评分均十分显著, 价格系数 β3为负 (-0.347) , 评分系数 β1为正 (0.723) , 说明选择经济型酒店的消费者比较注重价格方面的实惠, 同时关注评分较高的酒店。而在模型2 中, 价格的系数 β3为正 (0.331) , 评分系数 β1也为正, 说明选择高档酒店的消费者不会刻意回避高价格, 可能是因为选择高档型酒店的消费者大多为商务出行或有公款报销的人群, 因此, 他们更加注重评分的高低与评分的一致性。

3 结论与对策

本文在梳理已有文献的基础之上, 根据影响酒店在线预订的关键因素进行了多元回归分析。数据来源于大众点评北京地区经济型酒店和四星、五星级酒店, 为对比不同等级酒店之间的差别, 根据酒店档次将以上酒店数据分为经济型和高档型两类, 在此基础上分析了消费者评分、评分方差和价格对两种类型酒店预订的影响。结果表明消费者评分、评论方差和价格对酒店的在线预订数量影响均为显著。选择经济型酒店的消费者更加倾向于价格较低而评分较高的酒店, 即注重酒店的性价比;而选择高档型酒店的消费者则更加注重酒店的档次。两种消费者在选择酒店时均会选择评分一致的酒店, 以减小住宿所带来的感知风险。

在线评论 篇5

随着互联网的迅速发展,网上购物因其独有的便捷特点成为年轻人的主流选择,在线评论更是成为消费者了解商品的重要信息来源。为了更加精确地把握购买商品的性能,消费者往往比较关注负面在线评论。近年来,由负面在线评论引起的网络店铺卖主和买主之间的矛盾冲突越来越严重,卖主威胁买主删除负面评论所采取的过激行为也屡见不鲜。可见负面在线评论对商家造成了一定的不良影响。张耕和郭宁( 2012) 通过回归分析处理所得数据揭示产品畅销度在负面在线评论对产品销量影响中的作用大小。胡志海等( 2015) 将样本数据进行线性回归得到各变量的相关性,分析了在线评论的数量及差评率对产品销量的影响。从现有的研究文献看,大部分对负面在线评论的实证研究都集中在负面评论数量对销量的影响上,对于负面在线评论内容没有进行深入探讨,而负面在线评论内容对产品销量的影响尤其是对服装商品销量的影响至关重要。本文以淘宝网服装产品为研究对象,通过收集、分析消费者购买服装的负面在线评论数据,根据负面在线评论内容将其分类,找出对服装销量有显著影响的那一类或几类负面评论,试图从负面在线评论内容方面分析影响服装销量的主要因素,并针对这些影响因素向商家提出合理建议。

二、模型假设

本文旨在探讨负面在线评论内容对服装销量的影响,因此构建的两个模型均以服装销量作为因变量,解释变量有负面在线评论数量、总评论量、根据负面在线评论内容分类后各类别下的评论数量,两模型由于研究的不同,因此具有不同的解释变量。

在模型1 中,以负面在线评论数量和总评论量为解释变量,用以说明负面在线评论总量对服装销量的影响。在模型2 中,本文根据负面在线评论内容对负面评论进行分类: 消费者对服装做出的诸如衣服质量不好的评论归为质量一类,诸如收到的衣服的颜色与在网上看到的颜色不一致的评论归为色差一类,诸如衣服的尺码与网上描述的尺寸不符的评论归为尺码一类,诸如物流速度太慢、快递服务不好的评论归为物流一类,诸如卖家态度恶劣,售后服务差的评论归为客服一类。以质量、色差、尺码、物流、客服这五类下的评论数量及总评论量为解释变量,用以指出对服装销量有显著影响的那一类或几类负面评论。

( 一) 负面在线评论量对服装销量的影响

由于消费者在进行网络购物时对产品评论有极高的依赖性且对于产品的负面评论十分敏感,因此在同批次产品中,消费者更愿意选择负面评论较少的产品以降低买到次货的风险。现有文献都表明,负面在线评论数量对产品销售量有显著的负面影响。据此,本文提出假设h1。

h1: 负面在线评论数量越多,服装销量越少。

( 二) 在线总评论量对服装销量的影响

一般说来在线总评论量是产品销量的客观反映。胡志海等( 2015) 通过在淘宝上收集、整理护肤品的销量等数据,发现新增销量与评论数量相关,评论数量对护肤品新增销量的影响极为显著,护肤品的评论数量越多则销量越高。因此本文提出假设h2。

h2: 在线总评论量越多,服装销量越多。

( 三) 关于客服一类的负面在线评论数量对服装销量的影响

商家的服务态度对消费者的购买行为会产生直接或间接的影响。商品相近或同质的两家店铺,消费者更愿意选择服务态度好的商家。在消费者咨询产品的相关信息时,商家表现出来的服务态度在很大程度上会决定消费者的最终购买行为,即服务态度越恶劣的商家,消费者越容易放弃购买产品。因此,本文提出假设h3。

h3: 关于客服一类的负面在线评论数量对服装销量有显著影响,并且评论数量越多,服装销量越少。

( 四) 关于物流一类的负面在线评论数量对服装销量的影响

根据时间偏好理论,人们常常展现出正时间偏好率的特征,这意味着人们认为当下某种物品所具有的价值比未来同样的这个物品具有的价值高。因此,消费者更乐意购买能够快速拿到手中的产品,并且物流越慢就越加重消费者对购买商品的担心,产品在运送途中承担的风险也越大。据此,本文提出假设h4。

h4: 关于物流一类的负面在线评论数量对服装销量有显著影响,并且评论数量越多,服装销量越少。

( 五) 关于质量一类的负面在线评论数量对服装销量的影响

虽然产品的款式、颜色会对消费者的购买行为产生影响,但是消费者最终决定是否购买某产品与产品质量有着重要关系。负面在线评论中,消费者对产品质量一类的评论十分关注,产品质量的好坏直接决定了这项产品是否值得消费者购买。因此,本文提出假设h5。

h5: 关于质量一类的负面在线评论数量对服装销量有显著影响,并且评论数量越多,服装销量越少。

( 六) 关于色差、尺码类的负面在线评论数量对服装销量的影响

消费者在选择产品时还会注意到产品有无色差、尺码方面的问题。由于色差和尺码问题是消费者的主观反应,因此关于这两类的负面评论几乎不影响消费者的购买决定。况且商家因拍摄光线等外在因素导致的网络图片颜色与实际产品颜色不符是不可控的,而消费者认为的尺码问题大部分可以通过告诉客服形体大小由客服推荐尺码这种途径得以解决。据此,本文提出假设h6和h7。

h6: 关于色差一类的负面在线评论数量对服装销量没有显著影响。

h7: 关于尺码一类的负面在线评论数量对服装销量没有显著影响。

三、实证分析

( 一) 数据描述

本研究所用的数据是随机从淘宝网中的服装店铺收集而来,记录时间为2015 年12 月7 日至2016 年1 月7日,抽选的店铺有108 家。为避免季节因素对服装销量的影响,本文特地以冬季女性羽绒服作为研究对象收集相关数据,记录下选取店铺中特定服装的这一个月的销量、总评论量、负面在线评论数量,以及根据负面在线评论内容进行分类后得到各类别下的评论量。为确保数据的准确度,防止其他变量对数据的不可控影响,需要对上述得到的数据进行处理: 在选取的店铺中记录下信誉等级相近的服装店铺的相关数据,并且在选定的服装店铺中留下价格相同或相近( 价格上下波动不超过1 元) 的羽绒服销量等数据,剔除其他价位的羽绒服销量等数据以消除价格对销量的影响。经过处理后得到可用数据37 组。

( 二) 基本结果

注: ( 1) tc、tnc分别表示总评论量和负面在线评论量;( 2)*,**分别表示通过显著水平为0. 05,0. 01 的统计检验。

为检验前面所提假设的正确性,对这37 组数据采用最小二乘法进行回归分析,在模型1、2 中均使用Eviews8. 0 分析相关数据。通过模型1 得到负面在线评论总量与服装销量的关系,通过模型2 找到对服装销量有显著影响的一类或几类负面评论。为较容易地分析解释变量和因变量间的关系,本文对两模型中的数据均采用对数形式。表1 和表2 分别是模型1 和模型2 的回归结果,表3 则是在表2 的回归结果上剔除对服装销量无显著影响的解释变量后并对回归结果做异方差、序列相关性等检验及修正得到的最终结果。根据表1 可知: 负面在线评论量和总评论量均通过显著性检验,且总评论量对月销量有显著正向影响,负面在线评论量对月销量有显著负向影响,即有关负面在线评论量、总评论量对销量影响的假设h1 和h2 成立。据表2 可知: 由于| -0. 15|< | - 1. 688 | ,故接受解释变量尺码对被解释变量销量没有影响的原假设,同理知色差对销量也没有影响,即在五类评论中,客服、物流和质量三者对服装销量有显著影响,而色差和尺码对服装销量无显著影响。这意味着上述关于色差、尺码的假设h6 和h7 成立。根据表3,总评论量对服装销量有着显著的正向影响,客服、物流和质量对服装销量有显著的负向影响,因此假设h3、h4 和h5 均成立。

注: ( 1) cs、l、q、s、cd分别表示客服、物流、质量、尺码和色差; ( 2)*,**,***分别表示通过显著水平为0. 1,0. 05,0. 01 的统计检验。

注:*表示通过显著水平为0. 01 的统计检验。

四、结论与建议

( 一) 结论

从上述实证分析中不难发现负面在线评论数量会影响到服装的销量,且两者之间存在负向关系,这说明消费者在网络购物时出于规避风险的考虑,会慎重选择那些负面评论较多的产品。在根据负面在线评论内容进行分类后得到各类别下的评论量中,关于客服、物流和质量类的评论对服装销量会产生影响,而关于色差和尺码类的评论对服装销量没有显著影响。由于对色差及尺码的评论涉及到消费者的主观判断,因此这两项对服装的销量没有决定性作用。

( 二) 建议

一是重视负面在线评论。负面在线评论量对服装销量有显著负向影响,但商家不应采取过激行为消除负面评论,否则将得不偿失,况且总评论量越多,服装销量也会增加; 二是商家应区别对待负面在线评论的内容。负面评论中有关客服、物流、质量类的评论对服装销量的影响较大,这几项评论量越多服装销量会越少。商家应改进客服态度并提高物流速度,对于产品的质量问题,商家在发货前应仔细检查产品确保服装没有缺损没有弄脏等,商家甚至可以更换进货商以尽可能减少质量问题的出现; 三是商家应充分利用消费者的评论提高产品的知名度,避免与消费者发生冲突损坏店铺的名誉。

参考文献

[1]胡志海,赵丹丹,张义.在线评论对商品销售影响的实证研究[J].重庆工商大学学报:自然科学版,2015(12):52-55.

[2]张耕,郭宁.负面在线评论对产品销售的影响:基于淘宝网的实证研究[J].消费经济,2012(6):86-89.

[3]陆海霞,吴小丁,苏立勋.差评真的那么可怕吗?——负面线上评论对消费者购买行为的影响研究[J].北京社会科学,2014(5):102-109.

[4]陈鹏.网络口碑对在线销售的影响实证分析——基于淘宝网[J].当代经济,2015(2):30-31.

在线评论 篇6

在线评论为人们在网上购物提供了大量参考信息, 成为影响消费者网购决策的重要因素。在现实环境中, 评论者对一个特定主题表达的“情感”可能隐含着大量可以被利用的有价值的信息。当我们认真阅读这些在线文本评论的时候就会发现, 并不是所有的好评下面都是正面评论。从评论的极性来看, 这些评论应该为好评, 但从具体内容的情感倾向看, 却很容易发现其实这些是包含负面评论的好评, 严格地说是差评。

情感分类作为在线评论信息自动理解的一个重要环节, 已经引起越来越多学者的重视。情感分类以互联网上发布的商品评论为研究对象, 挖掘用户在评论中表达的情感倾向, 即正面评论或负面评论。通过对消费者评论的情感分析, 在庞杂的海量在线评论信息中自动识别有多少评论者持正面态度, 有多少评论者持负面态度, 可以帮助消费者了解评论者对某种商品的态度倾向分布, 从而做出正确的购买决策。

本研究把用户从评价选项中勾选出的“好评”选项下面的文本评价栏中写出的关于体验和使用商品的文本评论作为研究对象, 通过对在线评论内容进行情感分析, 以有效识别评论内容所隐含的情感倾向及其对购买决策的影响。

二、理论基础和研究假设

(一) 从众理论和归因理论

当消费者在线上购物时, 一般会比较关注信用和评级比较好的店铺和商品。好评数量的说服效果可以用从众效应来解释。Bumkrant将从众定义为建立一个群体规范并使得个体具有遵从这一群体规范的倾向性, 即如果大量的他人都做出同样的选择将减少购买前的知觉风险和购买之后的决策遗憾, 人们往往会遵从大多数人的意见, 并忽视少数人的意见。在购买决策过程中, 消费者通常将其他消费者对产品的评价作为产品信息的主要来源之一[1]。当个体把从他人接受的信息作为产品真实质量的证据时, 从众的压力来源于人际间信息的影响, 从众效应受团体规模的影响[2], 跟随大量做出相同决策的人们能够降低购后后悔的风险[3]。

归因理论认为人们具有一种基本的预测和控制环境的需要, 以及理解他人如何做的原因之所在[4], 即当人们试图去寻找其他人行为的原因时, 会考虑导致行为的原因究竟是个体内部还是外部的原因[5]。当消费者在意见平台上寻找产品评论时, 会发现大量既包含正面也包含负面的信息。当处于低一致性时, 即正面评论和负面评论差不多时, 消费者可能会认为负面评论的作者对产品不愿意使用或者评价。然而, 当消费者面临的是产品的大量正面信息或负面信息时, 消费者倾向于知觉为高度的一致性[6]。据此提出如下假设:

H1: 好评数量对用户购买决策有正向影响。

( 二) 信息易获得性与诊断力理论

情感倾向分析是对用户主动发布的内容进行有效的分析和挖掘, 识别出这些内容的情感趋势———赞同或反对、高兴或者悲伤, 了解用户真正感受。由于现实生活中中文对情感的表达往往是微妙的和复杂的, 面向大规模文本时, 需通过不同维度探测和评估文本对特定主题的情感倾向。Liu等认为评论者的经验、评论的写作风格和评论的时效对潜在消费者购买决策有影响[7]; 郝媛媛等以电影的在线评论为研究对象, 考察了包括正负情感、观点表达形式、评论体裁以及评论标题等影响评论有用性的重要文本特征[8]; Chen等提出了评价在线商品评论质量的9个维度[9]; 蔡晓珍证明产品词汇量、修饰词汇量、评论者活跃度、评论支持率、评论长度以及情感表达强度指标在面向情感分析的评论质量识别中确实有较大的影响[10]。

Herr等人认为信息易获得性在消费者产品判断中具有中介作用。信息易获得性越强, 越容易帮助人们形成对产品的判断, 但若信息诊断力同时也较强时, 信息易获得性的中介效应会减弱[11]。Ludwig的研究指出当负面评论中的情感内容与语言风格相匹配时即文本内容质量高时, 会降低消费者的购买意愿[12]。戢芳等的研究认为消费者通常不会仅仅根据差评的数量做出判断, 他们更希望了解差评的发布者是因何原因给出差评的, 这样差评下面所跟随的评论内容就成为影响消费者决策的一个关键因素[13]。本研究认为, 当好评内容中透露出强烈的正面情感时, 明确地告知他人自己购买商品之后的满足、愉悦的信息为高诊断力正向情感分享信息, 用户就越有可能根据这条信息做出判断和决策; 当好评内容情感倾向具有中立性时, 对用户购买决策的辅助作用较小。因此, 我们提出如下假设:

H2: 好评文本内容的正向情感倾向对消费者的购买决策有正向影响。

当前我国电子商务网站在线评论的总体情况为“正面评论占绝大多数, 负面评论数量极少”, 从归因理论的角度来看, 占数量极少数的负面评论由于存在于大量正面评论当中, 会使得评论的阅读者将评论归因于“高度的一致性”, 而这“高度的一致性”后面是否隐含“不一致”? 在大量的正面评论下, 文本评论所隐含的不同情感倾向是否会对潜在顾客的购买意愿产生影响? 评论数量决定了消费者看到评论口碑的可能性。Liu认为口碑数量反映了口碑互动的总量, 是关于某一产品和服务评论的数量; 口碑数量越多, 消费者接触到它的可能性越大[14]。郑小平的研究表明: 在线评论数量越多, 在线评论对消费者购买决策的影响越大; 如果对某产品的相关评论越多, 且评论中既有正面评论也有反面评论, 那么消费者对产品的了解会更深入和全面, 在线评论对其购买决策的影响更大[15]。据此提出如下假设:

H3: 好评数量和好评文本内容情感倾向存在交互作用;

H3a: 当好评文本内容的情感倾向正向时, 数量多比数量少的好评对用户购买决策影响大;

H3b: 当好评文本内容的情感倾向中立时, 好评数量多对用户购买决策有影响;

H3c: 当好评文本内容的情感倾向反向时, 好评数量多对用户购买决策有影响。

综上, 本研究构建图1所示的概念模型, 即好评的数量和好评文本内容的情感倾向对用户的购买决策有影响, 好评文本内容的不同情感倾向决定了好评数量对购买行为的影响。

三、研究设计

( 一) 实验情境设计

本研究采用情景模拟实验法来检验上述提出的假设。实验设计为3 ( 情感倾向: 正向vs中立vs反向) * 2 ( 评价数量: 20条好评vs 5条好评) 共6种实验条件, 每种实验条件至少保证30个被试。本研究以选用没有性别需求差异, 且大学生都很喜欢和感兴趣、网上评论又比较多的智能手环为实验商品, 以其在线好评内容为研究背景。

在正式实验之前, 利用抓取程序获取初始评论集, 经过滤筛选后, 选用ICTCLAS中文分词系统进行断句、分词, 基于句子中出现的情感字及上下文的句法结构对比情感分类器来判定每个句子的情感倾向; 而后邀请了20名不参加主实验的被试对象仔细阅读筛选后的评论, 从“修饰词汇、情感表达、产品词汇、评价尺度”4个维度进行3量表评价, 1分代表最低, 3分代表最高 ( 表1) , 对情感性倾向的好评进行操控性检验。结果表明正向情感、中立情感、反向情感的好评均值呈现显著差异 ( M正向情感= 2. 49 vs M中立情感= 1. 75, t =3. 57, p = 0. 038 < 0. 5; M正向情感= 2. 49 vs M反向情感=2. 35, t = 3. 76, p = 0. 027 < 0. 5; M中立情感= 1. 75 vsM反向情感= 2. 35, t = 3. 41, p = 0. 031 < 0. 5 ) , 量表的信度α = 0. 7。

正式实验开始, 被试被随机分到6个实验组。每个实验组的被试者阅读到不同情境设置条件下的相关评论, 然后回答随后的与购买意愿有关的题项。为了保证所有参加实验的被试都仔细阅读了实验材料, 本研究特意设置在每个评价组有一个情感倾向中性的中评。

( 二) 研究变量

1. 被解释变量。将用户是否购买设为因变量。用户阅读相关评论后, 选0表示用户没有购买该产品, 选1表示用户购买了该产品。

2. 解释变量。好评数量和情感倾向的评价内容为自变量。我们把好评数量分别确定为5条和20条。从“修饰词汇、情感表达、产品词汇、评价尺度”4个维度进行5量表评价, 1分代表最低, 5分代表最高。

3. 控制变量。在问卷中, 把购物经历、产品认知程度、用户对线上评论的态度及信任倾向作为控制变量, 均采用linkert 5分量表测量。购物经历和产品认知程度用一个题项测量, 购物经历“非常少”用1表示, “非常丰富”用5表示; 产品认知程度“从没听说”用1表示, “非常熟悉”用5表示; 用户对线上评论的态度用3个题项测量, 分别是“购物总看网上评论”、“网上评论对我有用”和 “网上评论使我对购买该商品有信心”; 信任倾向用3个题项测量, 分别是“一般都会相信他人”、“倾向于信赖他人”以及“觉得人性是可以信赖的”。

四、假设检验和数据分析

用线性回归模型检验好评数量和情感倾向评论内容对消费者购买行为的影响, 共线性检验表明各自变量之间不存在共线性问题 ( 容差 = 1, VIF = 1 < 10) 。

首先验证H1: 好评数量对消费者购买行为的影响。控制购物经历、产品认知程度、信任倾向和线上评论态度四个变量后, 好评数量对消费者购买行为有正向影响 ( β = 0. 213, p < 0. 05) , 即好评的数量越高, 消费者购买的可能性越大, H1通过检验。

而后验证情感倾向的好评内容对消费者购买行为的影响。控制购物经历、产品认知程度、信任倾向和线上评论态度四个变量后, 正向情感倾向的评价内容对消费者购买行为有显著的正向影响 ( β = 0. 331, p < 0. 05) , 即评价内容的正向情感倾向越强, 用户购买的可能性越高, H2通过检验。

最后, 检验好评的数量和情感倾向评价内容之间的交互作用。控制购物经历、产品认知程度、信任倾向和线上评论态度四个变量后, 二者的交互作用显著 ( β = 0. 206, p < 0. 01) , H3通过验证 ( 见表2) ; 接着对这种交互关系进行进一步验证, 二项逻辑回归的分析结果 ( 见表3) 说明: ( 1) 好评的数量和情感倾向的文本内容对消费者购买行为均有正向影响, 但好评数量并不必然对用户的购买行为有正向影响。 ( 2) 当好评情感倾向正向时, 好评的数量对消费者购买行为有正向影响 ( β = 0. 393, p < 0. 05) ; 但是当好评情感倾向中立 ( β = 0. 2, p > 0. 05 ) 或反向 ( β = 0. 099, p >0. 05) 时, 好评数量的多少对用户购买行为并不会产生影响。

五、研究结论与不足

( 一) 研究结论

首先, 好评对用户购买行为的影响不是简单的线性关系。好评数量和情感倾向的好评内容之间有交互影响, 好评的数量和正向情感倾向的评论文本内容对用户购买行为有正向影响。好评数量越多, 用户购买的可能性越高, 说明好评数量可以产生从众效应, 从而对用户的购买行为产生影响。

其次, 当好评文本内容的情感倾向正向时, 用户会将其归因于商品评价内容透露出的购买商品之后的满足、愉悦的高诊断力信息, 就可能根据这条信息做出判断和决策; 当好评内容情感倾向中立但不极端时, 用户归因于商品评价内容情感表达模糊, 购买决策会受影响; 当好评内容情感倾向反向时, 用户归因于商品评价内容透露出的不满意, 购买决策也会受影响。

最后, 当好评内容正向情感倾向时, 好评数量会影响消费者的购买行为, 数量最多的好评会显著增大消费者购买的可能性; 当好评内容情感倾向中立或反向时, 好评数量的多少对消费者购买行为没有显著影响。这说明简单地通过好评数量判断好评的影响力是不准确的, 好评内容的情感倾向才是关系到用户是否购买的关键因素。

( 二) 研究局限与展望

首先, 本研究仅仅考虑了线上评论的好评, 但在实际的网络评价体系中, 好评很多时候是确认收货时, 对收到商品第一感觉 ( 宝贝与实物相符) 、包装、发货速度、服务态度或物流的评价, 并不是真实使用或体验产品后的感受, 而用户使用产品后进行的无法修改的追评, 可以更真实地反映商品情况, 深入分析追评内容的情感倾向如何影响用户的购买决策无疑是关于线上评论的一个更有实践价值的研究。

其次, 本研究只考虑了评论内容的情感倾向维度, 今后的研究应该挖掘文本内容中其他对消费者购买行为影响力强的诊断性线索, 从而完善对线上评论文本内容的研究。

最后, 在线购物环境下, 好评是用户选择商品和店铺的首选指标, 这是好评具有的积极效应, 但本研究没有把可信度这一变量考虑进来, 未来研究可以考虑追评的情感倾向对消费者购买行为影响, 以及各种评论可信度产生的积极效应与反向情感倾向的消极效应之间的权衡效应对用户购买行为的影响。

摘要:本文从情感倾向角度研究好评的文本内容对用户购买行为的影响是否一致, 结果表明好评的数量和正面情感倾向的评论文本内容对用户购买行为均有正向影响, 更重要的是好评数量与评论文本内容情感倾向之间存在显著交互作用;但是, 好评数量并不必然会对用户的购买行为产生正向影响, 只有当正面在线评论文本情感倾向较高时, 好评数量才会加大用户购买的可能性。

在线评论 篇7

目前对在线评论特征的研究主要有情感特征的挖掘、文本特征、语义特征、数量特征的挖掘。情感特征挖掘方面, 情感分析又称意见挖掘, 按照处理文本的粒度不同可以分为词语级、短语级、句子级和篇章级等。Hatzivassiloglou[1]发表了在词汇级进行情感倾向性分析的研究。杨立公[2]以文本颗粒度为视角, 从情感词抽取、语料库和情感词典构建、评价对象与意见持有者分析、篇章级情感分析、实际应用5个方面对文本情感分析文献进行了综述。Abbasi[3]对论坛帖子语料进行了情感分类任务的特征工程建设。王洪伟[4]对在线评论的情感特征采用了基于自然语言和语义特性的方法, 来判断情感极性。文本特征挖掘方面, 赵妍妍[5]通过结合文本挖掘、信息抽取、机器学习、自然语言处理等文本处理技术对主观性文本进行分析、处理和归纳。Pang[6]借鉴了传统自然语言处理中的文本分类技术, 使用了3种机器学习的分类方法:朴素贝叶斯、最大熵模型和支持向量机模型。语义特征挖掘方面, Cao等[7]运用文本挖掘的方法从实证研究的角度应用logit回归模型研究不同的评论特征如基本特征 (评论星级、评论时间等基本内容) 、格式特征 (评论字数、评论中包含的句子数等) 、语义特征 (评论中的情感倾向) 对评论有用性投票数的影响。Turney[8]利用语义标注规则提取由形容词与副词组成的短语, 然后再用PMI的方法, 进行情感极性判别。李明琴等[9]使用依存关系方法达到90.85%的词义标注正确率和75.84%的语义依存结构标注正确率, 并且还研究了两种语义结构模型, 使得语言结构的描述和长距离的依存关系分析更加可靠。Bickart[10]通过语义分析的方式对评论内容和风格进行了剖析, 验证了评论长度与评论感知价值之间是正相关关系。刘顺利[11]研究评论数量对网上书店销量的影响。数量特征方面, 李恒[12]从评论标题、数量、语义特征进行了在线评论的挖掘。Schindler等[13]认为在线评论的数量更大时, 信息受众的可信度感知更高, 更利于消费者购买决策。

可见, 已有研究大多集中在评论情感、文本、语义和数量的特征挖掘中, 而对评论形式、发送者可信度、接收者专业性等评论特征的挖掘信息较少。但实际评论中, 评论形式特征的不同, 以及发送者可信度和接收者专业性的差异, 对消费者最终购买决策也有影响。为此, 为了全面研究在线评论特征对消费者购买决策的影响, 本研究增加了发送者可信度、评论形式和接收者专业性这3个评论特征, 采用数据挖掘算法以研究在线评论特征对消费者购买决策的影响, 最后根据研究结论, 为商家提供建议。

1 在线评论特征提取

1.1 原始信息

本研究采用日销量, 产品ID, 日期, 销量统计, 店铺号, 总销量等特征作为原始信息对采集的数据进行挖掘。这些原始信息基于统计分析挖掘得出。通过挖掘原始信息, 再结合在线评论特征, 分析这些特征对消费者购买决策的影响。

1.2 在线评论特征

通过阅读与梳理文献后, 加入发送者可信度特征、评论形式特征和接收者专业性特征后, 本研究的评论特征分为六大类:发送者可信度特征、评论效价特征、评论形式特征、评论数量特征、接收者专业性特征、接收者卷入度特征。

1.2.1 发送者可信度特征

1) 账号等级特征。账号等级是淘宝网对会员购物实行评分累积等级模式的设计, 消费者每在淘宝上购物一次, 至少可以获得一次评分的机会。淘宝上账号等级有红钻, 蓝钻, 金钻等。账号等级越高, 消费者对发送者的信任随之上升, 对购买决策的影响越大。

2) 评论发送时间特征。产品会随时间的发展而变化, 因此其更新换代的速度是较快的。由于其更新换代, 一年前的评论与当前的评论显然对消费者购买决策的影响是不同的。消费者更倾向于浏览最新的评论信息, 从最新的评论中, 搜寻对自己有用的信息, 以做出更明智的决策。

1.2.2 评论形式特征

1) 图片形式特征。图片评论是消费者在评价时, 在评论内容下方以图片形式进行评论, 图片评论反映了产品的外观、质量, 如色差、运输中产品的损坏程度等[14]。图片评论显示了消费者购物过程中的真实购买行为, 对消费者更具说服力。

2) 文字形式特征。文字评论是消费者在评论时纯粹文字性描述, 不添加其他任何形式的信息。文字评论描述了消费者在购物过程中的实际感知, 包括服务态度、物流速度、产品质量等的描述, 文字评论涉及发送者情感, 消费者通过文字评论, 提取出对自己购买决策有用的评论信息。

3) 追加形式特征。追加评论是指双方评价完成并生效后的180天内, 消费者在使用产品一段时间后, 对产品有了全新的认识, 消费者可以在初次评论的基础上追加评论产品本身[15]。此时, 消费者将有1次追加评论的机会, 商家也会随之多1次解释机会, 更真实地反映了消费者购买后的产品情况。追加评论体现出评论时间差, 而在这时间差里, 消费者购物体验可能发生变化, 可能追加评论与初次评论一致, 也可能追加评论与初次评论矛盾。对比追加评论与初次评论的内容, 消费者可以更好地了解产品的真实情况。

1.2.3 评论效价特征

1) 正面评论特征。正面评论是消费者在评论时对产品满意后发表的评论感想。Amdt[16]的研究表明正面评论促进新食品的购买, 而负面评论降低销售量。余伟萍[17]认为正面评论促进搜索型产品的搜索, 进而提高消费者购买意愿。正面评论增加消费者的购买欲望, 提高消费者的消费热情, 增加最终购买决策的概率。

2) 负面评论特征。负面评论是消费者在完成一次购物体验后, 对产品整个服务过程中的某一环节或者几个环节 (如物流速度、包装、产品质量、商家服务态度等) 不满意后发表的评论感想。Lee等[18]指出, 与正面评论相比, 负面评论的品牌感知影响程度更大。王琦[19]表明负面情感倾向降低消费者对产品的信任, 进而减少购买。负面评论减低消费者的热情, 使消费者对产品的印象大打折扣, 甚至最终放弃购买。

1.2.4 评论数量特征

1) 正面评论数特征。对产品所发表的正面评论, 其评论数量代表着产品受消费者喜爱的程度和认可的程度。正面评论数量越多, 说明此产品越深受消费者认可。消费者对正面评论数量多的产品更喜爱, 增加了消费热情, 进而促进消费者的购买决策。

2) 负面评论数特征。对产品所发表的负面评论, 其评论数量代表产品在某个方面 (质量、物流、服务态度等) 存在缺陷, 消费者对此不满程度较高。负面评论数量越多的产品, 消费者对此非常敏感, 甚至选择直接放弃该产品, 大大降低了购买决策的概率。

3) 累计评论数特征。累计评论数是所有评论者评论的次数。累计评论数代表着产品销售情况, 累计评论数越高, 该产品越受关注, 消费者更认可。累计评论包括正面评论数、负面评论数和中性评论数。消费者基于从众的消费心理, 为了减少购买过程中的感知风险 (经济风险、退换货风险等) , 会选择累计评论数较高的产品, 来保证此次购买过程的顺利。

4) 评论点赞数特征。点赞行为指的是用户对“喜欢”或“赞”这一功能键的操作, “赞”因此被引申为在互动过程中表达喜爱、赞同或支持的含义[20]。点赞行为的功能性特征有表意性、参与性、情感性。发送者发布的评论, 消费者在浏览后, 对此喜欢或赞同, 会进行点赞, 说明消费者对此内容感同身受。点赞数高的产品, 消费者会格外关注, 进而增加了购买决策的机会。

1.2.5 接收者专业性特征

接收者在阅读评论内容时, 可以根据自身对产品的认知, 对发送者的评论内容进行提问。具备较高专业能力的接收者认为他们有足够知识储备来对发送者评论进行提问, 进而指导自己做出正确的决策。Sussan等[21]发现接收者的经验和知识在互联网环境中对信息采纳的中枢路径和边缘路径有影响作用。Gilly[22]认为产品经历较少的消费者感知风险更大。

1.2.6 接收者卷入度特征

Zaichkowsky[23]指出卷入度是消费者感知到的购买产品与个人的相关程度。Dichter[24]的研究认为对产品的强烈占有欲使得消费者产生更多的思考, 并激发强烈的情感, 进而促进购买决策。在高卷入情境下, 与产品相关的因素更有影响力, 接收者经过核心路径对信息进行加工处理;在低卷入度情境下, 产品的外部因素更具有吸引力, 接收者经过边缘路径进行信息加工处理。

为此, 根据以往研究的不足之处, 为了全面地研究在线评论特征对消费者购买决策的影响, 本研究除了评论数量、接收者卷入度、评论效价, 还增加了发送者可信度、评论形式和接收者专业性这三个特征, 利用xg Boost算法和F值度量法, 对在线评论特征进行挖掘, 以研究在线评论特征对消费者购买决策的影响。

综上, 本研究的模型, 如图1所示。

2 研究设计

2.1 数据来源与收集

为了研究在线评论特征对消费者购买决策的影响, 本研究选取的对象是体验型产品。为此, 需要确定一款在消费者中熟悉程度较高的体验型产品 (高卷入度产品) 以进行数据挖掘。由于乳液产品是消费者生活中基本护肤品, 消费者每天都使用, 对产品熟悉度较高, 所以本研究选取乳液产品作为研究对象。本研究以淘宝网乳液产品数据作为实证数据来源, 利用数据魔方爬虫软件, 爬取淘宝网50家店铺的乳液产品评论信息, 共查询了淘宝2015年3~8月的乳液产品评论信息, 共采集1 300 000条评论信息。

2.2 基于评论特征的xg Boost算法分析

利用数据魔方爬虫软件, 爬取的2015年3~8月乳液产品评论数据, 杂乱无章。在进行实证前, 需要对数据进行预处理, 使数据更平滑, 能够使实证结果更准确, 为此本研究选取xg Boost算法来进行数据分析, 来验证评论的有用性。在进行评论数据训练时, 如果分类算法选取不合适, 会存在训练模型过拟合, 而xg Boost算法支持线性分类器, 在代价函数里加入了正则项, 用于控制模型的复杂度, 防止过拟合;评论数据采集时, 存在一些缺失的数据, 而xg Boost算法能自动学习缺失值的分裂方向;且xg Boost算法在训练之前, 预先对数据进行排序, 后面的迭代中重复使用该结构, 减少计算量。因此, 本研究利用xg Boost算法挖掘评论信息, 进而研究评论特征对消费者购买决策的影响。

xg Boost算法是现在较好的分类回归算法, 较其他分类回归算法, 在相同特征下, 回归或者分类效果最好。算法中每一次模型的建立都是根据前面分析的结果, 在损失函数的梯度上建立的。其中, 损失函数 (L函数) 描述的是模型不靠谱程度, 损失函数越大, 则说明模型越容易出错。如果模型能够让损失函数持续下降, 则说明模型在不停地改进, 而最佳方式是让损失函数在其梯度方向上下降。训练误差 (损失之和) 和复杂度构成xg Boost算法的目标函数, 如式 (1) , 复杂度计算公式如式 (2) :

其中:γ是复杂度代价, λ学习率, ω是权重。

2.3 基于xg Boost算法评测指标—F值度量法

本研究采用了对比验证, 对比原始特征 (加评论特征) 与原始特征 (不加评论特征) 的得分数。为了直观地查看两种情境下的得分数, 本研究根据xg Boost算法挖掘的数据, 利用F值来评价加入评论特征后的整体效果, F值计算公式如下:

3 实证分析—以淘宝网乳液产品为例

3.1 乳液产品数据预处理

数据预处理的主要步骤有:数据清理、数据集成、数据变换和数据规约。

数据清理:通过填写缺失值, 光滑噪声数据, 识别或删除离群点, 解决不一致性来“清理”数据。爬取的乳液产品数据有的没有评论数据, 需要填写缺失值, 而xg Boost算法以非缺失值切割, 选择效益最大的, 自动学习缺失值的分裂方向, 填写缺失值。

数据集成:搭建一个集中的类似数据仓库, 将多源的数据信息整合, 冗余信息的处理 (左链接) , 互补信息的增加 (右链接) 等, 最后将结构化的信息用数据库存储, 非结构化的用文件系统存储并在数据库中做地址、内容的索引;或是单独对不同的数据源进行处理, 设定统一的接口规则、传输准则 (XML、WEB) , 根据需求取数据, 进行融合和分析。本次实证将采集的评论和销量按照产品的ID采取了不重复的左链接 (冗余信息的处理) 和有重复的右链接 (互补信息的处理) 这2种方式进行了合并。

数据变换:通过对在线评论数据的挖掘, 构建了发送者可信度的特征、评论形式的特征、评论效价的特征、评论数量的特征、接收者专业性的特征, 对评论数据进行各项量化处理。消费者购买决策转化为二分变量:1 (购买) , 0 (不购买) ;发送者可信度:消费者购买决策转化为二分变量:1 (购买) , 0 (不购买) ;发送者可信度特征:1 (账号等级) , 2 (发送时间近) ;评论效价特征:1 (正面) , -1 (负面) ;评论形式特征:1 (追加形式) , 2 (文字形式) , 3 (图片形式) ;评论数量特征:1 (评论点赞) , 2 (累计评论数) , 3 (正面评论数) , 4 (负面评论数) ;接收者专业性特征:1 (对发送者评论提问) , 0 (未对发送者评论提问) 。

数据规约:数据规约策略包括维规约、数量规约和数据压缩。本研究采用维规约, 利用降维方法, 减少随机变量或属性的个数, 根据评论特征, 对发送者可信度、评论形式、评论效价、评论数量、接收者专业性等特征进行规约。

3.2 乳液产品实证分析结果

以2015年3~7月乳液产品数据作为训练集, 先将产品编号、日期、销量聚类、店铺号尾号、平均日销、总销量、月销量、日评论量共8个原始特征输入, 然后依次加入一个评论特征, 每次训练1200次, 计算每次加入一个评论特征后的F值, 再将加入评论特征后的F值与原始输入8个特征的F值进行对比, 对比2次F值的变化, 结果如表1所示。

对比原始特征与加入评论特征的结果, 发现加入发送者可信度特征后, F值是4 236.125;加入评论形式特征后, F值是4 315.926;加入评论效价特征后, F值是4 229.958;加入评论数量特征后, F值是4 328.691;加入接收者专业性特征后, F值是4 233.135;对比5个实证结果, 得出F评论数量>F评论形式>F发送者可信度>F接收者专业性>F评论效价, 即评论数量特征对消费者购买决策的影响最大, 其次是评论形式特征、发送者可信度特征、接收者专业性特征, 最后是评论效价特征。表明本研究提出的评论形式特征、发送者可信度特征和接收者专业性特征对消费者购买决策影响较大。

为了进一步确认结果, 更改训练的次数, 来对比不同次数下训练集的F值, 结果如表2所示。

训练1 400次的F值是4 233.454, 训练1 200次的F值是422.454, 训练1 200次与1 400次的F值变化不大, 表明本次训练次数选择1 200次即可。训练次数都是1 200次, 数据都经过平滑, 5~7月的F值是4 238.445, 3~7月的F值是4 034.021, F值越高, 结果越准确, 即说明时间间隔长的数据训练效果好, 如表3所示。

通过乳液产品的实证分析结果, 得出时间间隔长的数据训练效果好, 且加入5大评论特征后, 训练集的F值更大, 进而验证了评论特征对消费者购买决策的影响, 更验证了本研究提出的发送者可信度特征、评论形式特征和接收者专业性特征对消费者购买决策的影响。

4 结论

本研究以在线评论特征为基础, 探索发送者可信度、评论形式、评论数量、评论效价、接收者专业性、接收者卷入度等评论特征对消费者购买决策的影响。在线评论特征对消费者购买决策起着重要的作用, 大量在线评论信息直接影响着消费者有用信息的获取。通过乳液产品的实证分析结果表明, 发送者可信度、评论形式、评论效价、评论内容、接收者卷入度、接收者专业性等评论特征均显著影响消费者购买决策。因此, 为商家提供如下建议:

第一, 发送者可信度特征方面, 账号等级和评论发送时间对消费者购买决策具有正向影响作用。为此, 商家应该鼓励发送者发布评论, 增加账号等级;同时, 商家应该积极引导发送者及时发布评论, 评论发送时间越接近消费者决策时间, 该评论对消费者的影响效果越大。

第二, 评论形式特征方面, 图片形式、文字形式、追加形式评论影响消费者购买决策。为此, 商家刺激消费者文字评论时, 尽可能详细地描述产品的实际情况, 增加消费者对产品的了解;其次, 商家可以激励消费者在购物后主动晒图评论, 晒出最真实的产品质量及运输过程中的损坏情况;同时商家可以鼓励消费者在购物一段时间后追加评论产品, 反映产品的真实使用情况, 观察是否与原始评论一致, 进而更好的体现购物体验。

第三, 评论效价特征方面, 正面评论和负面评论影响消费者决策。为此, 商家应尽可能鼓励消费者发布正面评论, 尽可能减少负面评论, 消费者更倾向于正面评论的产品, 选择该产品的概率越大。

第四, 评论数量特征方面, 正面评论数、负面评论数、累计评论数和评论点赞数都影响消费者购买决策。为此, 商家可以通过激励 (返现、现金券、积分兑换奖品等) 消费者参与到评论环节中, 增加评论热情, 进而增加评论数量。

第五, 接收者专业性特征方面, 商家可以鼓励消费者对发送者的评论内容进行提问, 鼓励消费者参与评论点赞的环节, 增加接收者与发送者之间的交流与沟通。

在线评论 篇8

关键词:在线评论,网上书店,中文分词,词频,文本分析

一、引言

随着社会、经济、信息技术的发展, 全球的零售业态发生了显著变化, 网络零售市场发展迅速。从网络零售市场交易规模、网络零售企业规模、网络零售用户规模这三方面都可以看出我国电子商务进入了大规模发展的阶段, 预计未来几年, 这一规模仍将迅速持续上升[1]。但是, 国内最大的网上书店卓越、当当和京东网最近的图书价格战让本来就微利的网络图书销售行业更加雪上加霜, 网站之间的竞争也愈来愈激烈。这种重价格轻服务的图书销售方式并非正途[1]。那么, 对于中国大型网上书店而言, 如何吸引客户、提升服务、扩大竞争优势成为摆在其面前的关键问题。本文针对该问题, 将图书在线评论系统作为研究的切入点和主题, 以期寻求到提升网上书店竞争力的一种途径。

图书在线评论属于在线评论的范畴, 与传统书评不尽相同。传统书评是指评论或介绍书籍的文章, 它重点是分析书籍的形式和内容。而在线评论 (Online Review) 是一种重要的在线口碑形式, 它是消费者之间通过网络交流的所有关于产品和服务的具体特性、使用或提供商的信息[2]。它包括消费者对产品体验的表述、对产品价格、性能等特征的评价[3]。因此, 图书在线评论不仅包括读者对书籍内容本身的分析评论, 还包括对主观喜好、阅读感受、购买感受、相关服务等的评论, 它为其他读者或消费者选择和购买图书提供了决策依据。但是, 图书在线评论数量庞大, 如何从中获得有效信息成为一个焦点问题。

国内外对于在线评论的研究集中在以下四个方向: (1) 在线评论对消费者购买行为和销售的影响。卢向华通过第三方的餐馆在线评论数据分析了评论分值、评论数量、产品价格等因素对销售收入的影响[4]。郝媛媛通过国外影评数据, 研究了在线评论对消费者感知和购买行为的影响, 她主要从情感倾向角度对评论内容作了文本挖掘[5], 但是其研究对象是英文电影评论, 英文文本挖掘方法与中文文本挖掘方法存在很大的差别, 不能直接挪用。 (2) 在线评论有用性的影响因素。Ghose研究评论的主客观倾向及主客观混杂度对商品评论有用性的影响[6]。Susan和David根据信息经济学对商品分为搜寻品和体验品, 建立并检验了用户评价有用性的模型[7]。 (3) 在线口碑的传播机制和理论。张晓飞从网络口碑分类, 发布者动机和接受者动机三方面对网络口碑传播的相关研究进行了综述[8]。 (4) 在线评论的文本挖掘方法。Popescu等人将网络评论挖掘问题分为几个子任务:挖掘重要产品特征;挖掘用户对于产品特征的主观观点;判断评论观点的情感导向;根据观点的重要性进行排名[9]。李实在此基础上, 探索了中文客户评论中的产品特征及相关情感倾向的挖掘方法[10]。

通过对国内外相关研究的分析可以看出, 目前的研究还存在以下局限性: (1) 对中文在线评论的文本挖掘研究刚刚起步, 相关研究也只是停留在挖掘方法的研究上, 而没有对如何应用做出回答; (2) 针对图书在线评论文本分析的相关研究几乎空白。本文针对这些问题, 通过中文分词技术对图书在线评论的文本内容进行分词和词性标注, 基于词频统计结果提取文本关键词, 从而发现读者阅读特征、评论关键要素等有价值的信息。

二、图书在线评论的文本分析

本文所研究的图书在线评论, 主要是消费者在网上书店的评论系统上所发表的关于图书读后感、图书内容评论、消费经历、满意度、服务质量等相关的内容。一条完整的图书在线评论一般包括评论标题、评论正文内容、总体打分、评论者相关信息和评论发表时间等信息。中国最大几家网上书店的在线评论系统中还具备对评论投票的功能, 其他阅读评论的消费者可以为评论投有用或无用票。本文结合有用投票比较分析评论的标题和内容。

2.1 中文分词与词频统计

图书在线评论为其他读者、作者、出版社和网上书店提供了丰富的信息和反馈, 但是从数量庞大的评论中快速发现有价值的信息靠人工方式不可能实现, 必须借助一些智能化的方法和工具。人工智能和语言学领域的自然语言处理是进行文本内容分析的基础。本文主要应用中文分词和中文词性标注的技术。

中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。与英文等拉丁语系语言相比, 中文文本的处理存在较大难度, 因此, 中文文本分词技术也处在百家争鸣、不断进步的阶段。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法, 其中基于理解的分词方法还难以实现。分词按照划分的程度分为粗粒度划分和细粒度划分。本文为了更精确的提炼关键词, 采用细粒度划分的分词方法。

为了发现在线评论的有效信息, 对文本分词之后, 需要对词性进行标注, 因为不同词性的词语传达出不同的信息, 例如形容词和副词一般传达出评论者的感情色彩, 名词则一般描述书籍内容。一般词性标注工具可以根据需要进行一级或者二级标注, 其差别在于:一级只标注名词“n”, 动词“v”等, 二级标注可以体现出更具体的内容, 包括具有名词功能的形容词“an”或者动词“vn”, 词素“ng”等等。

得到分词和词性标注结果之后, 为了分析每个词语在文本中的重要程度, 进行词频统计。在给定的文件里, 词频 (Term Frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。为了标准化, 词频通常用一元概率表示。对于在某一特定文件里的词语ti来说, 它的重要性可表示为:

公式 (1) 中ni, j是词语ti在文件dj中的出现次数, 而分母则是在文件dj中所有词的出现次数之和。

2.2 文本分析方法

文本指的是有一定的符号或符码组成的信息结构体。文本由特定的人产生, 文本的语义不可避免地会反映人的特定立场、观点、价值和利益。因此, 由文本内容分析, 可以推断文本提供者的意图和目的。文本分析是指对文本的表示及其特征项的选取, 它是文本挖掘、信息检索的一个基本问题, 它把从文本中抽取出的特征词进行量化来表示文本信息。下面通过中文分词和词频统计技术对图书在线评论进行文本内容分析, 以期发现网络购书读者的阅读习惯、阅读感受和其重点关心的问题。其分析过程如下:

(1) 文本数据准备。首先根据研究目的采集相应的图书在线评论数据, 一般包括评论标题、评论文本内容等信息。将每条评论的标题和评论内容存为独立的tx文本文件。

(2) 建立分析语料库。根据研究目的, 将每一个研究主题相关的txt文本文件存到同一个分析语料库中, 如评论标题语料库、评论内容语料库。

(3) 中文分词和词性标注。对照词库识别提取新词, 将新词加入原始词库。运用中文分词和词性标注工具对不同的分析语料库中的文件进行处理。

(4) 词频统计。根据公式 (1) , 计算出每个词语的在该语料库中出现的频率。建立词语和词频数据文档, 按照词频对词语重要性进行排序, 参考词性标注, 选择与研究目的不相关的词语“是”、“了”等, 将其剔除。

(5) 文本分析。根据词频统计结果, 提取重要词语, 分析评论者关注的主要因素。根据学者对网络口碑的相关研究, 发现消费者最关心口碑的以下方面:产品质量、使用感受、服务态度和发货速度。郝媛媛则从评论标题和内容的正负情感倾向、客观主观观点等角度来研究在线评论的感知有用性[7]。因此, 本文认为可以从情感强度、主观表述、客观表述、评价/感受、图书内容、对网络商城的评价这六方面对重要词汇进行分类整理, 以期从评论中发现有价值的信息。

三、实例:当当图书

3.1 数据来源

本文的图书在线评论数据采集自当当图书。参考当当图书年度畅销榜和图书评论数目, 选取了三本图书的在线评论数据共14197条。该实例的研究目的是发现读者的阅读场所和阅读心情的规律, 以及对比分析有用评论与全部评论所反映出的读者关注的关键因素。采集数据的内容包括:阅读场所、阅读心情、评论标题、评论内容、评论有用票数等五个字段。

3.2 文本分析结果

根据第2部分提出的文本分析方法和该实例的研究目的, 对采集到的数据进行处理。其中文本分析阶段, 根据词频统计结果, 提取出重要词语, 这里选取了标题和内容语料中词频排序前100名的词汇进行深入分析, 其中, 阅读场所和阅读心情语料的词语数量较少, 可以直接用来分析。对于标题和内容按照情感强度、主观表述、客观表述、评价/感受、图书内容、对网络商城的评价这六个维度对重要词汇进行分类整理。统计出每个维度的词频总数, 然后对比分析全部评论和有用评论的区别。

通过以上分析过程, 我们得到了丰富的分析结果和研究发现。首先, 通过对读者在图书评论中关于阅读场所的表述进行分词和词频统计。从数据可以看出, 网上购书读者的阅读习惯是依次喜欢在床上、书桌旁、沙发和办公室等地读书。对于本实例所研究的三本不同类型的图书来看, 该阅读习惯一致。同样的, 对读者在图书评论中关于阅读心情的表述进行分词和词频统计。从数据可以看出, 读者的阅读心情依次是受益匪浅、开心、沉重、过瘾等, 对于实例涉及的三本图书都呈现出这个规律。

对图书在线评论的标题和内容进行了比较分析。在评论标题中, 读者更多是对图书评价、阅读感受和情感强度的表达, 比如“非常喜欢”、“值得推荐”等。在评论内容中, 读者一方面对图书本身的内容做阐述, 另一方面表达自己对图书的评价、阅读感受和情感强度。

然后对比分析了全部评论和获得有用投票评论的标题和内容的特点。首先, 评论标题和内容各有侧重点, 标题侧重评价和感受, 内容侧重对图书内容的描述。其次, 对比全部评论, 有用评论的标题主观性更强, 评论内容的客观性更强, 而对情感强度、评价和感受的描述较少, 对图书内容的描述较丰富。

关于读者对于图书内容的描述, 从提取的相关关键词来看, 读者对图书内容是最关注的, 其次是质量、故事、文字、观点、知识性、角度、风格等。对于相关作者和出版社来说也能从中把握读者对图书的期望。

四、结论

本文结合中文分词和词频统计的方法, 提供了一种分析该类文本数据的方法, 使用该方法可以从海量图书在线评论中发现对消费者、图书作者、出版社和网上书店有价值的信息。本文提出了文本分析的五个步骤:文本数据准备;建立分析语料库;中文分词和词性标注;词频统计;文本分析。在文本分析阶段, 构建了文本分析的六个维度:情感强度、主观表述、客观表述、评价/感受、图书内容、对网络商城的评价。研究结论可以帮助想要网络购书的消费者快速识别出有用的评论, 为图书作者和出版社提供读者反馈, 指导写作和出版的重点领域, 同时为网上书店改进优化其在线评论系统提供了依据, 例如评论系统可以做一些有针对性的引导式选项。

参考文献

[1]2010年度中国电子商务市场数据监测报告[R].中国电子商务研究中心, 2011, 1:11-13.

[2]Stephen, W.L., Ronald, E.G., Bing, P.Electronic word-of-mouth in hospitality and tourism management[J].Tourism Management, 2007, 5 (11) :458-468.

[3]Hennig-Thurau, T., Walsh, G.Electronic word-of-mouth:motives for consequences of reading customer articulations on the Internet[J].International Journal of Electronic Commerce, 2003, 8 (2) :51-74.

[4]卢向华, 冯越.网络口碑的价值——基于在线餐馆点评的实证研究[J].管理世界, 2009, 7:26-32, 131.

[5]郝媛媛, 叶强, 李一军.基于影评数据的在线评论有用性影响因素研究[J].管理科学学报, 2010, 13 (8) :78-88.

[6]Ghose, A., P.Ipeirotis, A.Sundararajan.2005.The dimensions ofreputation in electronic markets[J].Working paper, New York University.

[7]Susan M.Mudambi, David Schuff.What Makes a HelpfulOnline Review?A Study of Customer Reviews on amazon.com[J].MISQuarterly, 2010 (34) :1:185-200.

[8]张晓飞, 董大海.网络口碑传播机制研究述评[J].管理评论, 2011, 23 (2) :88-92.

[9]Popescu A M, Yates A, Etzioni Q.Class extraction from theWorld Wide Web[C].Prec of AAAI-04 Workshop on Adaptive TextExtraction and Mining.San Jose, CA:American Association for ArtificialIntelligence, 2004:1-6.

上一篇:汉字的低碳生活下一篇:海上货物运输合同