科学网

 找回密码
  注册

tag 标签: 评论挖掘

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

利用图书评论数据来评价图书的影响力
热度 2 timy 2016-3-29 09:29
随着学术专著(或图书)的数量不断增加,评价图书的影响力问题日益重要,评价的结果可用于学术图书的推荐,例如,在某一领域,从众多的学术图书中挑选出有影响力的图书,推荐给要进入该领域的初学者。 与传统的论文或期刊评价不同的是,学术图书的被引信息相对较少(在自然科学领域,学术图书被引信息更少),完全从被引角度来评价学术图书影响力存在一定的难度。另外关于图书的专业书评信息也较少,有些图书是有了一定影响力之后才出现书评。因此,从可依据的资源来看,评价学术图书的影响力比传统的论文或期刊评价难度要高。 当前,已有研究者利用Google Books、图书馆藏量、出版社声誉等信息来对图书进行替代式的评价(Altmetrics),然而这些方法还过于宏观、没有从内容层面来对图书影响力进行评价,并且无法判断影响力背后的实际原因。 为此,我们利用网络上(特别是电商网站上)关于学术图书的丰富的评论文本,进行文档与属性层面的评论挖掘,来考察学术图书的影响力。在试验中,我们以中文学术图书为例,具体做法为: 首先,以 “中国人文社会科学图书学术影响力报告” (2011年出版)中的学术图书为基础,我们选择经济学、管理学、图书情报、心理学以及文学等5个学科领域的图书作为实验对象。将以上5个学科领域的图书在亚马逊中文站点上的图书评论采集下来。 然后,我们利用评论挖掘技术(主要为多粒度情感分类,包括段落级情感分类、属性识别与属性情感极性分类等方法)对图书评论进行多粒度的挖掘。 接着,我们利用图书的正面评论数、负面评论数、属性情感值、图书评论星级(1~5)、评论有用性信息(0~1),通过熵权方法进行融合,得到图书的综合分值。 最后,对图书影响力分值与传统图书被引频次进行相关性分析。 相关性分析结果表明:虽然不同学科领域有明显差异,但是在线图书评论确实能够反映图书的学术影响力。因此,我们认为从替代计量角度来看,在线评论可以作为挖掘图书多粒度、内容层面影响力的有效资源。此外,我们提出的方法也可用于评价学术出版物之外的其他图书的影响力。 我们的具体工作可以参加如下论文: Qingqing Zhou, Chengzhi Zhang*, Star X. Zhao, Bikun Chen. Measuring book impact based on the multi-granularity online review mining . Scientometrics . 2016. http://dx.doi.org/10.1007/s11192-016-1930-5 感谢赵星、陈必坤老师在论文修改过程中给予的有价值的建议。
个人分类: 同行交流|9719 次阅读|4 个评论
中美网民购物行为有何差异? 用电商网站产品评论来回答
热度 3 timy 2016-2-16 20:52
不同国家、地区或民族的网络用户,在购物行为上本来就存在差异。研究不同人群之间的购物行为差异,对产品设计、市场营销等都具有重要的参考价值。以往的关于不同人群购物行为的研究多以人工问卷调研(我们称之为传统问卷调研)为基础,调研成本高、周期长。当前电商网站上存在大量的购物评论,这些评论为研究网民的购物行为提供了充分的数据基础。为此,我们以亚马逊国际站 (amazon.com,主要为美国用户)与中国站(amazon.cn)上的购物评论为数据源,具体地以数码相机、智能手机以及平板电脑等三种IT产品的中英文评论为基础,提出基于问题答案自动生成与评论挖掘相结合的自动问卷调研方法,并给出关于中外用户购物行为差异的问卷调研结果。 机器自动问卷调研的结果表明:在数码相机、智能手机以及平板电脑等三个领域,中美用户购物时有较大差别,如:中国用户对产品表达看法时没有美国用户直接;美国用户更加关注产品的细节;中国用户对产品的外部特征(如外观、颜色等)关注度高、而美国用户对产品内部性能更加关心。 与传统问卷调研的方式相比,通过自动问卷调研方式研究用户购物行为,具有成本低、周期短的优点。进一步地通过海量的评论数据,研究不同国家、地区或民族的行为差异,可能是一个有趣的研究方向。当然,目前的自动问卷调研结果的质量还没有完全达到人工问卷一样的质量。我们现在还仅仅利用了最简单的基于模板的问题生成模型,今后我们拟采用QA中更好的问题与答案生成技术,来进一步提高自动问卷的质量。随着自动问卷调研、产品挖掘、情感分析等关键技术的不断发展和优化,我们相信,基于自动问卷调研技术的用户研究将是一个比较有前途的研究方向。 我们的具体工作可以参见如下论文: Qingqing Zhou, Rui Xia, Chengzhi Zhang*. Online shopping behavior study based on multi-granularity opinion mining: China vs. America . Cognitive Computation . 2016. http://dx.doi.org/10.1007/s12559-016-9384-x.
个人分类: 自然语言处理|10220 次阅读|6 个评论
一个有意思的关于twitter数据的研究
热度 1 timy 2012-12-27 01:25
一个有意思的关于twitter数据的研究
意大利 特伦托大学大学语言、交互与计算 实验室 有个有意思的项目 叫 tweetolife (the science of human life in Twitter messages ), 利用 Twitter 数据来 进行人类生活的研究。 依据 Twitter的 数据进行统计分析,结果显示 : 1. 男的喜欢谈钱,女的更喜欢说爱,男的 “ 怕”死,女的更热爱生活 。 (图片来源于: http://www.tweetolife.com/gender/query?words=love%2C+money%2C+life%2C+deathSubmit= ) 2. 骂人时,从常用词来看,男人和女人差别不大 (注 : 在新浪微博上,可能差别大的去了) 。 (图片来源于: http://www.tweetolife.com/gender/query?words=fuck%2CshitSubmit= ) 当然, 以上结论 针对个体而言,可能没啥意义。
个人分类: 信息检索|7432 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-6 06:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部