章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

专题论文:Web2.0上社会化标签的深度挖掘

已有 10922 次阅读 2014-1-7 15:12 |个人分类:信息组织|系统分类:科研笔记|关键词:学者| 信息组织, 专题, 图书情报工作, 社会化标签

   2013年,我和匹兹堡大学何大庆副教授在《图书情报工作》上组织了一个关于社会化标签挖掘的专题,2013年第23期该专题刊出,共有4篇论文。


    专题:Web2.0上社会化标签的深度挖掘(章成志、何大庆)

信息组织是图书情报学科中的经典研究主题。近10年来,网络信息组织研究不断深入、应用不断扩展,取得了一系列的丰硕成果。随着Web2.0网站的不断普及,针对Web2.0上的用户生成内容的研究也引起了学术界的广泛重视。其中,作为用户生成内容特色之一的社会化标签,在博客、微博、图片、视频等不同类型的社会化媒体上被用户广泛使用,吸引了来自图书情报、计算机、物理学等不同学科研究人员的持续关注。

图书情报学科的研究人员,借助其在传统信息组织上的研究优势,从用户的标注行为、标签的语义、标签在信息检索中的作用等多个角度对社会化标签进行比较全面的研究。近年来,社会化媒体、电子商务网站的快速发展,为社会化标签的研究与应用提供了新的契机。针对社会化标签的标注动机与行为、社会化标签质量、不同语种或平台上标注差异等方面的研究,可以促进社会化标签的深入应用,并提高应用质量。在社会化媒体上进行用户标签推荐研究,利用用户标签或者资源内容描述标签进行信息推荐,可以充分发挥社会化标签的作用,进而提高用户使用标签的积极性,达到良性循环的效果。本专题旨在针对这些新的问题进行初步探索。

本专题共4篇论文。前两篇论文为调研型论文,其中《区分标签类型的社会化标签质量测评研究》一文,主要研究社会化标签的质量评估问题,该文对博文、图书、图片、视频以及音乐的标签进行类型划分,然后邀请志愿者对标签质量进行打分,在此基础上进一步得到标签质量评估数据集,为标签质量分析提供基础;《中英译本图书社会化标签的比较研究》一文,以中英译本的图书为研究对象,进行标签长度、标签个数以及标签的重合度的比较,分析中英文标签在图书标注方面的异同、社会标签在不同类目图书标引的差异以及社会化标签与关键词之间存在的差异。后两篇论文为技术与应用类论文,其中《社会媒体用户标签的分析与推荐》一文,以新浪微博为例,研究面向社会媒体的用户标签预测,综合利用微博用户的微博消息、个人档案、社交网络等信息,为用户预测标签。该技术可用于个性化推荐和搜索等重要应用,也是深入理解社会媒体本质的重要基础;《基于社会化标签信息熵的个性化推荐算法》一文,分析了不同社会属性用户的行为特征,然后根据社会化标签、分类标签和用户属性对各类商品进行深入研究,最后结合二者对现有推荐算法进行一定程度的改进,该文在理论创新的同时,也极具应用价值。

   针对当前网络环境的新特点,本专题对社会化标签的深度挖掘进行了初步研究。随着社会化标签的持续发展和广泛应用,特别是在大数据背景下,针对社会化标签的深度挖掘研究,不但具有重要的理论与应用价值,并且具有一定的挑战性。本专题旨在抛砖引玉,敬请相关领域同行批评指正。

 
   专题论文

11
李蕾, 王冕, 章成志

《图书情报工作》2013年第23期区分标签类型的社会化标签质量测评研究


认为社会化标签多采取自由标引方式,部分标签并不能有效地揭示资源的内容或主题,于是产生许多低质量的标签,这些低质量标签干扰社会标注系统中资源组织的秩序,降低标签在应用场合中的质量和用户满意度。进行基于标签类型的社会化标签质量测评研究,开发标签质量测评网站,邀请志愿者在该网站上对博文标签、图书标签、图片标签、视频标签、音乐标签类型进行划分,得到标签类型分类用的训练数据集和测试集;同时,对标签质量进行打分,在此基础上进一步得到标签质量评估的训练数据集与测试数据集,为以后基于标签类型的标签质量评估提供数据支持。



2013 Vol.57 (23): 11-16,9 [摘要] ( 4 ) [HTMLKB] [PDF1883KB] ( 6 )


17卢超, 章成志

《图书情报工作》2013年第23期中英译本图书社会化标签的比较研究


认为随着Web2.0的发展,社会化标注系统也开始影响图书馆传统的信息组织方式。以中英译本的图书为研究对象,从豆瓣、Amazon、Librarything获取社会化标签,从中国国家图书馆和美国国会图书馆获取MARC记录中的主题词,探究每本书的标签和主题词在长度、个数和相似度三方面的差异。实验结果显示:不同语种的标签或主题词在长度、个数和相似度三方面存在差异;不同类目的图书的社会化标签在这三方面也存在差异;单本书的社会化标签与主题词之间同样存在差异。该研究能够帮助图书馆了解社会化标签并借此提升用户服务品质。



2013 Vol.57 (23): 17-23 [摘要] ( 1 ) [HTMLKB] [PDF1345KB] ( 2 )


24涂存超, 刘知远, 孙茂松

《图书情报工作》2013年第23期社会媒体用户标签的分析与推荐


微博是Web2.0时代重要的网络服务工具,作为以用户为中心的信息发布、传播和分享平台,它包含了非常丰富的用户信息。在微博中,可以使用标签表示用户的兴趣和属性。而一个用户的兴趣和属性,通常包含在这个用户的文本信息和网络信息中。针对微博用户的标签进行分析,提出网络正则化的标签分发模型(NTDM)来为用户推荐标签。NTDM模型对用户个人简介中的词语和标签之间的关系进行建模,同时利用其社交网络结构作为模型的正则化因子。在真实数据集上的实验表明,NTDM在效果以及效率上都优于其他方法。



2013 Vol.57 (23): 24-30,35 [摘要] ( 1 ) [HTMLKB] [PDF1910KB] ( 1 )


31王军, 张子柯

《图书情报工作》2013年第23期基于社会化标签信息熵的个性化推荐算法


认为社会化标签没有特定的组织结构,标签的质量也会有优有劣。此外,同一个社会化标签对不同的人重要程度不尽相同。首先利用信息熵来刻画社会化标签对用户的重要性,然后将基于社会化标签信息熵算法和经典的协同过滤算法的个性化推荐结果进行对比,最后发现基于社会化标签信息熵算法在准确度上提高了10.9%。



2013 Vol.57 (23): 31-35 [摘要] ( 2 ) [HTMLKB] [PDF1121KB] ( 1 )





https://m.sciencenet.cn/blog-36782-756808.html

上一篇:李斌博士学术报告通知:汉语认知属性数据库的构建
下一篇:专题论文:多语言高质量社会化标签生成与聚类

11 徐硕 赵星 刘桂锋 王芳 王晓光 魏瑞斌 杜建 化柏林 赵宇翔 陆泽橼 许培扬

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 01:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部