科学网

 找回密码
  注册

tag 标签: 信息组织

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

专题论文:多语言高质量社会化标签生成与聚类
timy 2015-10-30 15:21
随着Web 2.0 网站的不断兴起, 不同语种的社会化标签日益增多。社会化标签是互联网用户对网络上的Web 资源进行协同标注的结果, 是广大用户从自身角度对文本信息内容的揭示, 融入了互联网用户的集体智慧。同时, 不同语种用户对Web 资源进行标注, 促使互联网上的多语言社会化标签资源不断丰富。然而, 社会化标签质量参差不齐, 存在标签噪声问题, 对标签的挖掘与应用产生干扰。另外, 不同语言类别的社会化标签广泛存在于一些主流的Web2.0 网站中, 使得同一资源存在不同语种的社会化标签。多语言标签本身是一种很具价值的多语言资源, 在多语言文本挖掘、跨语言信息检索等多语言信息资源的处理及服务领域均具有重要用途。对多语言标签进行聚类, 可以进行跨语言的社区发现、社会舆情监测等应用研究。然而, 多语言标签资源目前尚未被有效挖掘和利用, 缺乏对多语言社会化标签的自动聚类研究与实践。 针对以上问题, 笔者在对社会化标签进行质量评估的基础上, 进行多语言社会化标签的自动聚类研究。建立社会化标签的质量评估框架体系与评估模型; 在考虑语义的基础上, 融合标注资源的内容特征与社会化特征, 进行高质量社会化标签的生成; 对高质量的多语言社会化标签进行自动聚类, 并对聚类结果进行评估。笔者按照以上研究思路开展本专题的研究, 共5 篇文章, 分别涉及社会化标签质量评估、关键词标注行为、标签聚类以及Hashtag 综述。 (1) 社会化标签质量评估方面, 《社会化标签质量自动评估研究》一文针对现有标签质量评估研究割裂标签的内容属性与社会化属性这一问题, 以博文标签作为研究对象, 融合社会化标签内容属性与社会化属性, 利用统计机器模型对社会化标签质量进行自动评估研究。结果显示结合标签的内容属性特征和社会化属性特征, 支持向量机标签质量评估模型评估结果明显优于多元回归和朴素贝叶斯评估结果。 (2) 关键词标注行为方面, 《科研用户博文关键词标注行为差异研究——以科学网博客为例》一文从标注系统使用方式、关键词结构以及标注动机三个角度选取关键词标注比率、用户标注关键词比率、用户标注关键词平均个数、用户标注关键词平均长度以及用户标注关键词重用率5 个标注行为指标, 分析科学网博客中不同类型用户标注行为的差异。结果发现不同职业、专业、注册时间、发博文频率以及职称的用户在部分标注行为上存在显著性差异, 但不同性别以及学历的用户在主要标注行为上不存在显著性差异。 (3) 标签聚类方面有两篇论文。《区分标签质量的机器生成标签聚类研究》一文针对常规标签或词语聚类没有考虑聚类对象的质量差异对聚类效果影响这一问题, 分析不同质量的机器生成标签的聚类效果差异, 研究结果表明高质量的机器生成标签聚类结果比低质量的标签聚类结果更好。《标注内容与用户属性结合的标签聚类研究》一文分析标签聚类中标注内容、用户属性及其二者结合对聚类效果的影响, 结果表明在学科分类体系下, 用户属性与标注内容的结合均对标签聚类的结果有所提升。 (4) 《Hashtag 研究综述》一文对Hashtag 的功能与特性、推荐Hashtag 的方法、Hashtag 的分类与聚类、Hashtag 的应用等研究进行归纳和总结, 分析当前Hashtag 研究的热点, 并对未来研究与应用提出展望。 在当前的大数据与社会媒体快速发展的背景下, 针对多语言高质量社会化标签的挖掘研究, 不但具有重要的理论与应用价值, 并且具有一定的挑战性。本专题旨在抛砖引玉, 敬请相关领域同行批评指正。 章成志 专题论文: --------------------------------------------------------------------------------------------------------------------------------------------- 论文1: 社会化标签质量自动评估研究 章成志 李 蕾 摘要: 【目的】对用户标注的大量标签实现自动评估, 自动选择或推荐高质量的标签, 提高社会化标签应用效果。【方法】现有的标签质量评估研究割裂了标签的内容属性与社会化属性, 没有结合标签多方面属性进行综合评估。因此本文以博文标签作为研究对象, 融合社会化标签内容属性与社会化属性, 利用统计机器模型对社会化标签质量进行自动评估研究。【结果】结果显示, 结合标签的内容属性特征和社会化属性特征, 支持向量机标签质量评估模型评估结果明显优于多元回归和朴素贝叶斯评估结果。【局限】仅使用科学网博文的标签数据, 其社会化功能还不够完善, 一些社会化属性并不能有效地提高社会化标签质量自动分类效果。【结论】该工作为进一步提升社会化标签的组织与应用质量打下基础。 —— 章成志,李蕾. 社会化标签质量自动评估研究. 现代图书情报技术, 2015, 10: 2-12. 论文2:科研用户博文关键词标注行为差异研究——以科学网博客为例 张颖怡 章成志 池雪花 李 蕾 摘要: 【目的】为优化标注系统提供依据, 同时丰富网络环境下用户标注行为的研究。【应用背景】不同人群的关键词标注行为差异研究是用户信息行为研究中的一个重要方面。【方法】从标注系统使用方式、关键词结构以及标注动机三个角度选取关键词标注比率、用户标注关键词比率、用户标注关键词平均个数、用户标注关键词平均长度以及用户标注关键词重用率5 个标注行为指标, 分析科学网博客中不同类型用户标注行为的差异。【结果】分析结果发现, 不同职业、专业、注册时间、发博文频率以及职称的用户在部分标注行为上存在显著性差异, 但不同性别以及学历的用户在主要标注行为上不存在显著性差异。【结论】学术博客可以根据不同类型用户的标注行为差异,对博文标注系统进行优化。 —— 张颖怡,章成志 ,池雪花, 李蕾. 科研用户博文关键词标注行为差异研究*——以科学网博客为例. 现代图书情报技术, 2015, 10: 13-21. 论文3:区分标签质量的机器生成标签聚类研究 章成志 顾晓雪 摘要: 【目的】常规的标签或词语聚类没有考虑聚类对象的质量差异对聚类效果的影响, 本文旨在分析不同质量的机器生成标签的聚类效果差异, 并提出融合标签质量的标签聚类算法优化建议。【方法】首先, 抓取Engadet 中英文博客数据, 对其进行数据预处理得到候选标签, 抽取标签社会化特征与内容特征并进行权重计算, 采用两种标签质量区分策略, 得到不同质量的标签集合; 然后, 对不同质量的标签集合进行相似度计算, 使用AP 算法进行聚类, 分析比较它们的聚类结果。【结果】实验结果表明, 对于中英文标签, Top5 标签聚类结果要优于Top5-10 标签聚类结果, 加权社会化属性标签聚类结果优于不加权社会标签聚类结果。【局限】区分标签质量的方法比较单一, 缺乏评价标签质量的有效方法。【结论】高质量的机器生成标签聚类结果比低质量的标签聚类结果更好, 对标签的社 会化属性的加权能够提高机器生成标签的聚类效果, 且社会化属性可以作为区分标签质量的特征之一。 —— 章成志,顾晓雪. 区分标签质量的机器生成标签聚类研究. 现代图书情报技术, 2015, 10: 22-29. 论文4:标注内容与用户属性结合的标签聚类研究 顾晓雪 章成志 摘要: 【目的】研究标签聚类中标注内容与用户属性及其结合对聚类效果的影响。【方法】采用科学网博客数据,对其进行特征抽取、模型构建和相似度计算, 利用线性函数和Sigmod 函数进行相似度加权, 并使用AP 聚类算法进行标签聚类。【结果】在学科分类体系下, 用户属性与标注内容的结合均对标签聚类的结果有所提升, Sigmod加权表现最优; 在系统分类体系下, 两者结合均不如标注内容结果表现优秀。【局限】选择的数据量较小, 评估标签聚类的分类体系不够完善, AP 聚类算法不适用于大数据的处理。【结论】两种特征的结合在部分情况下能够提高聚类效果, 标签聚类中应更加关注标签的内容特征。 —— 顾晓雪,章成志. 标注内容与用户属性结合的标签聚类研究. 现代图书情报技术, 2015, 10: 30-39. 论文5: Hashtag 研究综述* 邵 健 章成志 李 蕾 摘要: 【目的】分析当前Hashtag 研究思路和技术, 归纳和总结当前Hashtag 研究中所存在的问题, 并提炼Hashtag 研究的理论意义与实际意义, 为更深入的Hashtag 研究提供参考。【文献范围】以2007 年至2015 年的国际会议和国内外期刊的60 篇文献作为主要研究对象。【方法】调研Hashtag 研究及其应用的相关文献, 对Hashtag 研究中各环节涉及的方法进行分析和总结。【结果】Hashtag 在用户使用、Hashtag 挖掘与基于Hashtag的应用研究三方面存在一些可以深入研究的问题。【结论】未来应侧重于Hashtag 的理论研究, 如用户标注Hashtag 的动机、影响Hashtag 标注的因素等。在实际应用中, 结合不同学科方法和多个领域的技术改善Hashtag在实际应用中的效果。 —— 邵健,章成志,李蕾.标注内容与用户属性结合的标签聚类研究. 现代图书情报技术, 2015, 10: 40-49.
个人分类: 信息组织|7861 次阅读|0 个评论
专题论文:Web2.0上社会化标签的深度挖掘
热度 3 timy 2014-1-7 15:12
2013年,我和匹兹堡大学何大庆副教授在《图书情报工作》上组织了一个关于社会化标签挖掘的专题,2013年第23期该专题刊出,共有4篇论文。 专题:Web2.0上社会化标签的深度挖掘 (章成志、何大庆) 信息组织是图书情报学科中的经典研究主题。近 10 年来,网络信息组织研究不断深入、应用不断扩展,取得了一系列的丰硕成果。随着 Web2.0 网站的不断普及,针对 Web2.0 上的用户生成内容的研究也引起了学术界的广泛重视。其中,作为用户生成内容特色之一的社会化标签,在博客、微博、图片、视频等不同类型的社会化媒体上被用户广泛使用,吸引了来自图书情报、计算机、物理学等不同学科研究人员的持续关注。 图书情报学科的研究人员,借助其在传统信息组织上的研究优势,从用户的标注行为、标签的语义、标签在信息检索中的作用等多个角度对社会化标签进行比较全面的研究。近年来,社会化媒体、电子商务网站的快速发展,为社会化标签的研究与应用提供了新的契机。针对社会化标签的标注动机与行为、社会化标签质量、不同语种或平台上标注差异等方面的研究,可以促进社会化标签的深入应用,并提高应用质量。在社会化媒体上进行用户标签推荐研究,利用用户标签或者资源内容描述标签进行信息推荐,可以充分发挥社会化标签的作用,进而提高用户使用标签的积极性,达到良性循环的效果。本专题旨在针对这些新的问题进行初步探索。 本专题共 4 篇论文。前两篇论文为调研型论文,其中《区分标签类型的社会化标签质量测评研究》一文,主要研究社会化标签的质量评估问题,该文对博文、图书、图片、视频以及音乐的标签进行类型划分,然后邀请志愿者对标签质量进行打分,在此基础上进一步得到标签质量评估数据集,为标签质量分析提供基础;《中英译本图书社会化标签的比较研究》一文,以中英译本的图书为研究对象,进行标签长度、标签个数以及标签的重合度的比较,分析中英文标签在图书标注方面的异同、社会标签在不同类目图书标引的差异以及社会化标签与关键词之间存在的差异。后两篇论文为技术与应用类论文,其中《社会媒体用户标签的分析与推荐》一文,以新浪微博为例,研究面向社会媒体的用户标签预测,综合利用微博用户的微博消息、个人档案、社交网络等信息,为用户预测标签。该技术可用于个性化推荐和搜索等重要应用,也是深入理解社会媒体本质的重要基础;《基于社会化标签信息熵的个性化推荐算法》一文,分析了不同社会属性用户的行为特征,然后根据社会化标签、分类标签和用户属性对各类商品进行深入研究,最后结合二者对现有推荐算法进行一定程度的改进,该文在理论创新的同时,也极具应用价值。 针对当前网络环境的新特点,本专题对社会化标签的深度挖掘进行了初步研究。随着社会化标签的持续发展和广泛应用,特别是在大数据背景下,针对社会化标签的深度挖掘研究,不但具有重要的理论与应用价值,并且具有一定的挑战性。本专题旨在抛砖引玉,敬请相关领域同行批评指正。 专题论文 11 李蕾, 王冕, 章成志 区分标签类型的社会化标签质量测评研究 认为社会化标签多采取自由标引方式,部分标签并不能有效地揭示资源的内容或主题,于是产生许多低质量的标签,这些低质量标签干扰社会标注系统中资源组织的秩序,降低标签在应用场合中的质量和用户满意度。进行基于标签类型的社会化标签质量测评研究,开发标签质量测评网站,邀请志愿者在该网站上对博文标签、图书标签、图片标签、视频标签、音乐标签类型进行划分,得到标签类型分类用的训练数据集和测试集;同时,对标签质量进行打分,在此基础上进一步得到标签质量评估的训练数据集与测试数据集,为以后基于标签类型的标签质量评估提供数据支持。 2013 Vol.57 (23): 11-16,9 ( 4 ) ( 6 ) 17 卢超, 章成志 中英译本图书社会化标签的比较研究 认为随着Web2.0的发展,社会化标注系统也开始影响图书馆传统的信息组织方式。以中英译本的图书为研究对象,从豆瓣、Amazon、Librarything获取社会化标签,从中国国家图书馆和美国国会图书馆获取MARC记录中的主题词,探究每本书的标签和主题词在长度、个数和相似度三方面的差异。实验结果显示:不同语种的标签或主题词在长度、个数和相似度三方面存在差异;不同类目的图书的社会化标签在这三方面也存在差异;单本书的社会化标签与主题词之间同样存在差异。该研究能够帮助图书馆了解社会化标签并借此提升用户服务品质。 2013 Vol.57 (23): 17-23 ( 1 ) ( 2 ) 24 涂存超, 刘知远, 孙茂松 社会媒体用户标签的分析与推荐 微博是Web2.0时代重要的网络服务工具,作为以用户为中心的信息发布、传播和分享平台,它包含了非常丰富的用户信息。在微博中,可以使用标签表示用户的兴趣和属性。而一个用户的兴趣和属性,通常包含在这个用户的文本信息和网络信息中。针对微博用户的标签进行分析,提出网络正则化的标签分发模型(NTDM)来为用户推荐标签。NTDM模型对用户个人简介中的词语和标签之间的关系进行建模,同时利用其社交网络结构作为模型的正则化因子。在真实数据集上的实验表明,NTDM在效果以及效率上都优于其他方法。 2013 Vol.57 (23): 24-30,35 ( 1 ) ( 1 ) 31 王军, 张子柯 基于社会化标签信息熵的个性化推荐算法 认为社会化标签没有特定的组织结构,标签的质量也会有优有劣。此外,同一个社会化标签对不同的人重要程度不尽相同。首先利用信息熵来刻画社会化标签对用户的重要性,然后将基于社会化标签信息熵算法和经典的协同过滤算法的个性化推荐结果进行对比,最后发现基于社会化标签信息熵算法在准确度上提高了10.9%。 2013 Vol.57 (23): 31-35 ( 2 ) ( 1 )
个人分类: 信息组织|11000 次阅读|5 个评论
《Information and Organization》 Top 25
rbwxy197301 2013-3-10 22:32
《Information and Organization》 Top 25
许培扬老师的博客 中提到了The SciVerse ScienceDirect team推出的各个学科各个期刊的热点论文(TOP 25)。很遗憾,这个学科分类中没有Library and Information Science,图情领域的期刊分散在不同的学科当中。如果大家想了解国外图情领域期刊热点论文,可以登录以下 http://top25.sciencedirect.com/archive/42/ 查询。我查询了 Information and Organization的TOP25,结果如下。 刚开始以为这些论文是根据其被引频次从高到低选出来的,但仔细看每篇文章的被引数据时发现,下面的第5、7、8、11、15、24、25这些篇论文并没有被引数据,第3和第这样14被引仅为3和1次。 以下是关于 TOP25 Hottest Articles 的一些说明资料。(摘自: http://www.info.sciverse.com/sciencedirect/using/Make-ScienceDirect-yours/top25/ ) Keep track of the latest trends and discover what your peers and colleagues are reading with ScienceDirect’s free TOP25 Hottest Articles alerting service. The Top25 allows you to see which articles have been downloaded the most, either from any of the 24 subject areas and/or from any of the 2,500 journals on ScienceDirect. Sign me up for the Top 25 ScienceDirect has nearly 11 million regular users which means that the Top25 lists provide an authoritative reflection of readership habits. These reports are generated quarterly, in order to truly reflect usage patterns. The Top25 is based on usage behaviour from the prior three months. So the Top25 lists published in September represent results of ScienceDirect usage during April, May and June of that year. Please note that the Top25 is generated solely from usage of ScienceDirect online. Articles in Press All articles are included in Top25 lists, including Articles in Press. This means that because Articles in Press are available online in ScienceDirect before their print publication, Top25 lists may include articles which have only just been published in the print journals. For example: Top25 lists generated from April - June usage data, will contain articles with publication dates of September. Go to Top25 Note for Authors We receive many requests from authors for information on the specific number of downloads for their articles; unfortunately, it is not ScienceDirect policy to provide this data. In addition, the Top25 service is not intended to infer any sort of preferential ranking to the journals, articles or subjects included, and should not be used as such, other than to present a general indicator of the readership behaviour of our users. 以下是Information and Organization的TOP25论文: 1. The qualitative interview in IS research: Examining the craft Information and Organization, Volume 17, Issue 1, January 2007, Pages 2-26 Myers, M.D.; Newman, M. Cited by SciVerse Scopus (103) 2. An agenda for'Green'information technology and systems research Information and Organization, Volume 21, Issue 1, January 2011, Pages 17-40 Jenkin, T.A.; Webster, J.; McShane, L. Cited by SciVerse Scopus (19) 3. Organizational culture and information systems adoption: A three-perspective approach Information and Organization, Volume 21, Issue 2, April 2011, Pages 57-83 Jackson, S. Cited by SciVerse Scopus (3) 4. Mechanisms for sharing knowledge in project-based organizations Information and Organization, Volume 17, Issue 1, January 2007, Pages 27-58 Boh, W.F. Cited by SciVerse Scopus (31) 5. The institutionalization of information system project management practices Information and Organization, Volume 22, Issue 2, April 2012, Pages 125-153 Mignerat, M.; Rivard, S. 6. Designing interviews to generate rich data for information systems research Information and Organization, Volume 21, Issue 1, January 2011, Pages 1-16 Schultze, U.; Avital, M. Cited by SciVerse Scopus (11) 7. Emergent leadership in virtual teams: what do emergent leaders do? Information and Organization, Volume 14, Issue 1, January 2004, Pages 27-58 Yoo, Y.; Alavi, M. 8. Knowledge management technology as a stage for strategic self-presentation: Implications for knowledge sharing in organizations Information and Organization, Volume 22, Issue 1, January 2012, Pages 37-59 Leonardi, P.M.; Treem, J.W. 9. Materiality and change: Challenges to building better theory about technology and organizing Information and Organization, Volume 18, Issue 3, January 2008, Pages 159-176 Leonardi, P.M.; Barley, S.R. Cited by SciVerse Scopus (93) 10. Real-izing information systems: critical realism as an underpinning philosophy for information systems Information and Organization, Volume 14, Issue 2, April 2004, Pages 87-103 Mingers, J. Cited by SciVerse Scopus (54) 11. Mobile phones during work and non-work time: A case study of mobile, non-managerial workers Information and Organization, Volume 21, Issue 1, January 2011, Pages 41-56 Hislop, D.; Axtell, C. 12. Overcoming theory-practice inconsistencies: Critical realism and information systems research Information and Organization, Volume 16, Issue 3, September 2006, Pages 191-211 Smith, M.L. Cited by SciVerse Scopus (27) 13. What is IT? Information and Organization, Volume 16, Issue 3, September 2006, Pages 212-250 Quattrone, P.; Hopper, T. Cited by SciVerse Scopus (31) 14. Context and the processes of ICT for development Information and Organization, Volume 22, Issue 1, January 2012, Pages 23-36 Hayes, N.; Westrup, C. Cited by SciVerse Scopus (1) 15. Exploring preconditions for open innovation: Value networks in industrial firms Information and Organization, Volume 22, Issue 4, October 2012, Pages 209-226 Westergren, U.H.; Holmstrom, J. 16. Some political and cultural issues in the globalisation of software development: case experience from Britain and India Information and Organization, Volume 11, Issue 1, January 2001, Pages 25-43 Nicholson, B.; Sahay, S. Cited by SciVerse Scopus (96) 17. Information technology and culture: Identifying fragmentary and holistic perspectives of culture Information and Organization, Volume 15, Issue 4, October 2005, Pages 295-338 Gallivan, M.; Srite, M. Cited by SciVerse Scopus (76) 18. Demystifying case research: A structured-pragmatic-situational (SPS) approach to conducting case studies Information and Organization, Volume 21, Issue 3, November 2011, Pages 161-176 Pan, S.L.; Tan, B. Cited by SciVerse Scopus (7) 19. Implementing enterprise resource planning and knowledge management systems in tandem: fostering efficiency and innovation complementarity Information and Organization, Volume 13, Issue 1, January 2003, Pages 25-52 Newell, S.; Huang, J.C.; Galliers, R.D.; Pan, S.L. Cited by SciVerse Scopus (71) 20. Consumer subjectivity in the Age of Internet: the radical concept of marketing control through customer relationship management Information and Organization, Volume 14, Issue 3, July 2004, Pages 211-236 Zwick, D.; Dholakia, N. Cited by SciVerse Scopus (9) 21. Networks, negotiations, and new times: the implementation of enterprise resource planning into an academic administration Information and Organization, Volume 13, Issue 4, October 2003, Pages 285-313 Scott, S.V.; Wagner, E.L. Cited by SciVerse Scopus (72) 22. Designing routines: On the folly of designing artifacts, while hoping for patterns of action Information and Organization, Volume 18, Issue 4, October 2008, Pages 235-250 Pentland, B.T.; Feldman, M.S. Cited by SciVerse Scopus (43) 23. The three tiers architecture of knowledge flow and management activities Information and Organization, Volume 20, Issue 3-4, July 2010, Pages 169-186 Kamhawi, E.M. Cited by SciVerse Scopus (6) 24. From disruptions to struggles: Theorizing power in ERP implementation projects Information and Organization, Volume 22, Issue 4, October 2012, Pages 227-251 Silva, L.; Fulk, H.K. 25. Unpacking ostensive and performative aspects of organisational routines in the context of monitoring systems: A critical realist approach Information and Organization, Volume 22, Issue 1, January 2012, Pages 1-22 Iannacci, F.; Hatzaras, K.S.
个人分类: 科学计量学|4176 次阅读|0 个评论
Google招聘Semantic Analyst(语义分析员)
热度 3 timy 2013-1-8 20:10
Google招聘Semantic Analyst(语义分析员),很少看到他们招图书馆专业的。 虽然当下Big Data在国内这么火,但在信息的组织与集成方面,Google北京还是需要人的设计与参与。 这说明,不管data有多大,信息组织的基本思想还是不变的? ------------------------------------------------------------------------------------ 附:Semantic Analyst(语义分析员)说明 : 来源于: https://www.google.com/about/jobs/beta/search/?jlo=en_US#t=sqq=jd=semanticli=10j=semantic Semantic Analyst Beijing, China Technical Infrastructure · Full-time · 1 day ago As a Semantic Analyst, you will help move Google Search from being an Information Engine to becoming a Knowledge Engine. This transition is powered by Google's Knowledge Graph - a system of organizing things around their real world meanings. You will work on making our Knowledge Graph more useful to users by developing new schema and frameworks to organize this data for everything from Renaissance painters to panda bears. Responsibilities Take responsibility for design, document and implement of a large classification scheme (e.g. a taxonomy or a vertical). Lead manual creation of mappings between different knowledge representation models. Evaluate the mapping results according to the predefined schema. Minimum Qualifications BA/BS degree (In lieu of degree, 1 year of relevant experience). Preferred Qualifications Librarian science or linguist degree or CS degree or equivalent. 1 year work experience in the area of librarian science and taxonomy. Some familiarity or proficiency with organizational system(s) (e.g. database schema/organizing/normalization, biological taxonomy, etc.), scripting or query language(s) (Python, JavaScript, R, SQL, etc.), or able to quickly gain proficiency. Awareness of one or more knowledge or data representation models (entity relationship model, relational calculus, network model, hierarchical database model, RDA, FRBR, Dublin Core, etc.) Project management experience with proven ability to manage multiple projects and apply high quality control to the process flow, define projects and execute within timeline. Excellent written and verbal communication skills in both English and Chinese. Excellent attention to detail; quick learner with creative problem-solving and analytical skills. Area There is always more information out there, and the Knowledge team has a never-ending quest to find it and make it accessible. We're constantly refining our signature search engine to provide better results, and developing offerings like Google Instant, Google Voice Search and Google Image Search to make it faster and more engaging. We're providing users around the world with great search results every day, but at Google, great just isn't good enough. We're just getting started. ------------------------------------------------------------------------------------
个人分类: 信息组织|9944 次阅读|5 个评论
南京理工大学学术报告通知:信息组织研究进展
热度 4 timy 2012-11-4 17:17
信息组织研究进展——星期三青年学者讲堂第二十六讲 报 告 人 : 章成志博士 地 点 : 南京理工大学学术中心第六会议室 时 间 : 2012年11月7日下午2点半 报告摘要 : 当前互联网信息资源的发展呈现三种典型特征,即互联网信息资源的语义化、多语言化以及社会化。为了提升互联网海量信息资源的服务与利用效率,最终实现全球信息整合的目标,语义网、自然语言处理、数据挖掘、信息检索以及信息资源管理等多个学科领域的研究人员进行了坚持不懈的努力。在这一背景下,信息组织研究有了进一步拓展的空间,并呈现出新的研究活力。本报告将介绍当前信息组织的国内外研究进展和发展趋势,并介绍报告人在多语言领域本体自动构建、社会化标签系统等方面的研究成果和进一步研究设想。 欢迎校内外图书馆学、情报学、计算机科学与技术、信息管理和信息系统等专业的研究人员、研究生及本科生参与交流和讨论。 2012年11月7日
个人分类: 同行交流|4951 次阅读|8 个评论
[转载]2012年全国知识组织与知识链接学术交流会征文通知
timy 2012-2-26 21:33
为了探讨知识组织与知识链接的研究与发展方向,尤其是网络环境下知识组织与知识链接的新理念、新思路、新方法,中国科学技术信息研究所、国家科技图书文献中 心、中国科学技术情报学会拟于2012年9月举办“2012年全国知识组织与知识链接学术交流会”,会议具体时间、地点将另行通知,会议将邀请国内外专家 作领域发展前沿主旨报告,现面向全国图书情报界和相关领域广泛征文。 一、征文主题 知识组织 ●网络环境下叙词表编制与应用研究 ●《汉语主题词表》修订、发展与应用 ●知识本体的构建与应用 ●网络环境下检索语言标准研究与发展 ●网络环境下信息组织方法与模式研究 ●语义知识组织技术 ●术语服务语义计算 ●Web2.0信息自组织研究 ●知识组织的理论与实践 知识链接 ●知识链接原理及知识关联方式 ●引文分析与参考链接理论与实践 ●信息相关性与知识相关性理论和应用 ●知识计量评价及服务模式 ●国内外知识服务理论与具体实践 ●科研实体关系网络与关联分析 ●知识图谱与主题图 ●基于用户体验的知识构建 ●关联数据理论与应用   欢迎广大图书馆学、情报学相关研究、教学与实践者,图书馆和信息机构的管理者以及相关信息技术人员踊跃投稿。入选征文将经专家评审后结集出版。 二、征文要求 1、文章要求观点明确、主题突出;来稿必须为未经发表的论文; 2、稿件统一用A4纸排版,以电子邮件方式提供Word格式文档; 3、文章按如下顺序排列:中文题目、中文作者及单位、中文摘要、中文关键词、英文题目、英文作者及单位、英文摘要、英文关键词、正文、参考文献(参考文献按论文出版规范执行)。邮件请注明“2012年全国知识组织与知识链接学术交流会征文”字样; 4、论文后附作者简介材料,并请务必注明作者姓名、单位、联系电话、电子邮箱、通讯地址及邮政编码; 5、正文字数应控制在4000~8000字; 6、征文截止日期:2012年8月1日。 7、会议网址: http://168.160.16.186/conference 8、投稿、联络邮箱:conference istic.ac.cn (发邮件时请将 更换为@) 联系人:王立学 电话:(010)58882369 邓盼盼 电话:(010)58882361 中国科学技术信息研究所 国家科技图书文献中心 中国科学技术情报学会 2012年元月 附件:2012年全国知识组织与知识链接学术交流会征文通知
个人分类: 同行交流|2536 次阅读|0 个评论
[转载]Tag标签高级进阶与资源拓展
热度 1 timy 2011-10-9 23:16
From: http://sociallearnlab.org/wiki/index.php/Tag%E6%A0%87%E7%AD%BE%E9%AB%98%E7%BA%A7%E8%BF%9B%E9%98%B6%E4%B8%8E%E8%B5%84%E6%BA%90%E6%8B%93%E5%B1%95 Tag机制 A、B、C分别表示不同的学习者。 给学习者的建议: 一是不要用无任何语义的符号来做Tag标签; 二是尽可能与自己以往Tag标签建立联系; 三是除非有某种特定需求外,尽可能让自己的Tag标签与其他用户Tag标签建立联系,即尽可能采用领域共有术语进行Tag标签。 Tag标签与Folksonomy分类 Folksonomies: power to the people( by Emanuele Quintarelli) Social Bookmarking Tools (I) A General Review(by Tony Hammond, Timo Hannay, Ben Lund, and Joanna Scott) Folksonomies Tidying up Tags?(by Marieke Guy,Emma Tonkin) Folksonomies - Cooperative Classification and Communication Through Shared Metadata(by Adam Mathes) Beneath the Metadata--Some Philosophical Problems with Folksonomy(by Elaine Peterson) Tag标签与认知研究 A cognitive analysis of tagging(or how the lower cognitive cost of tagging makes it popular)(by Rashimi Sinha) A social analysis of tagging(or how tagging transforms the solitary browsing experience into a social one)(by Rashimi Sinha) Tag标签与社会网络分析 http://del.icio.us/sociallearn/tag http://del.icio.us/bettywong/tagging Tag用户行为研究 2007年中国网民Tag使用状况报告(by 百度) Analyzing Communal Tag Relationships for Enhanced Navigation and User Modeling(by Simpson,Edwin;Butler,Mark H.) Usage patterns of collaborative tagging systems(by Scott A. GolderBernardo A. Huberman) Patterns and Inconsistencies in Collaborative Tagging Systems: An Examination of Tagging Practices(Kipp,Margaret E.I.and Campbell,D.Grant) Tag与搜索 Automated Tag Clustering: Improving search and exploration in the tag space(by Grigory Begelman,Philipp KellerFrank Smadja) Can Social Bookmarking Improve Web Search?(Heymann,Paul;Koutrika,Georgia;Garcia-Molina,Hector) Tag与Library2.0 who says librarians(and teachers)don’t like tags(from del.icio.us blog) Tags(by Lorcan Dempsey) Tags Help Make Libraries Del.icio.us(by Melissa L. Rethlefsen) Internet Librarian Day 1: Innovative Uses of Web 2.0 Technologies(By Meredith Farkas) Tag与语义网,ontology Ontology is Overrated: Categories, Links, and Tags(by Clay Shirky) Tag相关国际会议资源 WWW 2006 Tagging Workshop Proceedings Tagging and Metadata for Social Information Organization(www2007)
个人分类: 信息组织|2819 次阅读|2 个评论
[转载]Knowledge organization literature 2011, n. 1
timy 2011-2-10 16:17
From: http://www.isko.org/kolit111.php Ia C. McIlwaine: Literature Editor Assisted by John McIlwaine and Otto Oberhauser 1949 021 Williamson, Nancy J. – Classification issues in 2008 (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 318-331. 1950 026;325 Fagan, Jody Condit. – Usability studies of faceted browsing: a literature review (Lang.: eng). – In: Information technology libraries, 29(2010)2, pp. 58-66. 1951 026;341 Stanfill, Mary H. et al. – A systematic literature review of automated clinical coding and classification systems (Lang.: eng). – In: Journal of the American Medical Informatics Association, 17(2010)6, pp. 646-651. 1952 032 Chakravarthy, R. C., Murthy, P. R. S. – Encyclopaedia of information technology , 5 v. (Lang.: eng). – Delhi, Pacific Books International, 2011. – ISBN: 9789380472973 . 1953 032 Sanjiv Reddy, T.R., Verma, Shyamgopal. – Encyclopaedia of library science and information technology, 5 v. (Lang.: eng). – Delhi, Pacific Books International, 2011. – ISBN: 9789380472904. 1954 048 Dahlberg, Ingetraut. – Information Coding Classification: Geschichtliches, Prinzipien, Inhaltliches (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)8, pp. 449-454. 1955 06.09-10-29/30 UDC seminar 2009: classification at a crossroads. Multiple directions to usability, The Hague, 2009. Proceedings (Lang.: eng). – In: Knowledge organization, 37(2010)4. Several of the papers were published in Knowledge organization, 37(2010)3 and listed previously. Those in 37(4) are listed individually here: Binding, Tudhope, (732); Broughton (325;42); Dunsire, Nicholson, (755); Osińska, Veslava (348); Šauperl (42;835) 1956 06.10-01-15/20 Guajardo, R. – Recent trends in catalog architecture. A report of the ALCTS Catalog Form and Function Interest Group Meeting, American Library Association Midwinter Meeting, Boston, January 2010 (Lang.: eng). – In: Technical services quarterly, 27(2010)4, pp. 372-375. 1957 06.10-03-28/31 Kosmopoulos, A. et al. – The ECIR 2010 large scale hierarchical classification workshop (Lang.: eng). – In: SIGIR forum, 44(2010)1, pp. 23-32. 1958 06.10-07-19/20 Hubrich, Jessica. – Concepts in Context – Cologne Conference on Interoperability and Semantics in Knowledge Organization: Internationale Fachtagung und Abschlussworkshop des DFG-Projekts CrissCross in Kln (Lang.: ger). – In: Bibliotheksdienst, 44(2010)10, pp. 993-996. 1959 06.10-07-21/23 Pika, Jiri, Hermes, Hans-Joachim. – "Mehr finden durch schlaueres Suchen": Sacherschliessung auf der 34. Jahrestagung der Gesellschaft für Klassifikation (Lang.: ger). – In: B.I.T. online: Zeitschrift für Bibliothek, Information und Technologie, 13(2010)3, pp. 328-331. 1960 06.10-08-10/15 Altenhner, Reinhard et al. – Take a chance on me: Aus den Veranstaltungen , 76. IFLA-Generalkonferenz in Gteborg, Schweden ] (Lang.: eng). – In: Bibliotheksdienst, 44(2010)10, pp. 946-972. 1961 06.10-08-10/15 Jahns, Yvonne. – Take a chance on me: Aus den Veranstaltungen , 76. IFLA-Generalkonferenz in Gteborg, Schweden; Nachtrag zum im Bibliotheksdienst Nr.10, Oktober 21010, erschienenen Beitrag ; addendum to the article in Bibliotheksdienst, 44(2010)10] (Lang.: ger). – In: Bibliotheksdienst. 44(2010)11, pp. 1036-1038. 1962 07.81 Raju, Jaya, Raju, Reggie. – Descriptive and subject cataloguing: a workbook (Lang.: eng). – Cambridge, Chandos, 2006. – pp. 142. – ISBN: 9781843341260. 1963 09.12 Pohl, Adrian, Ostrowski, Felix. – Linked Data - und warum wir uns im hbz-Verbund damit beschftigen! (Lang.: ger). – In: B.I.T. online: Zeitschrift für Bibliothek, Information und Technologie, 13(2010)3, pp. 259-268. – Available at http://eprints.rclis.org/18934/ 1964 111 Samiei, Mitra . – (Lang.: per). – In: Faslname-Ye Ketab/Library information studies, 20(2010)3, pp. 177-196. 1965 112 Narayana, G. J. – Knowledge and information: perspectives and prospects (Lang.: eng). – New Delhi, Ess Ess Publications, 2010. – pp. 629. – ISBN: 9788170006077. 1966 114 Rendon Rojas, Miguel Angel, Herrera Delgado, Lizbeth Berenice. – Bases filosóficas de la organización de la información (Lang.: spa). – In: Perspectivas em Ciencia da Informacao, 15(2010)1, pp. 3-17. 1967 122 Baofu, Peter. – The future of post-human knowledge: a preface to a new theory of methodology and ontology (Lang.: eng). – Cambridge, Chandos, 2008. – pp. 294. – ISBN: 9781843345398. 1968 122 Hjrland, Birger. – The importance of theories of knowledge: indexing and information retrieval as an example (Lang.: eng). – In: Journal of the American Society for Information Science Technology, 62(2011)1, pp. 72-77. 1969 124;212 Jehng, J.-C., Chou, S., Cheng, C.-Y. – A formal concept analysis-based domain-specific thesaurus and its application in document representation (Lang.: eng). – In: Lecture notes in computer science, 6018(2010), pp. 431-442. 1970 125 Oliveira Lima, G. . B. d. – Modelos de categorizaço: apresentando o modelo clássico e o modelo de protótipos (Lang.: eng). – In: Perspectivas em ciência da informaço, 15(2010)2, pp. 108-122. 1971 125 Youkui, Wen, Yuying, Jiao. – (Lang.: chi). – In: Journal of the China Society for Scientific Technical Information, 29(2010)3, pp. 387-392. 1972 126 Stock, Wolfgang G. – Concepts and semantic relations in information science (Lang.: eng). – In: Journal of the American Society for Information Science Technology, 61(2010)10, pp. 1951-1969. 1973 135 Jiang, Chuntao et al. – Text classification using graph mining-based feature extraction (Lang.: eng). – In: Knowledge-based systems, 23(2010)4, pp.302-308. 1974 149 Benbya, Hind. – Knowledge management systems implementation (Lang.: eng). – Cambridge, Chandos, 2008. – pp. 318. – ISBN: 9781843342663. 1975 149 Hagar, Christine, ed. – Crisis information management: communication and technologies (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 9781843346470. 1976 149 Kass, Stephen R. – Information lifecycle management (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 200. – ISBN: 9781843341635. 1977 149 Lambe, Patrick. – Knowledge audits and knowledge mapping: a practical guide for knowledge managers (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 97818343346524. 1978 149 Semertzaki, Eva. – Special libraries as knowledge management centres (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 9781843346135. 1979 149 Webb, Jela. – Strategic information management: a practitioner’s guide (Lang.: eng). – Cambridge, Chandos, 2008. – pp. 244. – ISBN: 978183343769. 1980 149 Young, Tom, Milton, Nick. – Knowledge management for sales and marketing: a practitioner’s guide (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 9781843346043. 1981 157 Al-Obeidat, Feras et al. – Differential evolution for learning the classification method PROAFTN (Lang.: eng). – In: Knowledge-based systems, 23(2010)5, pp. 418-426. 1982 176 Sarkar, P . – Learning image anchor templates for document classification and data extraction (Lang.: eng). – In: International conference on pattern recognition, 20(2010)5, pp. 3428-3431. 1983 191 De Sales, Rodrigo, Guimares, José Augusto Chaves. – Los principios teóricos de Cutter, Kaiser y Ranganathan como elementos de interlocución en organización del conocimento (Lang.: spa). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 21-29. 1984 193 Martinho, Noemi Oliveira, Fujita, Maringela Spotti Lopes. – La catalogación de materias: apuntes históricos sobre su normalización (Lang.: por). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 61-70. Portuguese title: “A catalogao de assunto: apontamentos históricos e a sistematizao de regras”. Lead title in Spanish, but text in Portuguese 1985 194 Weihs, Jean. – A brief history of classification, Part 2 (Lang.: eng). – In: Technicalities, 30(2010)2, pp. 16-19. 1986 194;42;43 Weihs, Jean. – A brief history of classification, Part 3 (Lang.: eng). – In: Technicalities, 30(2010)3, pp.15-18. 1987 194;44;45;46 Weihs, Jean. – A brief history of classification, Part 5 (Lang.: eng). – In: Technicalities, 30(2010)5, pp.14-16. 1988 194;48 Weihs, Jean. – A brief history of classification, Part 4 (Lang.: eng). – In: Technicalities, 30(2010)4, pp.15-18. 1989 199; 935 Lee, Hur-Li. – Divination and the State: classifying technical texts in Han China (Lang.: eng). – In: Library resources technical services, 54(2010)4, pp. 200-211. 1990 214 Akbari, Ismail, Fathian, Mohammad. – A novel algorithm for ontology matching (Lang.: eng). – In: Journal of information science, 36(2010)3, pp. 324-334. 1991 214 Alejandra Segura, N., Garcia-Barriocanal, E., Prieto, M. – An empirical analysis of ontology-based query expansion for learning resource searches using MERLOT and the Gene ontology (Lang.: eng). – In: Knowledge-based systems, 24(2011)1, pp. 119-133. 1992 214 Brandao, S., Oliveira, J., Souza, J. – Knowledge representation with autonomic ontologies (Lang.: eng). – In: Lecture notes in computer science, 6428(2010), pp. 635-644. 1993 214 Currás, Emilia. – Ontologies, taxonomies and thesauri in systems science and systematics (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 200. – ISBN: 9781843346128. 1994 214 Evermann, Joerg, Fang, Jennifer. – Evaluating ontologies: towards a cognitive measure of quality (Lang.: eng). – In: Information systems, 35(2010)4, pp. 391-403. 1995 214 Hilera, José R. et al. – An evolutive process to convert glossaries into ontologies (Lang.: eng). – In: Information technology libraries, 29(2010) 4, pp. 195-204. 1996 214 Janssen, T., Obrst, L., Ceusters, W. – Introduction: ontologies, semantic technologies, and intelligence (Lang.: eng). – In: Frontiers in artificial intelligence applications, 213(2010), pp. 1-12. 1997 214 Martinez, S. et al. – The role of ontologies in the anonymization of textual variables (Lang.: eng). – In: Frontiers in artificial intelligence applications, 220(2010), pp. 153-162. 1998 214 Paredes-Moreno, Antonio, Martínez-López, Francisco J., Schwartz, David G. – A methodology for the semi-automatic creation of data-driven detailed business ontologies (Lang.: eng). – In: Information systems, 35(2010)7, pp. 758-773. 1999 214 Park, Jinsoo, Cho, Wonchin, Rho, Sangkyu. – Evaluating ontology extraction tools using a comprehensive evaluation framework (Lang.: eng). – In: Data knowledge engineering, 69(2010)10, pp. 1043-1061. 2000 214 Rautenberg, Sandro et al. – Ferramenta ontoKEM: uma contribuio à Ciência da Informao para o desenvolvimento de ontologias (Lang.: por). – In: Perspectivas em ciencia da informacao, 15(2010)1, pp. 239-258. 2001 214;539 Couclelis, H. – Ontologies of geographic information (Lang.: eng). – In: International journal of geographical information science, 24(2010)12, pp. 1785-1809 . 2002 214;572 Gašević, Dragan et al. – Vocabularies, ontologies, and rules for enterprise and business process modeling and management (Lang.: eng). – In: Information systems, 35(2010)4, pp. 375-378. 2003 214;753 Daqing He et al. – Supporting information access in e-learning by integrating digital libraries and ontology (Lang.: eng). – In: Online information review, 34(2010)5, pp. 704-728. 2004 214;78-51/4 Smith, B., Brochhausen, M. – Putting biomedical ontologies to work (Lang.: eng). – In: Methods of information in medicine, 49(2010)2, pp. 135-140. 2005 214;872 Badii, A. et al. – Using a network of scalable ontologies for intelligent indexing and retrieval of visual content (Lang.: eng). – In: Studies in computational intelligence, (2010), pp. 233-248. 2006 223 Martínez, Ana María et al. – Concepto, forma y longitud de los términos preferentes del tesauro: una propuesta de indicadores de calidad (Lang.: spa). – In: Anales de documentacion, 13(2010), pp. 185-195. 2007 223 Wimalasuriya, Daya C., Dejing Dou. – Ontology-based information extraction: an introduction and a survey of current approaches (Lang.: eng). – In: Journal of information science, 36(2010)3, pp. 306-323. 2008 226 Li, G. et al. – An effective 3-in-1 keyword search method over heterogeneous data sources (Lang.: eng). – In: Information systems, 36(2011)2, pp. 248-266. 2009 233 Hlava, M. – Using a ‘collabulary’ to create a taxonomy (Lang.: eng). – In: Information outlook, 14(2010)5, pp. 29-32. 2010 253 Chaudhry, Abdus Sattar. – Assessment of taxonomy building tools (Lang.: eng). – In: Electronic library, 28(2010)6, pp. 769-788. 2011 291 Mandl, Thomas. – Evaluierung im Information Retrieval (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)6/7, pp.341-348. 2012 313 De Keyser, Pierre. – Indexing: from thesauri to the semantic web (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 200. – ISBN: 9781843342922. 2013 325 Mazzocchi, Fulvio, Gnoli, Claudio. – S.R Ranganathan's PMEST categories: analyzing their philosophical background and cognitive function (Lang.: eng). – In: Information studies, 16(2010) 3, pp. 133-147. 2014 325;42 Broughton, Vanda. – Concepts and terms in the faceted classification: the case of UDC (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 270-279. 2015 331 Pastor Sánchez, Juan Antonio, Martínez Méndez, Francisco Javier. – Aplicación de tesauros, taxonomies y ontologías en los sistemas de gestión de contenidos mediante tecnologías de la Web Semántica (Lang.: spa). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 143-153. 2016 343 Heid, Ulrich. – Computerlinguistik zwischen Informationswissenschaft und multilingualer Kommunikation (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)6/7, pp. 361-366. 2017 344 Beijar, Nicklas S. – Zone indexing: optimizing the balance between searching and indexing in a loosely structured overlay (Lang.: eng). – In: Computer networks, 54(2010)12, pp. 2041-2055. 2018 344 Gross, Thomas, Faden, Manfred. – Automatische Indexierung elektronischer Dokumente an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (Lang.: ger). – In: Bibliotheksdienst, 44(2010)12, pp.1120-1135. 2019 344 Marinelli, Rita et al. – Il modello semantico di EuroWordNet come strumento per la strutturazione della relazione associativa nei thesauri (Lang.: ita). – In: Bollettino AIB, 50(2010)3, pp. 249-263. – Available at http://aib.it/aib/boll/2010n3.htm 2020 344 Papapetrou, Odysseas, Siberski, Wolf, Nejdl, Wolfgang. – PCIR: combining DHTs and peer clusters for efficient full-text P2P indexing (Lang.: eng). – In: Computer networks, 54(2010)12, pp. 2019-2040. 2021 344 Revesz, Peter, Triplet, Thomas. – Temporal data classification using linear classifiers (Lang.: eng). – In: Information systems, 36(2011)1, pp.30-41. 2022 344;82-51/4 Lourenco, A. et al. – BioDR: semantic indexing networks for biomedical document retrieval (Lang.: eng). – In: Expert systems with applications, 37(2010)4, pp. 3444-3453. 2023 348 Elghamrawy, T., Boukamp, F. – Managing construction information using RFID-based semantic contexts (Lang.: eng). – In: Automation in construction, 19(2010)8, pp. 1056-1066. 2024 348 Osińska, Veslava . – Visual analysis of classification scheme (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 299-306. 2025 348;226 Klassen, M., Paturi, N. – Web document classification by keywords using random forests (Lang.: eng). – In: Communications in computer and information science, 88(2010)2, pp. 256-261. 2026 348;82-51/4 Zou, J., Le, D., Thoma, G. R. – Locating and parsing bibliographic references in HTML medical articles (Lang.: eng). – In: International journal on document analysis and recognition, 13(2010)2, pp. 107-119. 2027 353;214 Batet, M., et al. – Semantic clustering using multiple ontologies (Lang.: eng). – In: Frontiers in artificial intelligence and applications, 220(2010), pp. 207-216. 2028 371 Steele, Thomas D., Foote, Jody Bales. – Reclassification in academic research libraries: is it still relevant in an e-book world? (Lang.: eng). – In: Cataloging classification quarterly, 49(2011)1, pp. 14-32. 2029 373 Lewis, Nicholas. – Playing the long game: reclassifying UEA library (Lang.: eng). – In: SCONUL focus, (2010)49, pp. 56-62. 2030 375;82-66 Lin, Katherina R., Murphy, Erin. – Reflections on a JX Reclassification Project (Lang.: eng). – In: Law library journal, 102(2010)4, pp. 459-466. 2031 377;82-66 Bird, Ruth. – Re-classification on a grand scale: Moys at the Bodleian Law Library (Lang.: eng). – In: Legal information management, 10(2010)3, pp.213-216. 2032 378*69 Weech, Edward, Dickers, Stefan. – Tackling a hundred year backlog: cataloguing and promoting labour history at Bishopsgate Library (Lang.: eng). – In: International cataloguing and bibliographic control, 39(2010)4, pp. 77-79. 2033 42;835 Šauperl, Alenka. – UDC and folksonomies (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 307-317. 2034 43 Courtright, H. R. – The national impact of the Dewey-less library (Lang.: eng). – In: Public libraries, 49(2010)4, pp. 14-17. 2035 541;214 Gupta, Amarnath, Condit, Christopher, Qian, Xufei. – BioDB: an ontology-enhanced information system for heterogeneous biological information (Lang.: eng). – In: Data knowledge engineering, 69(2010)11, pp. 1084-1102. 2036 582 Wang, Zhonghong, Chaudhry, Abdus Sattar, Khoo, Christopher. – Support from bibliographic tools to build an organizational taxonomy for navigation: use of a general scheme and domain thesauri (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 256-269. 2037 666 Alvite Diez, Maria Luisa et al. – Propuesta de representación del tesauro Eurovoc en SKOS para su integración en sistemas de información juridical (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)2, pp.47-51. 2038 682 Barros, Theago, De Moraes, Joo Batista Ernesto. – La clasificación archivistica: aspectos teóreticos e su constitución (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 31-37. Title in Portuguese “A classificao arquivistica; aspectos teóricos de sua constituio”. Lead title in Spanish, but text in Portuguese. 2039 682 Lih-Yau Song, Ko-Chiu Wu. – The subject classification of the national archives in the urban development (1949-2000): a macro-appraisal analysis (Lang.: eng). – In: Journal of educational media library sciences, 47(2010)4, pp. 459-497. 2040 694 Harpring, Patricia. – Development of the Getty Vocabularies: AAT, TGN, ULAN, and CONA (Lang.: eng). – In: Art documentation: bulletin of the Art Libraries Society of North America, 29(2010)1, pp. 67-72. 2041 711;878;88-69 Vlachidis, Andreas et al. – Excavating grey literature: a case study on the rich indexing of archaeological documents via natural language-processing techniques and knowledge-based resources (Lang.: eng). – In: Aslib proceedings, 63(2010)4/5, pp. 466-475. 2042 714 De Almeida, Carlos Cndido. – Pragmatisdmo y semiótica de Peirce en la organización de la información (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 15-20. Portuguese title: “Pragmatismo e semiotótica de Peirce na organizao de informao. Lead title in Spanish, but text in Portuguese. 2043 715 Kettunen, K., McNamee, P., Baskaya, F . – Using syllables as indexing terms in full-text information retrieval (Lang.: eng). – In: Frontiers in artificial intelligence and applications, 219(2010), pp.225-232. 2044 722 Hu, Y., Li, W. – Document sentiment classification by exploring description model of topical terms (Lang.: eng). – In: Computer speech and language, 25(2011)2, pp. 386-403. 2045 731 Fagni, Tiziano, Sebastiani, Fabrizio. – Selecting negative examples for hierarchical text classification: an experimental comparison (Lang.: eng). – In: Journal of the American Society for Information Science Technology, 61(2010)11, pp. 2256-2265. 2046 731 Si, Libo Eric, O'Brien, Ann, Probets, Steve. – Integration of distributed terminology resources to facilitate subject cross-browsing for library portal systems (Lang.: eng). – In: Aslib proceedings, 63(2010)4/5, pp. 415-427. 2047 732 Binding, Ceri, Tudhope, Douglas. – Terminology web services (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 287-298. 2048 733 Leydesdorff, Loet. – Eugene Garfield and algorithmic historiography: co-words, co-authors, and journal names (Lang.: eng). – In: Annals of library information studies, 57(2010)3, pp. 248-260. 2049 733 Su, Hsin-Ning, Lee, Pei-Chun. – Mapping knowledge structure by keyword co-occurrence: a first look at journal papers in Technology Foresight (Lang.: eng). – In: Scientometrics, 85(2010)1, pp. 65-79. 2050 736 Crasso, M., Zunino, A., Campo, M. – Combining document classification and ontology alignment for semantically enriching web services (Lang.: eng). – In: New generation computing (Tokyo), 28(2010)4, pp. 371-403. 2051 746 Li, S. T., Tsai, F. C. – Constructing tree-based knowledge structures from text corpus (Lang.: eng). – In: Applied intelligence, 33(2010)1, pp. 67-78. 2052 751 Fenton, Candida. – Use of controlled vocabulary and thesauri in UK online finding aids (Lang.: eng). – In: Journal of the Society of Archivists, 31(2010)2, pp. 187-205. 2053 751 Larson, Ray R. – (Book review of) Gker, Ayşe, Davies,John, eds. Information Retrieval: searching in the 21st Century. Chichester, Wiley, 2009. xxiii, 295pp. ISBN 9780470027622 Warner, Julian. Human information retrieval. Boston, MA, MIT, 2009. 200pp. (Lang.: eng). – In: Journal of the American Society for Information Science Technology, 61(2010)11, pp. 2370-2372. Warner, Julian. Human information retrieval. ISBN 978-0-262-01344-4 2054 751 Proyecto 7: un motor de recuperación de información web colaborativo (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 53-59. 2055 751 Pastor Sánchez, Juan Antonio. – Bases para un diseo web integral a través de la convergencia de la accesibilidad, usabilidad y arquitectura de la información (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)1, pp. 61-72. 2056 751;723 Strasunskas, Darijus, Tomassen, Stein. – On variety of semantic search systems and their evaluation methods (Lang.: eng). – In: Proceedings of the International Conference on Information Management Evaluation, (2010), pp. 380-387. 2057 752.2 Biranvand, Ali, Sharifmoghadam, Hadi. – (Lang.: per). – In: Faslname-Ye Ketab/Library and information studies, 20(2010)3, pp. 23-36. 2058 752.2 Brown-Sica, M. et al. – Next-generation library catalogs and the problem of slow response time (Lang.: eng). – In: Information technology and libraries, 29(2010)4, pp. 214-223. 2059 752.2 Yang, S. Q., et al. – The next generation library catalog: a comparative study of the OPACs of Koha, Evergreen, and Voyager (Lang.: eng). – In: Information technology and libraries, 29(2010)3, pp. 141-150. 2060 752.2;666 Briscoe, G. – The quality of academic law library online catalogs and its effect on information retrieval (Lang.: eng). – In: Law library journal, 102(2010)4, pp. 599-612. 2061 755 Dunsire, Gordon, Nicholson, Dennis. – Signposting the crossroads: terminology web servces and classification-based interoperability (Lang.: eng). – In: Knowledge organization, 37(2010)4, 280-286. 2062 755;325 Fripp, Dominic. – Using linked data to classify web documents (Lang.: eng). – In: Aslib proceedings, 63(2010)6, pp. 585-595. 2063 757 Belacel, Nabil, Carretero, Juan A., Mahanti, Prabhat. – AI and opinion mining, Part 2 (Lang.: eng). – In: IEEE intelligent systems, 25(2010)4, pp. 72-79. – Available at http://csdl2.computer.org/persagen/DLPublication.jsp?pubtype=macronym=ex 2064 757 Hsieh-Yee, Ingrid. – Google Scholar and its competitors: accessing scholarly resources on the web (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 9781843344476. 2065 757 Knitel, Markus, Labner, Josef, Oberhauser, Otto. – Sachliche Erschliessung und die neue Suchmaschine des sterreichischen Bibliothekenverbundes (Lang.: ger). – In: B.I.T. online: Zeitschrift für Bibliothek, Information und Technologie, 13(2010)3, pp. 275-285. – Available at http://eprints.rclis.org/19143/ 2066 757 Kovacevic, Ana, Devedzic, Vladan, Pocajt, Viktor. – Using data mining to improve digital library services (Lang.: eng). – In: Electronic library, 28(2010)6, pp. 829-843. 2067 757 Maruyama, Shirou, Sakamoto, Hiroshi. – (Lang.: jap). – In: Joho Kanri, 53(2010)5, pp. 233-240 . 2068 757 Segev, Elad. – Google and the digital divide: the biases of online knowledge (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 256. – ISBN: 9781843345657. 2069 757 Thabtah, Fadi, et al. – A new classification based on association algorithm (Lang.: eng). – In: Journal of information knowledge management, 9(2010)1, pp. 55-64. 2070 757 Werner, Katrin. – Grssere Zufriedenheit durch bessere Suchmaschinen? Das Confirmation/Disconfirmation-Paradigma der Kundenzufriedenheit im Kontext des Information Retrieval (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)6/7, pp.385-396. 2071 757;214 Ulicny, B., Kokar, M.M., Matheus, C.J. – Uses of ontologies in open source blog mining (Lang.: eng). – In: Frontiers in artificial intelligence and applications, 213(2010), pp. 37-56. 2072 757;773.4 Zhang, W., Yoshida, T., Tang, X. – A comparative study of TF*IDF, LSI and multi-words for text classification (Lang.: eng). – In: Expert systems with applications, 38(2011)3, pp. 2758-2765. 2073 759 García Gómez, Juan Carlos. – Barreras en el acceso al contenido de las webs de universidades espaolas (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)1, pp. 17-29. 2074 759 López del Ramo, Joaquín. – Caracteristicas estructurales de la web y su coincidencia en la usabilidad: análisis del caso en los portales municipals de la Comunidad de Madrid (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)1, pp. 43-50. 2075 759 Oliva, Marta, Masip, Llúcia, Granollers, Toni. – Evaluación de usabilidad y accesibilidad de un conjunto de dispositivos interactivos denominados Puntos de Información Ciudadana (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)1, pp. 51-59. 2076 78-92 Antonio, Deise Maria, De Moraes, JooBatista Ernesto. – Análisis documental de obras de ficción: aspectos metodológicos y de aplicabilidad (Lang.: por). – In: Scire: representación y organización del conociemento 16(2010)2, pp. 71-78. Portuguese title: “Análise documental de obras de fico: aspectos metodológicos de aplicabilidade”. Lead title in Spanish, but text in Portuguese. 2077 791 Gruzitis, N., Nespore, G., Saulite, B. – Verbalizing ontologies in controlled Baltic languages (Lang.: eng). – In: Frontiers in artificial intelligence and applications, 219(2010), pp. 187-194. 2078 797;88-92 Tonkin, Humphrey. – Navigating and expanding the MLA International Bibliography (Lang.: eng). – In: Journal of scholarly publishing, 41(2010)3, pp. 340-353. 2079 811 Boccato, Vera Regina Casari, Fujita, Maringela Spotti Lopes,Rubi, Milena Polsinelli. – Estudio observacional del contexto sociocognitivo de la catalogación de materias en bibliotecas universitarias (Lang.: por). – In: Scire: representación y organización del conociemento, 16(2010)2, pp.103-110. Portuguese title: “Um estudo de obsercao do contexto dee assunto em bibliotecas universitárias”, Lead title in Spanish, but text in Portuguese. 2080 811 Dos Reis, Daniela Marjorie, Fujita, Maringela Spotti Lopes. – La observación de la estrutura textual de los libros para la catalogación de materias en la bibliotecas universitarias de la UNESP (Lang.: eng). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 85-91. Portuguese title: “A observao da estrutura textual de livros e sua contribuio para a catalogao de assuntos em bibliotecas universitárias da UNESP.” Lead title in Spanish, but text in Portuguese. 2081 811 Fujita, Maringela Spotti Lopes, Dal’Evedove, Paula Regina. – La práctica de la catalogación temática en perspective sociocognitiva (Lang.: por). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 93-101. Portuguese title: “A prática da catalogao de assunta em perspectiva sociocognitiva”. Lead title in Spanish, but text in Portuguese. 2082 82-66 Duffield, Claire, Fallon, Sarah, Stopford, Jean. – LIM meets LJI: an article on an abstract (Lang.: eng). – In: Legal information management, 10(2010)3, pp. 187-190. 2083 835 Abel, Fabian et al. – Leveraging search and content exploration by exploiting context in folksonomy systems (Lang.: eng). – In: New review of hypermedia multimedia, 16(2010)1/2, pp. 33-70. 2084 835 Anfinnsen, Svein, Ghinea, Gheorghita, de Cesare, Sergio. – Web 2.0 and folksonomies in a library context (Lang.: eng). – In: International journal of information management, 31(2011)1, pp. 63-70. 2085 835 Hargood, Charlie, Millard, David E., Weal, Mark J. – Capturing the semiotic relationship between terms (Lang.: eng). – In: New review of hypermedia multimedia, 16(2010)1/2, pp. 71-84. 2086 835 Heuwing, Ben. – Social Tagging in Bibliotheken: Erfahrungen an der Universittsbibliothek Hildesheim (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)6/7, pp. 407-411. 2087 835 Jensen, Jill Bauhs. – Folksonomies for digital resources (Lang.: eng). – In: PNLA quarterly, 74(2010)3, pp. 23-38. 2088 835 Kipp, Margaret E.I., Campbell, D. Grant. – Searching with tags: do tags help users find things? (Lang.: eng). – In: Knowledge organization, 37(2010)4, pp. 239-255. 2089 835 Knautz, Kathrin. – Tag-Cluster: Semantische Suche in Tag-Clouds (Lang.: ger). – In: B.I.T. online: Zeitschrift für Bibliothek, Information und Technologie, 13(2010)3, pp. 237-252. 2090 835 Makani, Joyline, Spiteri, Louise. – The dynamics of collaborative tagging: an analysis of tag vocabulary application in knowledge representation, discovery and retrieval (Lang.: eng). – In: Journal of information knowledge management, 9(2010)2, pp. 93-103. 2091 835 Mardani, Amir Hossein . – (Lang.: per). – In: Faslname-Ye Ketab/Library and information studies, 20(2010)3, pp. 239-260. 2092 835 (Book review of) Peters, Isabella. Folksonomies: indexing and retrieval in Web 2.0. Berlin, De Gruyter, 2009. vi, 443 pp. ISBN 9783598251795; 3598251793 (Lang.: ger). – In: Information: Wissenschaft Praxis, 61(2010)8, pp. 469-470. 2093 835 Schilling, Virginia. – The catalogers' revenge: unleashing the semantic web (Lang.: eng). – In: PNLA quarterly, 74(2010)3, pp. 9-23. 2094 835;918 Catarino, M.E., Baptista, A.A. – Relating folksonomies with Dublin Core (Lang.: eng). – In: International journal of metadata semantics and ontologies, 5(2010)4, pp. 285-295. 2095 842 Muto, Akira, Murano, Yuko, Suzuki, Chika. – (Lang.: jap). – In: Joho Kanri, 53(2010)5, pp. 241-255. 2096 845 Cramer, Elizabeth, Orkiszewski, Paul. – Cataloging serials for special collections: the challenges and delights of the W.L. Eury Appalachian Collection (Lang.: eng). – In: Serials librarian, 59(2010)1, pp. 101-110. 2097 845;946 Curran, Mary. – Print serials workflow in RDA: a draft workflow for RDA toolkit based on JSC's sample workflow for a simple book (Lang.: eng). – In: Serials librarian, 59(2010)3/4, pp. 244-262. 2098 847;111 Rios, Elaine Rosa, de Novais Cordeiro, Rosa Inês. – Plano de classificao de documentos arquivísticos e a teoria da classificao: uma interlocuo entre domínios do conhecimento (Lang.: por). – In: Perspectivas em ciencia da informacao, 15(2010)2, pp. 123-139. 2099 851 Lennie, Frances S. – The visual appeal of indexes: an exploration (Lang.: eng). – In: The indexer, 28(2010)2, pp. 60-67. 2100 855;879 Hogan, Brian F. – Digital journal indexing: electrified or electrocuted? Problems, practicalities and possibilities: the case of the CCHA and/et la SCHC (Lang.: eng). – In: The indexer, 28(2010)4, pp. 154-162. 2101 858*99 MacCulloch, Diarmaid. – Christian history: 3,000 years and an author's indexing thereof (Lang.: eng). – In: The indexer, 28(2010)3, pp. 108-109. 2102 863 Koltay, Tibor. – Abstracts and abstracting: a genre and set of skills for the twenty-first century (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 236. – ISBN 9781843345176. 2103 864 De Oliveira, Ely Francina Tannuri, Grácio, Cláudia Cabrini, Silva, Ana Cláudia C. – Investigadores de mayor visibilidad en organización y representación del conocimiento: un studio desde el análisis de cocitaciones (Lang.: por). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 39-45. Portuguese title: “Pesquisadores de maior visibilidade em organizao e representao do conhecimento: um estudo a partir da análise de cocitaes”. Lead title in Spanish, but text in Portuguese. 2104 864;245 Couto, T. et al. – Classifying documents with link-based bibliometric measures (Lang.: eng). – In: Information retrieval, 13(2010)4, pp. 315-345. 2105 864;88-1/54 Mahdi, A.E., Joorabchi, A. – A citation-based approach to automatic topical indexing of scientific literature (Lang.: eng). – In: Journal of information science, 36(2010)6, pp. 798-811. 2106 871 Guldogan, E., Gabbouj, M. – System profiles in content-based image indexing and retrieval (Lang.: eng). – In: Signal image and video processing, 4(2010)4, pp. 463-480. 2107 871 Hafner, Ralph. – Eine Systematik für die Medienwissenschaft (Lang.: eng). – In: Bibliotheksdienst, 44(2010)12, pp. 1136-1144. 2108 871 Janakiraman, C. – Library cataloguing and multimedia library (Lang.: eng). – Delhi, Pacific Books International, 2011. – pp. 272. – ISBN: 9789380472232. 2109 871 JungWon Yoon, O'Connor, Brian. – Engineering an image-browsing environment: re-purposing existing denotative descriptors (Lang.: eng). – In: Journal of documentation, 66(2010)5, pp. 750-774. 2110 871 López Yepes, Alfonso, Cámara Bados, Victor. – Canales web y mediatecas en linea como instrumentos de producción, recuperación y diffusión en ciencias de la información (Lang.: spa). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 169-179. 2111 871 Neugebauer, Tomasz. – Image indexing (Lang.: eng). – In: The indexer, 28(2010)3, pp. 98-103. 2112 871;918 Kim, Sujin, Lamkin, Shannon, Duncan, Pam. – Caption-based topical descriptors for microscopic images as published in academic papers (Lang.: eng). – In: Health information libraries journal, 27(2010)3, pp. 235-243. 2113 872 Philipp-Foliguet, S. et al. – Artwork 3D model database indexing and classification (Lang.: eng). – In: Pattern recognition, 44(2011)3, pp. 588-597. 2114 872 Pupim, Eliana Kátia, Madio, Telma Campanha de Carvalho. – Arquivos de fotógrafos profissionais de eventos socais: um estudo de caso (Lang.: eng). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 197-208. Lead title in Spanish, but text in Portuguese. 2115 872 Silva, Irisneide de Oliveira Souza, Fujita, Maringela Spotti Lopes, Dal Evedove, Paula Regina. – El tratamiento del contenido informativo de la fotografía en la archivistica: algunas reflexiones (Lang.: por). – In: Scire: representación y organización del conociemento, 16(2010)2, pp. 79-84. Portuguese title: “O tratamento de conteúdo informacional da fotografia na arqivística: algumas reflexes”. Lead title in Spanish, but text in Portuguese. 2116 877 Kelly, Elizabeth. – Music indexing and retrieval: current problems (Lang.: eng). – In: The indexer, 28(2010)4, pp. 163-166. 2117 878 Varniené-Janssen, Regina. – Methodological and organisational aspects of digitisation and bibliographic accesss of the cultural heritage: a Lithuanian approach (Lang.: eng). – In: International cataloguing and bibliographic control, 39(2010)4, pp. 67-74. 2118 913;879 Selden, Karen. – Linking globally, coping locally: cataloging Internet resources at the University of Colorado Law Library (Lang.: eng). – In: Law library journal, 102(2010)4, pp. 439-455. 2119 915 Deng, Sai. – Optimizing workflow through metadata repurposing and batch processing (Lang.: eng). – In: Journal of library metadata, 10(2010)4, pp. 219-237. 2120 916 Zhu, Lihong. – The role of the Cataloging Department in the implementation of OCLC WorldCat Local (Lang.: eng). – In: Library collections, acquisitions, technical services, 34(2010)4, pp. 123-129. 2121 916;879 Martin, Kristin E., Mundle, Kavita. – Notes on operations: cataloging e-books and vendor records: a case study at the University of Illinois at Chicago (Lang.: eng). – In: Library resources technical services, 54(2010)4, pp. 227-237. 2122 918 Adamich, Tom. – Making and managing metadata (Lang.: eng). – In: Technicalities, 30(2010)5, pp. 11-13. 2123 918 Guerra, F. – Simplifying access: metadata for medieval disability studies (Lang.: eng). – In: PNLA quarterly, 74(2010) 2, pp. 10-26. 2124 918 Intner, Sheila S. – What metadata can teach us about cataloging (Lang.: eng). – In: Technicalities, 30(2010)5, pp. 1-11. 2125 918 Leal, José Paulo, Queirós, Ricardo. – Design of an extensible metadata editor based on RDF (Lang.: eng). – In: Proceedings of the European Conference on Knowledge Management, (2010), pp. 1219-1222. 2126 918 Park, Jung-ran. – Metadata application in digital repositories and libraries: tools, systems and architecture (Lang.: eng). – Cambridge, Chandos, 2011. – pp. 200. – ISBN: 9781843345794. 2127 918 Park, Jung-Ran et al . – From metadata creation to metadata quality control: continuing education needs among cataloging and metadata professionals (Lang.: eng). – In: Journal of education for library information science, 51(2010)3, pp.158-176. 2128 924 Bade, David. – Carlo Revelli on the (non)autonomy of cataloging (Lang.: eng). – In: Cataloging classification quarterly, 48(2010)8, pp. 743-756. 2129 924 Broughton, Vanda. – Brian Vickery, September 11, 1918-October 17, 2009 (Lang.: eng). – In: Cataloging classification quarterly, 49(2011)1, pp. 42-46. 2130 924 McIlwaine. I.C. – Brian Vickery, 11th September 1918-17th October 2009 (Lang.: eng). – In: Knowledge organization, 37(2010)3, pp. 155-156. 2131 935 Ahmad, Hafiz Khubaib. – The Pakistan National Bibliography: a source of bibliographical control in Pakistan (Lang.: eng). – In: International cataloguing and bibliographic control, 39(2010)4, pp. 75-76. 2133 937*076 Oliveira, Ely Francina Tannuri, Grácio, Maria Cláudia Cabrini, Segundo, José Eduardo Santarém. – Redes brasileiras de colaborao cientifica em Organizao e Representao de Conhecimento: análise de coautorias dos Encontros Nacionais de Pesquisa em Ciência da Informao (ENANCIBs) (Lang.: por). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 163-168. Lead title in Spanish, but text in Portuguese. 2132 937;331 Fujita, Maringela Spotti Lopes, Gil Leiva, Isidoro. – Políticas de indexao na América Latina (Lang.: por). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 155-162. Lead title in Spanish, but text in Portuguese. 2134 942 CannCasciato, Daniel . – An essay on cataloging (Lang.: eng). – In: Library philosophy practice, 12(2010)2, pp. 1-9. 2135 942 Marcus, Sara Rofofsky. – (Book review of) Fletcher, Jane. Collection-level cataloging: bound-with books. Westport, CN, Libraries Unlimited, 2010. (Third Millennium Cataloging). 95pp. ISBN. 1-59158-543-0 (Lang.: eng). – In: Cataloging classification quarterly, 49(2011)1, pp. 52-53. 2136 944 Ehlert, Mark K. – RDA: building blocks (Lang.: eng). – In: Technicalities, 30(2010)4, pp. 19-22. 2137 944 Taylor, Wendy, Teague, Kathy. – FRBR in practice (Lang.: eng). – In: Ariadne, (Online) 64(2010). – Available at http://www.ariadne.ac.uk 2139 944;946 Matsui, Junko. – (Lang.: jap). – In: Toshokan-Kai/The library world, 62(2010)2, pp. 182-193. 2138 945 Mukhopadhyay, Asoknath. – Guide to MARC 21 for cataloguing books and serials (Lang.: eng). – Cambridge, Chandos, 2007. – pp. 490. – ISBN: 9781843344070. 2140 945 Thomale, Jason. – Interpreting MARC: where's the bibliographic data? (Lang.: eng). – In: Code4Lib journal, (2010)11, pp. 20-30. 2141 945;934*040+276 Leibrecht, Veronika. – The Deutsche Nationalbibliothek reports: Germany and Austria’s migration project ‘Moving to MARC 21’ (Lang.: eng). – In: Alexandria, 21(2009)1, pp. 25-33. 2142 946 Carlo Bianchini. – Futuri scenari: RDA, REICAT e la granularità dei cataloghi (Lang.: ita). – In: Bollettino AIB, 50(2010)3, pp. 219-238. 2143 946 De Fino, Melissa. – Cooperative cataloging rules http://sites.google.com/site/opencataloging rules/ (Lang.: eng). – In: Technical services quarterly, 27(2010)3, pp. 317-318. 2144 946 Wiesenmüller, Heidrun. – Die Grenzen der Modernitt: Das neue Regelwerk "Resource Description and Access" (Lang.: ger). – In: B.I.T. online: Zeitschrift für Bibliothek, Information und Technologie, 13(2010)3, pp. 286-290. 2145 946;871 Falk, Patricia, Hunker, Stefanie Dennis. – Cataloguing outside the box: a practical guide to cataloguing special collections materials (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 260. – ISBN: 9781843345534. 2146 949 Herrero Pascual, Cristina, Diaz Ortuo, Pedro. – Gestión de un fichero de autoridades en el marco de la biblioteca digital de historia del pensamiento político “Saavedra Fajardo” (Lang.: spa). – In: Ibersid: revista de sistemas de información y documentación, (2009), pp. 209-215. 2147 981 Clark, Malcolm, Ruthven, Ian, Holt, Patrik O’Brian. – Perceiving and using genre by form – an eye-tracking study (Lang.: eng). – In: Libri 60(2010)3, pp. 268-280. 2149 981 Lloyd, Annemaree. – Information literacy landscapes: information literacy in education, workplace and everyday contexts (Lang.: eng). – Cambridge, Chandos, 2010. – pp. 208. – ISBN: 9781843345077. 2150 981 Torras, Maria Carme. – Information literacy education: a process approach (Lang.: eng). – Cambridge, Chandos, 2008. – pp. 126. – ISBN: 9781843343868. 2151 981;877;325 Snyder, Tracey. – Music materials in a faceted catalog: interviews with faculty and graduate students (Lang.: eng). – In: Music reference services quarterly, 13(2010)3/4, pp. 66-95. 2152 981;944 Pisanski, Jan, Žumer, Maja. – Mental models of the bibliographic universe. Part 1: mental models of descriptions (Lang.: eng). – In: Journal of documentation, 66(2010)5, pp. 643-667. 2153 982;752.2 Willson, R., et al. – The effect of spelling and retrieval system familiarity on search behavior in online public access catalogs: a mixed methods study (Lang.: eng). – In: Journal of the American Society for Information Science and Technology, 61(2010)12, pp. 2461-2476. 2154 982;835 Hassan-Montero, Yusef, Herrero-Solana, Victor, Guerrero-Bote, Vicente. – Usabilidad de los tag-clouds: studio mediante eye-tracking (Lang.: spa). – In: Scire: representación y organización del conociemento, 16(2010)1, pp. 31-41. 2155 998 Kreyche, Michael, Lisius, Peter H., Park, Amey. – The DeathFlip Project: automating death date revisions to name headings in bibliographic records (Lang.: eng). – In: Cataloging classification quarterly, 48(2010)8, pp. 684-695.
个人分类: 信息组织|5661 次阅读|0 个评论
我国信息组织相关文献计量分析
xupeiyang 2010-12-13 10:28
我国信息组织相关文献计量分析 李阳 目的: 通过对 1982-2009 年我国信息组织相关文献的统计分析,使国内相关领域的科研人员对我国现阶段信息组织的研究现状及发展趋势能够有一个更为全面、清晰地了解,从而更好地把握其研究方向。 方法: 利用文献计量学方法,采用 NoteExpress 和 TDA 两款信息分析软件,对万方数据知识服务平台收录的国内信息组织相关文献的时间、著者、期刊、机构进行分析;同时利用关键词词频分析法,对国内信息组织研究有关的论文开展主题及研究热点分析。 结果: 万方数据库(网络版)在 1982-2009 年间共收录信息组织研究文献 952 篇;武汉大学发文量最多,是开展信息组织相关研究的最核心机构;知识组织、数字图书馆、情报检索语言等是当前研究的热点,竞争情报、学科信息门户及神经网络等领域是未来的发展趋势。 结论: 现阶段我国信息组织相关研究的总体发展趋势良好,基础理论研究与应用研究并重,涉及多个学科领域,并逐步向一些热门领域发展,其潜在价值仍有待人们进一步的发掘。 信息组织;文献计量分析; Noteexpress ; TDA ;词频分析法 Analysis of Literatures Relating to Information Organization in our Country Li Yang Inistitute of Medical Information,Chinese Academy of Medical Sciences,Beijing 100020,China Objective: The paper aims to make domestic researchers have a more comprehensive and clearer understanding on the research status at present and development trend of information organization in our country by analyzing literatures published from 1982-2009,so that the researchers can better grasp research direction. Methods: The literatures on information organization were searched in WangFang database,and by using bibliometric method as well as Noteexpress and TDA,the publishing years,the first authors and their institutes,the publishing journals of the literatures were analyzed. Themes and hot topics were analyzed by using keywords frequency analysis method. Results: A total of 952 literatures were searched in WangFang database;The papers from WuHan University were in the largest quantity;At the present hot topics are knowledge organization,Digital library, information retrieval language and so on;Competitive intelligence,subject information gateway and neural network are future development trends. Conclusion: The overall development trend on information organization in our country is good;Both of basic theoretical and application researches involving multiple disciplines attract much attention, which gradually develop into some popular areas and their potential value is still to be further explored. Information organization; bibliometrics; Noteexpress; TDA; Word frequency analysis method 1 引言 信息组织是一种由来已久的人类社会实践活动,在其发展历程当中,通过不断地汲取相关学科的理论(如系统理论、耗散结构理论、协同理论及突变理论等)和方法,来使自己逐渐得到充实和完善 。 1987 年,成都科技大学滕福生教授从电力管理信息系统的角度初步探讨了信息组织的相关理论 。 1997 年,宋彩萍和霍国庆明确提出了信息组织的定义, 即 将处于无序状态的特定信息,根据一定的原则和方法,使其成为有序状态的过程,其目的是将无序信息变为有序信息,方便人们利用信息和有效地传递信息 。 随后,图情领域的专家学者们针对信息组织这一概念分别给出了自己的理解。南京空军政治学院戴维民教授从宏观的角度将信息组织阐释为一种通过一定的工具和技术将无序的信息组织成一个有序系统的方法,并从信息组织方法的发展历程角度强调了信息组织的重要性和有效性 ;北京大学信息管理系马张华教授从微观的角度对信息组织做出如下阐述 : 所谓信息组织,亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。 此外,还有许多学者从不同的角度提出了自己对信息组织这一概念的理解 。上述定义虽然表述略有不同,但存在一个共同之处,即信息组织是一个序化过程,其目的在于方便人们对信息的有效利用。 本文采用基于数量统计的文献计量学方法,以万方数据库(网络版)为数据源,对国内 20 多年来的信息组织研究文献进行了一个系统的分析, 以 使国内相关领域的科研人员能够对我国目前信息组织的研究现状、热点及发展趋势有一个全面、清晰地认识和了解,从而更好地把握信息组织的研究方向,为未来的研究打下一个坚实的基础。 2 材料与方法 2.1 资料来源 万方数据知识服务平台由中国科技信息研究所(北京万方数据股份有限公司)开发。目前,全新改版的万方数据资源系统共收录 了 70 多个类目共 6000 余种期刊 (其中绝大部分是进入中国科技论文统计源的核心期刊) ,同时汇聚了 9 大类 100 多个数据库的上千万条数据资源,涵盖了社会科学、自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等各个领域的学科资源,可谓是包罗万象,且数据每日更新,检索时间回溯至 1982 年,故本文选择万方数据知识服务平台检索系统作为检索对象,可使随后的分析结果更加科学、客观、全面。 2.2 方法 由于标题是一篇论文不可或缺的重要组成部分,是论文核心内容的简明概述,是表达论文主题概念的自然语言词汇 ,具有言简意赅的特点,因此本文拟利用检索式 信息组织 or 知识组织 or 检索语言 or 情报组织 ,在标题字段中进行相关文献的检索;然后利用 Noteexpress 软件对检索结果进行去重 ,并辅助人工筛选,从而可使检索结果更为精确。此外,在文献分析中,数据的准确性是影响最后分析结果是否客观的一个重要因素 ; 因此在开展具体的数据分析之前,应首先利用 Thomson Data Analysis (以下简称 TDA ) 的数据 清洗功能,对著者、机构等字段进行规范,使文献格式更加规范化, 便于进行下一步的分析。本次检索时间范围是 1982-2009 年,检索时间为 2010-09-19 ,数据库更新时间截止到 2010-9-16 。 3 结果与分析 经过 Noteexpress 软件去重及人工筛选,最后得到文献 952 篇。以下笔者将利用 TDA 软件对这 952 篇文献进行具体地统计分析: 3.1 文献类型分析(见表 1 ) 从表 1 可以看出,期刊仍然是信息组织领域的主要文献来源;而博硕士论文虽然数量有限,但却对信息组织的相关问题及内容进行了深入研究和探讨。在 90 篇会议文献中,全国第四次情报检索语言发展方向研讨会、全国计算机信息管理学术研讨会等五次会议论文共 46 篇,占会议论文总量的 51.1% (具体情况见表 2 ),其它 44 篇文献共出现于 28 次学术会议上。从中可以看出,信息组织涉及信息学、管理学、计算机技术、网络通信技术以及图书馆学等多个领域。会议论文从总量上看虽不多,但多涉及信息组织的前沿研究领域,同样对信息组织的发展产生了极为重要的作用。 表 1 国内信息组织相关文献类型分布 文献类型 期刊文献 会议文献 学位论文 硕士 博士 文献量(篇) 790 90 61 11 百分比( % ) 83.0 9.4 6.4 1.2 表 2 国内信息组织会议文献量排名前 5 的会议 会议名称 文献量(篇) 百分比 * ( % ) 全国第四次情报检索语言发展方向研讨会 15 16.7 全国计算机信息管理学术研讨会 10 11.1 信息化与信息资源管理学术研讨会 8 8.9 图书情报工作研究会学术研讨会 7 7.8 中国图书馆学会年会 6 6.7 * 注:百分比为各项会议文献占会议文献总量的百分数。 3.2 文献时间分布(见表 3 ) 从表 3 可以看出,信息组织相关文献的发文量基本呈逐年上升趋势,其中 2006 年发文量最高,达 120 篇;随后文献量稍有下降,但变化不大,呈稳定的波动趋势。 1987 年出现的信息组织相关文献是成都科技大学滕福生教授撰写的 1 篇会议文献 ,随后相关文献不断出现在期刊杂志及学术会议中,且数量也不断增加。 1991 年出现了 1 篇与信息组织相关的博士学位论文 , 随后与信息组织相关的博硕士论文相继出现,从不同角度对信息组织领域的多项问题(如数字图书馆、建立语义知识库、半结构化信息组织技术等)进行了深入阐述。信息组织成为博硕士学位论文的重要选题从一个侧面反映其被研究人员的关注程度明显增强。 表 3 国内信息组织相关文献时间分布 序号 年份 文献量(篇) 百分比( % ) 1 2006 120 12.6 2 2008 113 11.9 2 2005 113 11.9 4 2007 101 10.6 5 2003 98 10.3 6 2004 95 10.0 7 2009 86 9.0 8 2002 77 8.1 9 2001 65 6.8 10 2000 29 3.0 11 1999 23 2.4 12 1998 17 1.9 13 1993 3 0.3 13 1991 3 0.3 15 1997 2 0.2 15 1996 2 0.2 15 1995 2 0.2 15 1994 2 0.2 19 1987 1 0.1 3.3 文献著者分布(仅统计第一著者,见表 4 ) 对标有著者字段的 941 篇文献进行分析,分析结果如下:表 4 可见发文量在五篇以上的作者,这些作者可以被认为是国内信息组织领域的核心作者。此外,在 941 篇文献中,第一作者共有 713 人,由此可见,信息组织相关研究既有稳定的核心作者群,又有着广泛的群众基础 。 在此需要说明的一点是发文量这一指标仅能说明发文数量的多少,而无法衡量论文影响力的高低,即著者论文的被引用次数,因此本文的统计结果存在着一定的局限性,仅供参考之用。 表 4 国内信息组织相关文献 著者(第一著者)分布 第一著者名 单位 发文量(篇) 周九常 郑州航空工业管理学院 14 黄如花 武汉大学 , 信息管理学院 9 白海燕 中国科学技术信息研究所 , 北京 8 王知津 南开大学商学院信息资源管理系 , 天津 8 王军 郑州大学图书馆 , 河南 7 白华 郑州大学信息管理系 , 河南 6 文榕生 中国科学院 , 文献情报中心 , 北京 6 李秀云 郑州大学工学院图书馆 , 河南 6 李国秋 华东师范大学商学院 , 上海 5 牟冬梅 吉林大学公共卫生学院医药信息学系 , 长春 5 司莉 武汉大学信息管理学院 , 武汉 5 张晓林 中科院文献情报中心 5 郑贵宇 三峡大学图书馆 , 湖北 5 3.4 文献期刊分布(见表 5 ) 由表 5 可见, 790 篇文献共登载于 212 种期刊,其中载文量排名前 20 位的期刊均为国内图情领域的重要期刊,共刊载文献 504 篇,占期刊文献总量的 63.8% ; 《图书情报工作》、《情报杂志》、《情报科学》、《中国图书馆学报》、《情报理论与实践》、《现代情报》等期刊 刊载信息组织方面的论文均在 20 篇以上,已形成了信息组织相关论文的核心期刊群,可以为相关研究人员投稿提供一个参考。此外,通过对全部期刊的一个初步分析,可以发现信息组织做为图情领域的一个分支学科涉及医学、计算机、经济、军事等多个领域,充分显示其涵盖内容广泛,受到了越来越多的关注。 表 5 国内信息组织相关文献所在期刊分布 序号 期刊名称 文献量(篇) 百分数*(%) 1 图书情报工作 69 10.0 2 情报杂志 48 7.0 3 情报科学 39 5.7 4 中国图书馆学报 34 4.9 5 情报理论与实践 32 4.6 6 现代情报 32 4.6 7 情报资料工作 29 4.2 8 现代图书情报技术 27 3.9 9 科技情报开发与经济 23 3.3 10 情报学报 18 2.6 11 图书馆理论与实践 17 2.5 12 情报探索 16 2.3 13 图书馆杂志 16 2.3 14 图书情报知识 16 2.3 15 图书馆论坛 15 2.2 16 图书馆学刊 12 1.7 17 图书与情报 12 1.7 18 图书馆建设 11 1.6 19 图书馆学研究 11 1.6 20 大学图书馆学报 9 1.3 21 江西图书馆学刊 9 1.3 22 图书馆 9 1.3 * 注:此处百分比为占期刊文献总数的百分比。 3.5 文献著者(第一著者)机构分布(见表 6 ) 对标有著者地址字段的 920 篇文献进行统计分析,由表 6 可见,国内共有 14 所机构发文量大于 10 篇,其中高校 12 个,研究机构 2 个。武汉大学在信息组织研究领域占有绝对的核心地位,其文献量遥遥领先,发文量占到统计总量的 9.0% ;其次是华中师范大学,也是位于武汉,从而在一定程度上可以表明武汉在信息组织领域是一个核心地区。此外,统计结果表明,高校是目前国内开展信息组织相关研究的主体,而科研院所除中科院、中信所、医科院、农科院等大型研究所之外,其余院所发文量均较少。信息组织是一门应用价值很高的学科,而高校的研究大多集中于基础理论性研究,缺少应用研究。笔者认为随着时间的发展及人们对信息组织应用价值的认识和重视,应用研究必将在信息组织研究中占据越来越重要的地位。 表 6 国内信息组织相关文献著者机构分布 序号 机构名称 文献数(篇) 百分数 * ( % ) 1 武汉大学 83 9.0 2 华中师范大学 27 2.9 3 中国科学院 26 2.8 4 吉林大学 21 2.3 4 北京大学 21 2.3 4 南京政治学院 21 2.3 4 郑州大学 21 2.3 8 南开大学 19 2.1 9 中山大学 14 1.5 10 南京大学 12 1.3 11 南京农业大学 11 1.2 11 中国科学技术信息研究所 11 1.2 11 中南大学 11 1.2 11 郑州航空工业管理学院 11 1.2 11 国防科技大学 11 1.2 3.5 文献关键词词频分析(见表 7 ) 词频分析法是指利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域的文献中出现频次高低来确定该领域研究热点和发展动向的一种文献计量方法 。某个关键词或词组出现的越频繁,表明该领域对这个概念的关注度越高,该主题就有可能是这个领域的一个 热点 。由于万方数据库未对文献进行主题标引,无法统计主题词的词频,因此,本文采用关键词词频分析法来探究信息组织领域的研究热点及发展趋势。 表 7 国内信息组织相关文献关键词词频分布 序号 关键词 频次 * 1 知识组织 215 2 检索语言 102 3 数字图书馆 73 4 分类 71 5 本体 49 6 网络信息组织 46 7 网络环境 44 8 竞争情报 38 8 语义网 38 8 元数据 38 * 注:已将同义词、近义词的出现频次进行合并,此处所列频次是指各个近义词或同义词的频次之和。 表 7 可见,包括博硕士论文、会议论文在内的 729 篇论文中,共出现关键词 500 余个( 233 篇文献没有标注关键词;一篇文献可以包含若干个关键词,一个关键词可以出现在多篇文献中;排除了信息组织、利用、地位等无实际意义的关键词),本表列出了出现频次排名前十的关键词,从中可以看出,知识组织是目前信息组织领域最为活跃的研究热点,是信息组织的高级形式,正朝着自动化、智能化及集成化的方向发展;其中 XML 、本体、元数据、语义网及知识挖掘等均属于知识组织的范畴,是研究网络信息组织的重要技术和工具。情报检索语言作为近现代信息组织的一项重要工具,其重要性也毋庸置疑。利用 web2.0 技术对网络信息资源进行合理构建、搜集、组织、利用及共享的数字图书馆在信息组织应用中占据了较大的比重,表明我国信息组织的应用研究正在逐渐加强。此外,竞争情报、学科信息门户、神经网络等热门领域也日益受到信息组织研究人员的关注和重视,表明信息组织领域隐含的经济及社会效益已经激发了人们的研究热情。 4 结语 通过以上文献计量学的统计分析,可以看到现阶段我国信息组织相关研究的总体发展趋势良好,基础理论性研究与应用研究并重,涉及多个学科领域,并逐步向一些热门领域发展,其潜在价值仍有待人们进一步的发掘。此外,通过文献来分析国内信息组织的研究热点,一方面会受到文献质量的影响,另一方面也会受到标引质量的影响。如果文献质量不高,或者文献标引不规范,那么分析结果必然受到影响 。另外,数据库收录文献的时滞性也是一个不可忽视的问题。因此,本文的研究结果只能为相关研究人员提供一些参考依据,为其选择研究方向提供一些借鉴。若想进一步了解一些具体问题,还需咨询信息组织领域的一些专家学者。 需要说明的是,由于文献计量统计是一种纯定量的研究方法,因此本文所得到的只是一种描述性的解说,而并非是一种定性的推断性的结论 。未来的研究将会随着数据的积累和完善,信息组织领域自身的发展和成熟,以及文献计量方法的进一步改进,得到更深的拓展。 本文通过对国内信息组织相关文献的统计分析,使国内相关领域的科研人员对现阶段我国信息组织的研究现状及发展趋势能够有一个更为全面、清晰地了解,从而能够更好地把握其研究方向。 参考文献 信息组织的理论基础 . .http://baike.baidu.com/view/401761.htm 滕福生 . 电力管理信息系统的信息组织理论 . 信息管理、电力计算及数据通信学术会议论文集 . 中国电机工程学会信息管理、电力计算及数据通信学术会议 ,1987. 宋彩萍 ; 霍国庆 . 信息组织论纲 . 中国图书馆学报 ,1997(1):20-22. 戴维民主编 . 信息组织 . 北京 : 高等教育出版社 ,2009. 马张华编著 . 信息组织 =Information organization . 北京 : 清华大学出版社 ,2008. 党跃武 . 信息组织论 . 图书情报工作 ,1997(3):12-16. 尚可聪 . 信息组织要论 . 图书情报工作 ,1998(11):1-4. 曹树金 ; 罗春荣编著 . 信息组织的分类法与主题法 . 北京 : 北京图书馆出版社 ,2000. 倪莉。信息组织研究述评 . 情报资料工作 ,2001(2):16-18. 冷伏海 ; 徐跃权 ; 冯璐主编 . 信息组织概论 . 第 2 版 . 北京 : 科学出版社 ,2008. 储节旺 ; 郭春侠 ; 吴昌合编著 . 信息组织学 . 北京 : 清华大学出版社 , 北京交通大学出版社 ,2007. 周宁主编 . 信息组织 . 第 2 版 . 武汉 : 武汉大学出版社 ,2004. 万方数据库 . . http://baike.baidu.com/view/290752.htm. 陈立新 ; 刘则渊 ; 梁立明 . 基于论文标题的学科结构研究 . 情报学报 ,2010(29),2:305-313. 王敏 ; 李阳 ; 孙晓北 ; 许培扬 ; 池慧 .2009 年甲型 H1N1 流感国内外文献分析研究 ; 医学研究杂志 :2010(39),2:98-102. 李海存 ; 王敏 ; 许培扬 . 国际单克隆抗体研究文献分析 . 预防医学情报杂志 ,2010(4): 298-304. 钟毓宁.机械设计与诊断的知识组织及可靠性管理 .华中理工大学,1991. 孙燕;卢朝晖;王敏.图书馆医学信息学论文统计分析 .中华医学科研管理杂志,2005,18(6):364-365,378. 马费成;张勤.国内外知识管理研究热点基于词频的统计分析 .情报学报,2006, (2):164 -171. 张士靖;周志超;杜建;谢莉琴.国内外健康管理研究热点对比分析 .医学信息学杂志 , 2010(31),4:6-10. 朱坤;马明;王敏.基于文献计量学的国际社区卫生服务研究热点分析 .中国卫生政策研究,2009(2),25-29. 马费成;宋恩梅.我国情报学研究分析:以ACA为方法 .情报学报,2006(25),3:259-268. 作者单位:100020 北京,中国医学科学院医学信息研究所研究生 导师 许培扬
个人分类: 信息分析|5300 次阅读|0 个评论
基于内容与形式交互的图书馆资源组织语义化方法研究
liuysd 2010-11-11 10:01
原文发表于《情报理论与实践》2010年10期 ●刘 耀 1 ,穗志方 2 ,胡永伟 2 ,赵庆亮 2 (1. 中国科学技术信息研究所,北京 100038 ; 2. 北京大学 计算语言学研究所,北京 100871) 基于内容与形式交互的图书馆资源组织语义化方法研究 * 摘 要: 网络环境下的图书馆资源语义化已是大势所趋,本文在对国内外相关研究进行深入分析的基础上,依 据书目原理与共轭控制理论,提出图书馆资源语义化应分为 内容语义化和 组织语义化 两个层次的设想,并 认为图书馆资源组织语义化,可以看作图书馆资源语义标注的浅层标注,是内容语义化与形式语义化交互实现的过程,提出了基于 NLP 理论与方法,结合传统图书馆资源组织方式(分类法、主题词法)与领域本体构建技术,搭建辅助构建及标注一体化平台,进而实现语义元数据体系构建与资源组织语义化过程同步实施的解决方案,这一思想与方法的提出与实现,可以有效地促进图书馆资源语义化进程,使语义自动标注与知识服务成为可能。 关键词: 信息资源;语义化;语义标注;知识工程 图书馆存储了大量的文献资源。如何帮助用户全面、快速、准确地发现蕴涵在文献中的知识,从不同的知识维度展示这些知识、发现文献所承载的知识之间的各种关联,进而辅助用户更高效地进行知识创新,这是实现图书馆下一代文献服务的跨越式发展,从文献信息检索服务上升到文献的知识服务的关键问题。因此,网络环境下的图书馆资源组织语义化已是大势所趋。所谓语义化,就是选择适合的语义标签,通过资源中标签的内容反映出资源的语义特征,从而将内容转换成计算机可识别的形式,使计算机在一定程度上实现对资源内容的理解和掌握。 1 概述 在图书资源的语义化问题上,本研究依据书目原理(将某一文献信息浓缩为某一款目,将其作为这一文献信息的替代品,然后将款目组织排列成书目成为文献信息群的替代品,进而通过书目对文献信息进行揭示、识别和检索最终达到对海量文献信息有效控制的目的)与共轭控制理论 (需要控制而又未能控制的事物甲与可控制的事物乙之间具有相似或相关的关系,施控者通过控制事物乙,达到控制事物甲的目的)提出内容语义化和组织语义化两个层次。内容语义化,即利用自然语言处理技术对文献资源进行语义标注,实现计算机对文献内容的理解与掌握,其对语义化的解释前提是:每个词的意义是什么,词的意义如何结合成句子的意义,句子的意义如何构成篇章的意义等。文献内容丰富多样,浩若烟海,实现内容语义化虽然是资源语义化的终级目标,但就目前的自然语言处理技术来看,基本上难以实现。而知识服务又必须要求我们实现资源的结构化与语义化,因此,可将其视为事物甲。 组织语义化强调的是通过各类标签表示的组织形式上的语义化,其对语义化的解释前提是概念及概念关系的结构化与网络化。由于当前情报检索语言已达到相当高的控制水平 ,我们可以通过自然语言处理技术结合高密度知识单元对其进行重构与改造,使其具备一定的语义结构,进而实现资源组织的语义化,因此,可将其视为事物乙。那么,能否通过控制事物乙达到控制事物甲的目标呢?这是由内容语义化与形式语义化的关系来决定的。其实,内容语义化和组织语义化并不是独立的,是根据内容的语义去选择标签的(语义标注),这时标签的语义也就代表了内容的语义。笔者认为图书馆资源组织语义化,可以看作图书馆资源语义标注的浅层标注,是内容语义化与形式语义化交互实现的过程,因此,笔者提出了基于内容与形式交互的图书馆资源组织语义化方法研究的设想,其中涉及的两个关键问题是:语义元数据的生成和语义标注。 2 国内外相关研究现状 语义元数据 (也称作标签本体 Tag Ontologies )提供数据的语义信息,是图书馆资源组织语义化的重要工具,在对仅仅为人所能阅读信息转换为机器可处理的信息中,起着极为重要的作用。这也使得近年来给数据赋予其语义信息的工作,即语义元数据生成,得到了越来越多研究人员的关注。 语义元数据生成技术与领域知识库或领域本体构建技术,从技术实现来看基本上是一致的,方法与理念也相对成熟,本研究也进行了艰苦的探索与研究,已取得大量成果 。 另外一个关键问题是语义标注,语义标注的方法目前来说有 3 类:人工标注;领域文档类型定义 (DTD) 和文档模式进行概念映射和标注;利用词汇语义分析进行标注 。手工语义元数据生成耗费大量的时间且包含大量错误,这使得一些工作集中在研发标注工具来简化手工语义元数据生成的工作。为了降低语义元数据生成过程中人的参与,一些半自动的辅助技术被应用到上述标注工具中。如 CREAM 系统的扩展研究中的 S_CREAM 和 PANKOw 等方法。为了彻底地自动化整个标注过程,大量的工作集中在设计自动语义元数据生成模型与方法上面。如 Huang 等人提出了一个基于 Web 的自动主题元数据生成系统 。 Yang 和 Lee 提出了一种自动生成网页的语义元数据的方法 。 A . Dingli 等人提出了一个叫做 Armadillo 的框架 。 H . Graubitz 等人展示了 DIAsDEM 框架 。 J . Li 展示了一个基于依存语法的将句子进行语义标注并转化为 RDF 样式的机器学习方法 。 Dill 等人描述了一个在大规模语料里面进行语义标注的工程 semTag 。 通过对以上工作进行分析,不难发现,许多研究存在内容语义化与组织语义化概念模糊的问题,即将组织语义化等同于内容语义化 ( 内容的语义化过程,过度依赖自然语言处理研究的突破 ) ,由于理论上的局限,导致资源语义化实现的结果不理想。国外部分学者也认识到了这一点,如 Specia 和 Motta , Hak Lae Kim 等提出了整合民俗分类法和本体,以丰富标签的语义表达功能的解决方案。民俗分类法的强大在于它可以聚合所有个人感兴趣的、被标签标注的信息。这对于网络信息组织来说具有一定的优势,但对于图书馆资源组织来说就太过于随意了。因此,本研究提出基于 NLP 理论与方法,结合传统图书馆资源组织方式(分类法、主题词法)与领域本体构建技术,构建语义元数据体系,搭建辅助构建及标注一体化平台,进而实现体系构建与资源组织语义化过程的同步实施的理论与方法。 3 需要解决的关键问题 1) 开发辅助构建平台。研发面向知识密集型文本片段的自然语言分析技术,构建语义元数据辅助构建平台。 2) 研究语义标注技术。开发基于语义元数据的中文语义标注技术,构建辅助平台,自动或半自动实现文献的语义标注。 3) 研究标签数据本身的描述深度和传统组织资源的协同性。当前语义元数据(标签本体)的研究还处于初级阶段,标签数据本身的描述深度和传统组织资源的协同性研究也是重点内容,需要进一步深化并相互借鉴融合,使其更加丰富并更具有适应性。 其中主要包括:标签数量与语义标注质量之间的关系研究、组织语义化质量与内容语义化程度的关系研究等内容。 4 思路与方法 利用自然语言处理 (NLP) 技术和机器学习方法对已有公认领域知识,如专业叙词表、专业辞典、专业教材或权威著作等进行重构利用,构建领域本体的基础上,开发中文文献资源语义标注技术,对相关文献进行语义标注,并在大量内容相对语义化的基础上,结合传统组织资源 ( 叙词表等 ) ,通过机器学习等方法,生成初始语义元数据,然后在辅助平台的帮助下实现图书馆资源组织语义化过程与语义元数据体系的构建同步进行,并将语义标注文献与语义索引分别存储。流程与结构见图 1 。 1) 数据基础建设。利用已有研究成果,对选定文献进行词性切分与标注,并结合领域语义词典,实现文献资源的专业知识标注 。 2) 面向知识密集型文本片段的自然语言分析技术研究。利用综合型语言知识库,结合统计技术,设计并实面向知识密集型文本片段的自然语言文本分析技术。通过在语法规则中结合语义信息,在句法分析的同时获得句法成分之间的语义限制信息。并对谓语中心词及其主要配价成分进行语义角色的标注,获得句子的浅层格框架,从而实现对知识密集型文本片段的自然语言部分分析和理解 。 3) 知识密集型文本片段的风格特征的表示、获取及应用。通过对专业教材、专著及百科全书的释义文本进行术语识别和浅层分析,学习表示领域概念关系的语言表示模式。进而,将这些语言表示模式汇集起来形成知识密集型文本的风格特征。下一步,将根据这些知识密集型文本片段的风格特征,并结合图书馆文献资源传统组织方式的结构标记集,从广泛存在的文本资源中选择知识密集型文本片段,作为获取领域新知识的来源,进而构建训练语料库 。 4) 研究语义标注技术。基于标签数据描述深度协同性研究,使用语义索引来存储语义标注的结果。语义索引的主要思想是,不按照文档来进行索引,而是对不同粒度的文本片段单独进行索引,并在索引中加入指示其粒度和语义信息的域。一个文本最主要的信息被保存在 3 个域中:第一是文本粒度,主要分为三级(篇章、段落和句子);第二是文本片段的内容;第三是文本片段的语义。 5) 开发辅助构建平台。研发面向知识密集型文本片段的自然语言分析技术,构建语义元数据辅助构建平台 。 ① 利用主题词表的概念做本体的概念节点,并保留基本语义关系。主要是纵向关系,如心肌炎是上位是心血管疾病,下位是病毒性心肌炎等。 ② 利用专业词典切分标注文献资源。提供领域切分标注语料,揭示术语的真实分布,为语义计算提供数据基础。 ③ 利用教材专著等确定概念间横向语义关系。如疾病的关系涉及到疾病的发病机理、诊断、治疗、鉴别诊断、用药、预后等关系均可以由教材及专著中获得。 ④ 利用本体技术构建立体网状语义结构,生成概念间其他语义关系。如利用类的属性设置功能将生物化学物品类设定为疾病类的治疗属性,这样生物化学物品就被赋予了药物的语义,与疾病之间就构成了治疗关系。 6) 人机协作的语义关系自动提取机制的优化。本研究中人机协作机制的特点在于:通过人机协作,一方面,人类专家对机器学习的结果进行校对;另一方面,在校对过程中所用到的人类知识也被机器逐渐地吸收,进而在人机协作的过程中,语义关系的自动提取机制被不断地完善和优化。 5 结束语 本文提出了内容语义化与组织语义化的区别对待的理论与方法,明确内容语义化与组织语义化的关系,可以使资源语义化分阶段分层次实施;依据书目原理和共轭控制理论,将目标锁定在语义元数据体系构建上,使在自然语言处理技术不太成熟的情况下,也能大幅度提高资源语义化标注的自动化程度,使组织语义化快速实现成为可能;开发基于语义元数据的自动标注技术,实现了中文文献的半自动辅助语义标注,为加速实现了中文资源的语义标注进程提供了技术保障。资源的加工方式决定了其提供服务的方式,该方法的实现与实施,可以有效地促进图书馆资源语义化进程。使语义标注加工与知识服务成为可能。 不足之处:本文中开发的标注技术只是在实验系统中得到了实现,需要进一步应用到大型文献服务系统中进行验证与完善。另外,标签数据本身的描述深度和传统组织资源的协同性研究也需进一步深化,特别是标签数量与语义标注质量之间的关系研究,对于语义自动标注工作来说,显得尤其重要。□ 参考文献 李金,等 . 管理学原理 . 北京 : 北京工业大学出版社 ,2004:316. 刘耀 . 网络传播技术控制的共扼控制模式研究 . 情报理论与实践, 2009 ( 5 ): 90-94. 张琪玉 . 积极为自然语言与情报检索语言的结合创造条件 . 图书馆杂志 , 1999(9):7-9. 韩先培 , 赵军 . 基于 Wikipedia 的语义元数据生成 . 中文信息学报 , 2OO9, 23(2): 108-114. 刘耀 , 穗志方 . 领域 Ontology 概念描述体系构建方法研究 . 大学图书馆学报, 2006(5) : 28-33. 刘耀 , 穗志方 , 胡永伟 . 领域 Ontology 自动构建研究 . 北京邮电大学学报 , 2006(Z1) : 65-69 . LIU Yao,SUI Zhifang. On method and automatic construction theory of domain ontology based on depended text // International Conference on Innovative Computing, Information and Control, 2006 : 63-66. LIU Yao, CHEN Xuefei, SUI Zhifang. Study on evolution of domain ontology // Second International Conference on Innovative Computing, Information and Control, 2007:1-4. 张晓林. Semantic Web 与基于语义的网络信息检索 .情报学报, 2002 , 21(8) : 413-420. HANDSCHUH S, et al. S-CREAM-Semi-automatic CREAtion of metadata //13th International Conference, EKAW 2002 Sigenza, Spain, 2OO2:358 372 . CIMIANO P , et al . Towards the self annotating Web // FELDMAN S I , et al. Proceedings of WWW, 2004 : 462-471 . CHIE CHUNG HUANG, et al. Using a Web based categorization approach to generate thematic metadata from texts .ACM Transactions on Asian Language Information Processing,2OO4,3(3):19O-212 . YANG H-C , LEE C-H . Automatic metadata generation for Web pages using a text mining approach //International workshop on Chal1enges in web Information Retrieva1 and Integration , 2OO5 : 186-194 . DINGLI A,et al. Automatic semantic annotation using unsupervsed information extract on and integration // GENNARI J , et al . Proceedings K-CAP, 2003 . GRAUBITZ H , et al . Semantic tagging of domain-specific text documents with diasdem // SAAKE G , et al . Proceedings of DBFusi0n 2OO1 . USA : ACM , 20O1 : 61-72 . LI J , et al . Learning to generate semantic annotation for domain specific sentences // GIL Y , et a1 . Proceedings of K-CAP,2OO1:44-57 . DILL S , et al . A case for automated largescale semantic annotation . Web semantics : science , services and agents on the W0rld Wide Web , 2OO3 , 1(1) : 115-132 . SPECIA , LUCIA , MOTTA E . Integrating folksonomies with the semantic Web //European Semantic Web . Conference , 2007:624-639 . HAK LAE KIM, et al. The state of the art in tag ontologies: a semantic model for tagging and folksonomies // In International Conference on Dublin Core and Metadata Applications, 2008. 刘耀 , 段慧明 , 等 . 中医药古文献语料库设计与开发研究 . 中文信息学报 ,2008(4) : 24-30. SUI Zhifang, LIU Yao, HU Yongwei. Extracting hyponymy relation between Chinese terms based on term typescommonality . ICIC Express Letters,2009,3(4): 1233-1238. 刘耀 , 穗志方,等 . 中医药本体概念描述体系的自动构建研究 . 现代图书情报技术 , 2008(5):21-26. LIU Yao, SUI Zhifang, et al. Research on automatic construction of medical ontology // International Conference on Biomedical Engineering and Computer Science, 2010 . 作者简介:刘耀,男, 1972 年生,副研究员,博士,博士后。 穗志方,女, 1970 年生,博士,北京大学信息科学技术学院计算语言学研究所教授,主要从事知识工程与中文信息处理方向研究。 胡永伟,男, 1983 年生,北京大学信息科学技术学院硕士研究生,研究方向:自然语言处理。 赵庆亮,男, 1985 年生,北京大学信息科学技术学院硕士研究生,研究方向:自然语言处理。 * 本文得到国家 973 项目(项目编号: 2007CB512601 ),国家科技支撑计划项目( 2006BAH03B06 ),国家自然基金项目(项目编号: 60873156 )的支持。
个人分类: 科研笔记|5819 次阅读|0 个评论
研究热点:信息构建 知识管理 信息组织
xupeiyang 2010-7-8 09:50
中国知网(CNKI)基于数据库的数据挖掘、知识发现和信息整合技术,分析出各科技领域的科研热点和研究前沿,对科研人员了解、掌握科技动态与进展很有帮助。 科研热点的相关信息包括:相关文献、专利文献、科技成果、国家科研项目、研究人员、研究机构、研究主题、学术文献被引情况和下载情况等。 相关研究项目,科研人员应当特别关注正在进行中的科研项目(2010 - 2014年的在研项目),了解在研项目的研究动态,跟踪科技进展。目前,国内还没有一个在研科技项目数据库可供检索查阅的,在CNKI平台查阅比较方便。 详细信息见 http://elib.cnki.net/grid2008/DetailHot/HotView.aspx?subCode=I141-127 热点名称: 信息构建 知识管理 信息组织 知识点: 信息构建 情报学 信息组织 网站建设 信息建筑师 知识管理 ia 知识构建 用户 数字图书馆 情报学研究 信息资源 网站评价 个性化信息服务 信息空间 电子商务网站 政府网站 网络时代 用户信息需求 导航系统
个人分类: 热点前沿|3320 次阅读|0 个评论
新书推荐:情报检索语言与智能信息处理丛书
timy 2010-3-9 10:20
2009年底东南大学出版社出版了一套 情报检索语言与智能信息处理丛书 ,该丛书由南京农业大学信息管理系侯汉清教授主编,涉及情报检索与智能信息处理相关话题,丛书共分8本书,分别为: (1) 薛春香著《 网络环境下知识组织系统构建与应用研究 》; (2) 陆勇著《 面向信息检索的汉语同义词自动识别 》; (3) 杜慧平、仲云云著《 自然语言叙词表自动构建研究 》; (4) 章成志、白振田著《 文本自动标引与自动分类研究 》; (5) 张雪英著《 情报检索语言的兼容转换 》; (6) 刘华梅、戴剑波著《 受控词表的互操作研究 》; (7) 何琳著《 领域本体的半自动构建及检索研究 》; (8) 李运景著《 基于引文分析可视化的知识图谱构建研究 》。 这8本书基本上是从情报学角度,结合计算机科学、语言学等多学科方法,进行某一具体问题的研究,对信息检索、信息组织、文本挖掘等方面的研究者和爱好者可能有一定帮助。感兴趣的读者,可以点击相应链接查看内容简介和章节目录。 情报检索语言与智能信息处理丛书目录: http://press.seu.edu.cn/book.search.php?code=978-7-5641-1913-3
个人分类: 研究方法|5305 次阅读|2 个评论
基于本体的转化医学信息组织表达方法的探索
zilu85 2009-11-13 08:52
【下面是我在中华医学会医学信息学学术年会上宣读的一篇论文的前言部分】 转化医学是指将基础研究人员和临床医生的研究成果整合起来,将其直接应用于病人身上,转化医学研究的目标就是探索如何跨越从实验室到病床的屏障。由于医疗实践的初衷就是尽可能多地利用知识和数据来治愈病人,所以转化医学不是什么新的概念,只是随着最近 20 年信息科学技术的发展,开展转化医学研究的条件愈发成熟起来。 特别是高通量分子技术的发展,产生了大量的、复杂的、而且是动态的数据,利用这些来自于基础科学实验室的数据的研究论文也越来越多,这些文献所提出的理论改变了我们对人类疾病的理解,并且对病人的治疗发挥了直接作用。因此说,高通量分子技术的进步给生物医学的发展带来了机遇,尤其是给转化医学 (Translational Medicine) 研究带来了新的契机。 如何开展转化医学研究?关键的步骤之一就是将来自实验室的基因表达数据与患者的临床特征衔接起来。 以乳腺癌为例,作为女性多发癌症之一,其诊断和治疗研究具有十分重要的意义。一直以来,人们普遍认为乳腺癌是一种异质性疾病,有必要对乳腺癌进一步分类以实施个性化治疗。在现有的知识水平上,临床医生可以根据肿瘤的临床特征 ( 如肿瘤的大小、淋巴结转移、远隔转移以及组织学表现 ) 、病人特征 ( 如年龄、吸烟史和月经状况 ) 以及免疫组织化学特征 ( 如 ER 、 PR 、 ERBB2) 等患者临床特征信息,大致估计肿瘤行为,并为判断预后和对治疗的反应提供帮助。因而,患者临床特征是乳腺癌预后和治疗的重要因素。两组病人基因表达的某些差异可能是由其他因素 ( 如年龄 ) ,而不是靶向因素 ( 如治疗 ) 造成的。 然而,在对癌症患者的肿瘤标本的微阵列数据进行分析的时候,往往把患者间的临床特征上的差异降到最低。例如,在有关治疗的微阵列实验研究中的设计中,尽可能选择年龄没有显著差异两组病人。由于微阵列研究往往费用比较昂贵,研究人员没有足够的样本得出针对病人临床特征的具有统计学意义的结论。如果能够汇集并组织已有的微阵列数据中的临床特征数据,深入探索临床特征与基因表达数据之间的关联,有可能把基础研究与临床实践结合到一起,成为解决问题的途径之一。 目前,在许多基因表达数据库的记录中则蕴含着与该实验数据相关的病人信息,其中重要公共资源当属基因表达数据库( Gene Expression Omnibus , GEO , http://www.ncbi.nlm.nih.gov/geo )。 GEO 是 NCBI 为保存和自由分发科研人员提交的高通量基因表达数据而建立一个基因表达数据仓库和在线资源,该数据库保存了来自微阵列( microarray ),高密度寡核苷酸阵列( HAD ),杂交膜( filter )和基因表达系列分析( SAGE )的许多类型的基因表达数 据。 目前, GEO 存储了大约 10 亿单个基因表达的数据,来自于 100 多种生物,内容广泛涉及到各种生物学问题。在 GEO 中部分记录中含有病人临床信息。例如, GEO 中 GSE2019 号系列中有数百个样本,每个样本的 Description 字段都有临床信息的注释,包括病人的年龄、性别、种族、肿瘤的病理分期、分型等等(见图 1 )。 这些基础研究的记录中包含了病人的临床数据,潜在地把基础研究与临床实践联系了起来,对于开展转化医学探索具有重要的意义。因此,如何组织和表达基因表达数据库中的临床特征数据,尤其是这一研究领域所涉及到的基本术语、概念以及这些概念间的关系,是检索、存储、组织和利用数据库中来自不同实验室的患者临床数据的前提,也是今后开发相关知识库的保障,更是进一步开展转化医学研究的基础。 正是基于上述原因,本研究提出建立一个本体来规范表达临床信息 / 知识。 近年来,随着本体 (Ontology) 研究的逐渐成熟,本体技术被越来越多的研究领域所接受,已经成为整合和解释生物医学数据的重要工具技术 。简单的讲,本体是某一领域的术语及其关系的明确正规的界定在医学领域里开发出了大量的标准化的结构化词表,如 snomed 和一体化医学语言系统 (Unified Medical Language System , UMLS) 。极大的方便了人们交流、组织、表达和分析利用信息。 为此,我们搜集了 GEO 中与乳腺癌相关的基因表达记录,对筛选出含有病人信息的记录,分析其中使用的术语和概念。利用本体的方法构建出表达基因表达数据库中乳腺癌病人的临床信息的知识库。利用该本体可以更加准确的检索、分析和解释乳腺癌微阵列数据,由此促进转化科学和系统科学的发展。同时,也为今后在其他类型的肿瘤和其他高通量平台中应用本体来分析和组织信息提供基础。
个人分类: 生物信息学|5958 次阅读|2 个评论
2009年网络信息组织与检索高级研修班
huabolin 2009-6-3 11:42
时间:2009年6月23日至6月28日(6天) 地点:山东-威海 网络信息技术是保证网络信息有效传播的基础,是一个完整的体系,渗透到了传播的每一个层面。所以,网络信息组织与管理技术虽然较之因特网自身的发展而言,具有明显的滞后性,但对于网络信息的无序与泛滥而言,网络信息组织技术仍然是最有效的方法与手段。 我们认为,网络信息传播与组织归结到技术层面,终究要以信息组织为核心,要实现网络信息的有效利用,就必须对网络信息进行有序化组织与控制,这是网络信息有效利用与传播的必要基础和重要环节。 搜索引擎通过对网络信息进行理解、提取、组织和处理,并为用户提供检索服务,不但成为了网络信息检索的首选工具,同时,也自然而然地成为了网络信息组织与利用的重要模式。因而,研究搜索引擎的信息组织对于网络信息资源的有效开发、利用与控制具有重要意义。 为了帮助广大专业人员尽快提高网络信息组织与分析能力,提高各行各业对于网络信息的利用能力。中国科学技术信息研究所于2009年6月23日至28日在山东-威海举办2009年网络信息组织与检索高级研修班。 经培训考核合格者,由中国科学技术信息研究所颁发网络信息组织与检索高级研修班结业证书。 现将有关事宜说明如下: 一、办班特色 检索原理从根讲起,技术实例躬身示范,前沿进展踊跃探讨。 掌握搜索引擎使用技巧;快速获取网络信息资源;优化本单位网站并提高在搜索引擎中的排名;分析挖掘网络信息;捕获搜索引擎研究热点及趋势;轻松搭建起自己的搜索引擎(提供一套可以搭建一个中型搜索引擎的源代码)。 二、培训对象 各级政府、企业、事业单位、科研院所、大专院校、咨询公司、金融证券等机构及相关部门专业从事技术开发、信息管理、信息分析、信息服务、情报研究、战略企划、产品开发、成果推广的管理与专业人员。 三、课程内容 1.搜索引擎使用技巧 综合运用逻辑表达式的组合检索、特征限定、范围限定等方法,大幅提高检索结果的精准率。 2.搜索引擎优化(SEO) 搜索引擎排名的指标体系,提高搜索引擎排名的技巧,合理设置链接,有效布局关键词,合理运用SEO技术,使你的网站得到更多的关注。 3.动态网页的内容获取方法 网站内容下载工具的使用技巧与方法;构造URL批量下载网站数据库内容;自制浏览器获取非OpenURL的网页内容。 4.搜索引擎发展趋势 搜索引擎爬行范围的扩展(从静态网页到动态网页);网页分析标引的深化(从关键词到句段),检索接口的多样化(从文本到图形、音频、视频等)。 5.网络信息挖掘 Web结构挖掘、Web内容挖掘、Web使用记录挖掘等。结合实例介绍搜索引擎日志挖掘、BBS用户行为分析、Blog用户的社会网络特征等。 6.基于开源代码的搜索引擎构建 掌握搭建搜索引擎平台所需的核心知识并且轻松搭建起自己的搜索引擎平台,从而解决费用昂贵和容易泄露机密的问题。 四、师资队伍 邀请高校及科研院所相关领域知名专家,大型软件开发公司技术总监,著名企业高级软件工程师,实力派信息分析师,资深培训师轮流授课。 五、颁发证书 培训考核合格者,由中国科学技术信息研究所颁发培训结业证书。 六、培训安排 1. 6月23日全天报到,6月24日至28日授课及业务考察。 2. 报到及培训地点:威海电子宾馆(威海市环海路15号) 3. 培训费:2800元/人(含资料、结业证、上机实习和业务考察等费用) 培训费,请于2009年6月18日前汇至以下帐户:并注明网络信息组织与检索。 户 名:中国科学技术信息研究所 开户行:中国工商银行北京玉渊潭支行 帐 号:0200232109200900593 4. 食宿统一安排,费用自理。 住 宿:威海电子宾馆(三星级,标准间240元,每人每天120元) 七、参加培训人员请务必于2009年6月18日前将报名表返回会务组。邮件、 从网上或传真返回均可。 八、联系办法 通讯地址:北京复兴路15号中国科学技术信息研究所(100038) 招生网址: http://www.istic.ac.cn 邮箱地址: kipx@istic.ac.cn 联系人电话:胡老师 010-58882298 传真: 010-58882296 陆老师 010-58882299 吴老师 010-58882297
个人分类: 信息检索|5205 次阅读|0 个评论
2009年信息组织的相关会议
xuechunxiang 2009-2-6 15:15
, 1、 Second International Workshop on Practical Semantic Astronomy,2-5,March,2009 Glasgow,UK. http://www.dcs.gla.ac.uk/workshops/semast09/ 2、Content Architecture - ISKO UK Conference 2009 - London, 22-23 June http://www.iskouk.org/conf2009/index.htm . 3、 International UDC Seminar 2009 CLASSIFICATION AT A CROSSROADS - MULTIPLE DIRECTIONS TO USABILITY The Hague, 29-30 October 2009 http://www.udcc.org/seminar2009/index.htm. 4、全国第五次情报检索语言发展研讨会, 上海 征文截止日期 2009-4-30 5、DC-2009 Semantic Interoperability of Linked Data 12-16 October, 2009, Seoul, Korea, http://www.dc2009.kr/ 6、《图书情报工作》杂志社第21次图书馆学情报学学术研讨会, 2009年5月 , http://www.lis.ac.cn/infomation.asp?id=45 不完整,暂记之!
个人分类: 我思我在|4120 次阅读|1 个评论
一则学术会议征文信息有感
timy 2009-2-4 12:18
全国第五次情报检索语言发展方向研讨会 将于2009年6月在上海举办,这个是国内信息组织研究人员非常关注的一个会议。相关的会议按照学科来看,可以分为图情学科和计算机学科: 国内关于信息检索的研究与实践最初源于图书情报界,主要针对图书文献进行组织和检索。图书情报界有关信息检索(早期叫情报检索,它和信息组织是紧密联系的)的会议有全国计算机信息管理学术研讨会、全国情报检索语言发展方向研讨会,中国索引学会年会及学术研讨会以及其他一些非定期的相关学术会议。全国计算机信息管理学术研讨会在业内又称机检会,因为早期主要是做计算机信息检索的人聚在一起研讨信息检索的。这个会办到现在已经20几届了,早期计算机领域的人参加较多,现在基本上只有图情的研究参加。全国情报检索语言发展方向研讨会,中国索引学会年会及学术研讨会是范围比较小的会议,基本上是图书情报界的研究人员参加。 计算机界主要从检索技术与实现方面进行了大量研究,并且更侧重于对海量的,通用的信息资源进行挖掘和检索。再看看国内计算机界举办的信息检索相关的学术会议:全国信息检索与内容安全学术会议,全国搜索引擎和网上信息挖掘学术研讨会,全国计算语言学学术会议(里面有信息检索的专题)。这些会议的参加人员包括计算机界、语言学界、图情界等,从构成、范围、影响力上可以看得出这些会议有很好的生命力。 同样是为了解决人类的信息需求问题,不同学科针对不同的研究对象,用自己学科的基本方法来进行坚持不懈的研究与实践。学术会议是学术交流的一个缩影,通过学术会议能从一定程度看出一个学科的发展轨迹。不同学科的融合(如研究方向的交叉、研究方法博采众长等),可以算是延续一个学科生命力的有效方法之一。 08年博主曾在博文 参加SEWM2008 提到计算机界的IR-NLP-DM联合大会,那么图情界、计算机界、语言学界是否能真正融合起来,对信息组织从语言认知、理论模型、技术实现等角度进行全方位的研究,组织一个类似SIGIR、CIKM等国际会议一样(该例子也不是太恰当,现在这两个会议基本上就是计算机界的天下了,即使这样,CIKM还专门设置了Best Interdisciplinary Paper,呵呵。没其他例子举了,没办法啊。),让各种学科研究人员都能广泛参与的会议呢? 以上感想,仅供参考。
个人分类: 研究方法|4931 次阅读|2 个评论
开博纪念
xuechunxiang 2008-12-8 10:28
今日首开博,聊以纪念! 写博,只为每日对自己的一个整理! 今日给自己的一个目标,博客维护期先以一年为限,每日一博!为自己培养一个习惯学会坚持!
个人分类: 未分类|329 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 07:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部