崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

基于文献的发现实例[译文]

已有 4494 次阅读 2008-10-14 02:20 |个人分类:生物医学文献计量学|关键词:学者| 共词分析, 聚类分析, 战略坐标

Stegmann and Grohmann

Stegmann and Grohmann通过运用共词技术拓展了SL方法,这是一种用于聚类的统计学方法。他们不使用单词或者概念,而是分析文献集合中每对MEDLINE文献的关键词共同出现次数。关键词包括MeSH以及酶标记号和CAS注册号。这些分析最后生成了所包含关键词的地图或者“战略坐标”。链接互补又分离文献的promising(有希望的)词倾向于出现在低向心度和密度的区域。通过复制Swanson在雷诺氏病和鱼油关系、偏头痛和酶缺乏上面的发现,验证了他们的方法的有效性,他们还发现朊病毒、神经变性疾病和锰之间的关系。这种关系早期曾经由Chen在研究知识潜在领域问题的时候提出过。之所以叫潜在,是因为在陈的关于知识地图的书中这是些被引频次低的重要论文。

共词分析和聚类的优点在于研究初期选词是自动化的。但是,专题的专家还是要为了最后选择合适的词而评判一下各个类别。共词聚类的另外一个优点是用户对类别的地图或者坐标评价起来要比评价一长串排序的词要容易得多。其缺点是这种方法依赖于来自于受控词表的关键词。其他挖掘标题和文摘的方法更适合没有关键词的方法。此外,这种考量在将来研究人员需要合并没有统一主题词表的数据库并在其中挖掘信息的时候会显得十分重要。

Gordon MD, Lindsay RK. Toward discovery support systems: a replication, re-examination, and extension of Swanson's work on literature-based discovery of a connection between Raynaud's and fish oil. Journal of the American Society for Information Science. 1996;47:116–128



https://m.sciencenet.cn/blog-82196-42575.html

上一篇:利用本体为基础的文本挖掘方法从MEDLINE文摘中抽取生物学关系抽取并应答查询
下一篇:也来娱乐一下子

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 19:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部