武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

情报学研究中的金标准 精选

已有 4812 次阅读 2013-4-18 06:42 |个人分类:图书情报学研究|系统分类:观点评述|关键词:学者| 情报学, office, style, xml, 金标准

情报学研究中的金标准

武夷山

在我们的情报学研究中,很多人不太考虑“金标准”问题。所谓金标准,就是确实能用以衡量你的研究成果的创新性、实用性、准确性等等的东西。一些朋友开发了新指标、新方法,非常开心,我往往会给他们泼一点冷水:“你凭什么说你的指标、方法就更好?”也就是问:你意识到金标准问题了吗?

JASIST杂志2012年第2期发表了美国伊利诺伊大学Neil R. Smalheiser(他与非相关文献知识发现的创始人Don Swanson教授合著过)的文章,Literature-Based Discovery: Beyond ABCs(基于文献的发现:超越ABC模式)。原文见http://onlinelibrary.wiley.com/doi/10.1002/asi.21599/pdf

Literature-Based Discovery,简记为LBD。本文讨论了如何为LBD系统创立金标准的问题。

Neil R. Smalheiser的思路之一,是创新性地利用其他数据集。例如,TREC Conference 2006TREC Conference 2007的提问(queries),就类似于LBD中的单节点搜索,因为这些提问也是试图对给定类别(等价于LBD中的Ci文献)的文章进行排序,排序的依据是这些文章对给定的信息项(items)或概念(等价于LBD中的文献A)的相关性。

他的思路之二,是利用专家定性评价的结果作为比对。例如,将NIH所收到的RO1RO2项目建议书的摘要拿过来(通过CRISPRePORTER数据库可获取这些摘要),好的LBD系统对于那些经同行评议被批准项目的摘要应该打出较高的分。或者说,综述文献中提出的假说,可作为专家们认为什么是有前景的新研究方向的新标准。

他认为,下一步的当务之急,是开发一系列客观指标来测度文献的“有趣度”(Interestedness),有了这样的指标,就可针对不同的科学研究领域定制LBD的特定产出。

他还认为,生物信息学之所以火爆,是因为基因组学和蛋白组学数据集非常丰富,尽管生物信息学采用的数据挖掘方法、统计方法、文本挖掘方法等都很简单,仍旧收获颇多。科学文献也是很丰富的,因此LBD应该是有用武之地的。



https://m.sciencenet.cn/blog-1557-681278.html

上一篇:[转载]袁慧晶: 让屏幕图文更炫更幻更真实
下一篇:莱顿大学发布最新世界大学排名,中国大学中南开最棒

35 陈湘明 赵星 钟炳 陈小润 曾庆平 王芳 李伟钢 刘立 许培扬 赵美娣 孙学军 刘文礼 雷炳旭 苏德辰 蒋新正 化柏林 刘宇 章成志 黄淑芳 刘钢 曹聪 刘淼 赵宇翔 强涛 李泳 许海云 赵凤光 滕毅 魏青山 张子柯 陈冬生 张树风 zhangling aliala yunmu

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 06:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部