科学网

 找回密码
  注册
科学网 标签 引文分析 相关日志

tag 标签: 引文分析

相关日志

学术研究文献的关键路径发现系统
leeshuqing 2011-11-5 08:22
学术研究文献的关键路径发现系统
使用说明:用户可以直接输入查询关键词,同时系统还提供了1742个文档频率高于10的关键词列表以方便用户选择输入。界面中央展示了相应的文献查询结果,节点列从右向左分别表达2000年到2009年共十年的文献数据,节点对应的文献位置越高则代表文献权重值越大,不同节点之间的链接表达了引文关系,其中蓝色表示被引关系,而红色表示引用关系。用户还可以通过调节界面右边的"文档数量"和"引文权值"来改变相应的查询结果数量。同时,每个被点击的节点对应文献的详细信息会显示在界面的左边。 访问网址: http://www.njcie.com/jsj/ 该系统是基于JDK1.6版本制作的Applet应用程序,需支持JDK1.6版本的浏览器 请不用禁用浏览器脚本执行功能 因为数据量较大,首次加载时间因网络带宽不同而不同(电信较快),一般为2分钟至5分钟 在浏览一个关键词的查询结果时,切换节点数量和链接数据皆无需再次请求服务器加载 但是如重新查询其他关键词,则仍需加载新的数据 主页 基本界面 选择新的查询词 ------------------------------------------------- 通过该界面挖掘所需的关键路径和重要文献有相应的使用技巧 我们可以发现图中圆圈标注的两篇文献“基于领域最近邻的协同过滤推荐算法(2008)”、“基于云模型的协同过滤推荐算法(2007)”是具有较高权值的新文献,而且引用了很多重要的前期文献,而图中方块标注的两篇文献“基于项目评分预测的协同过滤推荐算法(2003)”和“个性化推荐算法设计(2002)”是具有较高权值的旧文献,分别代表了两个主要的研究基础点,它们不仅被很多重要文献所引用,具有较高的同被引特征,而且相关的引文权值也很高,说明前后文献的相关度很高。从总体上看,这四个文档具有非常密切的相关关系,在研究方面构成了一个可以相关参考的重要文献群,而且用户可以根据相关的时间和主题关联度来决定阅读次序。
4128 次阅读|0 个评论
引文分析软件HistCite上课现场视频已上传优酷
热度 4 smilesun 2011-5-27 10:17
面对海量的信息,我们如何快速锁定重要的文献? 这是一种重要的能力,能为你节约大量的时间。 如果你的研究领域的文献,大量被SCI收录的话,强烈推荐你花点时间学习一下HistCite这款免费的工具。 《文献管理与信息分析》课程中histcite上课的现场录像,上传至优酷,地址: http://u.youku.com/user_video/id_UMzUwMzk3Nzg0.html 声音质量不佳。 如果你不喜欢视频的冗长,可以参见我之前的一篇博文。 http://blog.sciencenet.cn/home.php?mod=spaceuid=304685do=blogid=383399 另外,3月份我曾做了一个系列报告,科研工作者的信息修炼,其中一讲也是介绍HistCite,有屏幕录像,声音效果要好很多。 可以从中国科学技术大学生命科学实验中心论坛下载 http://biotech.ustc.edu.cn/forum/viewthread.php?tid=9036extra=page%3D1 下面是之前的活动海报 http://ww2.sinaimg.cn/bmiddle/68be25e1jw6dfds8yb1coj.jpg 如果你想关注我和我们团队的更多培训内容,请同时关注我的新浪微博: http://weibo.com/science20
7315 次阅读|4 个评论
HistCite分析结果示例的视频讲解
热度 2 smilesun 2011-4-21 23:12
今晚的《文献管理与信息分析》课程主要讲解 引文分析软件HistCite,这个软件的操作并不难。 主要理解几个参数基本就可以了。 文献分析软件的难点在于对分析结果的解释上,如何根据软件分析的结果,得出有价值的信息。 下面的视频中,选取了部分学生的作业图,进行了一些分析。 这些分析带有个人的主观性,未必都正确,仅供大家参考。 视频和ppt下载 http://biotech.ustc.edu.cn/upload/RMRA/2011/HistCitesample.pptx http://biotech.ustc.edu.cn/upload/RMRA/2011/sample.wmv 今晚的课件忘了录制屏幕了,希望全面学习HistCite软件的朋友可以参照我三月份的报告, 科研工作者的信息修炼 系列之三 http://biotech.ustc.edu.cn/forum/viewthread.php?tid=9036extra=page%3D1
6402 次阅读|1 个评论
科研工作者的信息修炼系列之三:引文分析软件HistCite简介
热度 4 smilesun 2011-3-19 19:29
#科研工作者的信息修炼#系列报告之三,引文分析软件HistCite培训将于下周二、周三 举办。 Histcite能够帮助我们快速锁定一个领域的重要文献、重要作者和重要的研究机构,帮 助我们快速绘制出一个领域的发展脉络,以及找到一个领域最新的进展情况。 在所有文献分析软件当中,这个软件可能算是学习成本最低的一个。 这个软件适合WOS收录的学科。当你想了解一个领域的整体情况,这个软件可以帮你节约 筛选文献的时间。 适合刚进入科研的研究生,以及想法非常多的科研人员,因为你需要快速了解一些并不是非常熟悉的领域。 如果你错过了之前的两场报告,下面有培训课件和视频录像下载 http://biotech.ustc.edu.cn/forum/viewthread.php?tid=9036extra=page%3D1 本次报告时间地点: 第一场 3月22日晚7:30东区1302教室 第二场 3月23日晚7:30西区3117教室
个人分类: 文献管理与信息分析|9165 次阅读|6 个评论
[转载]Histcite 9.8.24 现在已经可以免费使用
热度 8 smilesun 2011-2-28 22:00
感谢中科大生命科学实验中心论坛 jzguowhu 网友 Histcite 9.8.24 现在已经可以免费使用 Thomson Reuters公司居然大发慈悲,把Histcite 软件 改成了免费了,如图(附件)有真相。大家可以赶紧 下载 。 PS:这个公司挺可爱的,说是要 注册 邮箱才能下,其实下载地址是一个固定的网址,不过既然他免费提供给咱们了,还是去提供个电子邮箱呗,我就不直接把下载网址提供出来了。支持下Thomson Reuters公司的这个行为。 下载地址:http://science.thomsonreuters.com/scientific/m/HistCiteInstaller.msi 本博客前面有篇文章介绍,近期会出一个视频教程。
个人分类: 文献管理与信息分析|25344 次阅读|10 个评论
新型期刊评价方法
热度 7 zhaoxing 2011-1-29 05:41
赵星 2011年1月29日于科学网博客( http://blog.sciencenet.cn/?1898 ) (本文系笔者过去两年关于此主题的工作小节,转载敬请标明出处) 过去两年的学习兴趣,除了h指数,就是新型的期刊引文测评方法。特别关注期刊是因为,这是一个特殊的评价层次:期刊的测评连带着另外两个基础层次——人与论文。现实的评价关切中,对于不是非常熟悉的研究方向,我们常常无力或懒于去判断那个人或者论文到底好不好,而通常从发表的期刊水平去估计,并潜移默化。期刊水平也就经常被 不合学理但合乎情势 的用于了表征人和论文的水平。 因此,对于期刊的正确评价,就显得特别重要。 长期以来,期刊测评方法可分为相对定性的同行评议与相对定量的量化测评。量化测评中,又以引文测评方法最为常用,例如众所周知期刊影响因子(IF)。但影响因子存在人为操纵、统计错误、语言歧视及选源标准不清等诸多问题 ,引发了不少争议。另一方面,单一测评方法总有局限,学界较普遍认为应将多种方法配合使用 ,以规避单一指标缺陷带来的风险。因此,新型期刊引文测评方法的研究成为近年来国内外文献/科学/信息计量学研究的热点 ,已产生h型指数(h type indices)、网络中心度(Network centrality)、SJR指数(SJR index)和特征因子(Eigenfactor)等颇具特点的新方法。下面分别讨论。 1.期刊h型指数:高被引论文数量及被引强度的简单测度 h指数 提出后,Braun 等最早将其用于期刊测评。期刊h指数表示期刊至多有h篇论文被引用了至少h次,测量了期刊的高被引论文数量及其被引强度,具有理念先进且导向积极,计算简单而结果稳健 ,可灵活选择统计时间区间,鲁棒性更强等诸多优点。h指数随后也产生了一些改进和补充参数(如g指数、我国计量学家金碧辉老师等人 提出的a指数和r指数等),与h指数一起统称为h型指数。h型指数是近年国际上计量学最主要研究热点(或许不用加“之一”),而期刊h指数是仅次于原始h指数的常见应用。 2. 期刊中心度:期刊引文网络视角的引证中心性测量 Price 很早就提出,由期刊论文为节点,论文之间的引证关系为联系,可构成引文网络。但计量学自身并没有诞生出研究这类关系数据的较有影响力的量化方法。直到本世纪初,由于复杂网络研究的带动等原因,社会网络分析成为社会科学的一时显学 ,并引起了计量学界关注。Leydesdorff 于2007年指出,运用社会网络方法,可根据期刊在引文网络中所处位置的重要程度来评判期刊的学术地位。网络位置的重要程度可用中心性指标评判 ,我们的一项工作 表明中心性指标中的点度、中介和特征向量中心度用于期刊测评时的有效性较佳,其测评结果都比影响因子更接近同行专家的意见。 引文并不仅是定量数值。引证行为本身也包含了施引学者对于被引论文的定性价值判断,涉及 各种情景构建下的社会性因素 ,故描述期刊在引证关系结构中地位的中心度则可能有更多定性特征,颇具特点。 3.期刊SJR指数:基于Scopus数据库的的期刊声望判定 Elsevier公司的Scopus数据库是Thomson Reuters公司的Web of Science(WOS,包含大名鼎鼎的SCI和SSCI等)目前最主要竞争对手,但Scopus此前一直缺乏类似于Thomson Reuters公司期刊引证报告(JCR,提供了影响因子等著名指标)这样较有影响力的期刊测评工具。直到2007年,西班牙的SCImago研究小组使用Scopus数据给出了新型期刊测评指标SCImago Journal Rank(SJR) ,引起广泛关注,Butler 指出这一指标颇具创新的衡量了期刊的声望。我们 的实证显示,SJR与影响因子的测评结果既有相关性,也有所区别,可与影响因子联合判定出期刊在流行与声望两个维度上的特点。SJR的计算思想与前述期刊中心度中的特征向量中心度相似,但具体算法 有所区别 。SJR的出现为国际期刊测评提供了新的参考标准,并免费提供下载,或能对Thomson Reuters公司在这一领域垄断形成潜在的威胁。 4.期刊特征因子:基于WOS数据库的期刊被引数量及引文价值的综合测评 Garfield提出IF后后不久,Pinski等人 就指出可采用论文被引次数作为权,计算每条引文的权重。但此思想在当时技术条件下实践难度较大。随着计算机性能的提高,二十世纪末,Google公司创始人Brin和Page 参考加权被引思想,提出了PageRank算法进行网页测评和排序,取得巨大成功。2007年,Bergstrom等人 使用类PageRank算法构建了Eigenfactor这一新的期刊引文测评方法,将Pinski等人的理论成功实现。科学网博主 任胜利老师 提出其中文名可命为特征因子。2009年初,Thomson Reuters公司正式采用特征因子作为JCR的指标,标志着这一参数开始进入主流应用。 特征因子将期刊引文测评方法的理论假设从“所有引文重要性等价”修正为“引文重要性正比于施引期刊重要性”,这比传统引文测评中仅依据被引次数似乎更为合理。特征因子作为一个总量性指标 ,思想与特征向量中心度和SJR都有所相似,而特征因子的具体实现更接近PageRank算法。 5.讨论 虽然四种新型期刊引文测评方法有所差异,但期刊中心度中的特征向量中心度、SJR和特征因子,都是对期刊进行影响力加权计算的方法,都以不同方式和程度上的体现了“重要期刊的引用更有价值或影响力”这一观点,这也是其与传统引文测评本质的差别之一。另外,h型指数和中心度的计算可由测评者控制,更为灵活但缺乏统一标准;SJR和特征因子由测评机构公布,更为规范但难以验证。期刊中心度的一个有趣之处在于,当把数据限定为某一学科范围时,是一种局域视角的研究领域“小同行”引用认同模式,可能更为专业和准确,并能减少学科差异的影响;而当把数据范围扩大为全部学科时,中心度方法又成为全局视角的测评,其中的特征向量中心度与SJR和特征因子较为相似。 当然,这些新型参数也都必然存有不足之处。h型指数的计算仅涉及相对高被引的论文,但相对低被引论文是否全无价值?期刊的中心度和特征因子都会受到期刊规模(即载文量)的影响,是否应该进行基于载文量的平均化处理值得讨论。但平均化的处理方式也可能 夸大载文量较少的综述类期刊的影响力 。另外,缘于引文分析的固有局限,新参数也未必能全面克服IF所面临的问题。 总之,试图依靠某一量化指标解决期刊测评这一复杂问题目前似无可能,单一的新型期刊测评方法仅能从某一方面逼近实际却无法面面俱到。期刊评价还是需要观测多种方法的结果,也期待科学界一同努力探索。 顺道提及,发明h指数的Hirsch是物理学家,给出特征因子的Bergstrom之前一直从事生命科学研究。 参考文献: 赵星 . 期刊引文测评新指标 Eigenfacto 的特性研究——基于我国期刊的实证 . 情报理论与实践 ,2009, 32(8):53-56. Harnad S.Multiple metrics required to measure research performance.Nature,2009,457(7231):785 赵星 , 高小强 , 郭吉安 , 陶乃航 . 基于主题词频和 g 指数的研究热点分析方法 . 图书情报工作 ,2009, 53(2):31-34. Hirsch J.An index to quantify an individual’s scientific research output.PNAS,2005,102(46):16569- 16572 Braun T,Glnzel W, Schubert A. A Hirsch-type index for journals. Scientometrics, 2006,69(1):169-173 叶鹰 .h 指数和类 h 指数的机理分析与实证研究导引 . 大学图书馆学报 ,2007(5):2-5 Egghe L.Theory and practise of the g-index.Scientometrics,2006,69(1):131-152 Jin B, Liang L, Rousseau R, et al. The R- and AR-indices: Complementing the h-index . Chinese Science Bulletin. 2007, 52(6): 855-863 Price J. Networks of Scientific Papers.Science,1965,149: 510-515 Borgatti SP, Mehra A, Brass DJ, et al. Network Analysis in the Social Sciences . Science,2009, 323(5916): 892-895 Leydesdorff L.Visualization of the citation impact environments of scientific journals: An online mapping exercise.JASIST,2007,58(1):25-38 Scott J. Social Network Analysis: A Handbook. London: Sage Publications,2000 高小强 , 赵星 , 陶乃航 . 网络中心度用于期刊引文测评的有效性研究 . 大学图书馆学报 ,2009,5:61-65. SCImago. www.scimagojr.com Butler D.Free journal-ranking tool enters citation market.Nature,2008,451(7174):6 赵星 , 高小强 , 唐宇 . SJR 与影响因子、 h 指数的比较及 SJR 的扩展设想 . 大学图书馆学报 ,2009,2: 80-84. Pinski G, Narin F. Citation influence for journal aggregates of scientific publications: Theory, with application to the literature of physics. Information Processing and Management,1976,12(5):297-312 Brin S, Page L,Motwami R et al. The PageRank Citation Ranking: Bringing Order to the Web. Stanford Digital Libraries Working Paper,1998,6:102-107 Eigenfactor. www.eigenfactor.org 任胜利 . 特征因子 (Eigenfactor): 基于引证网络分析期刊和论文的重要性 . 中国科技期刊研究 ,2009, 20(3):415-418 注: ( 1 )本文四种方法的一项小型实证研究请见:马丽 , 赵星 , 彭晓东 . 新型期刊引文评价方法比较研究 . 情报理论与实践 ,2010,5(33):71-75. ( 2 )此外, 5 年期影响因子亦是一种新进入实用的参数。详见:赵星 . JCR5 年期影响因子探析 . 中国图书馆学报 ,2010,36(187):116-123.
个人分类: 学术期刊|14672 次阅读|13 个评论
[转载]citespace初学者案例
smilesun 2010-12-8 16:51
转自陈超美老师的博客 初学者案例 本例读者对象:从来没有用过CiteSpace的初学者。 数据用的是CiteSpace本身附带的Terrorism的数据。本例主要侧重于主要几个步骤和功能。 目标是用最少的几步做出第一个跨时间的文献共被引网络。 参数选取,解读,和其他用法将在今后的案例中给出。 PDF文件大约3MB。 如有问题,建议等,可在此留言。 案例1 原文地址: http://www.sciencenet.cn/m/user_content.aspx?id=391534
个人分类: 科学研究|6028 次阅读|0 个评论
引文分析存在的问题引发的反思——文献计量是不是走偏了?
yngcan 2010-12-8 12:20
近日,读到 JASIS ( 2010 年第一期的第一篇文章) Problems of Citation Analysis: A Study of Uncited and Seldom-Cited Influences ,对我的启发十分大,开始彻底颠覆我并不牢固的情报学基础认识,因此,我把我及时的感受写出来与大家分享,希望能够得到科学网前辈们的指点。 作者: M.H. MacRoberts and B.R. MacRoberts 全文: Problems of Citation Analysis: A Study of Uncited and Seldom-Cited Influences Problems of Citation Analysis: A Study of Uncited (论文下载仅作为学术用途) 一、 读文感受 文章提到了 引文分析的基础 : Cole and Cole (1972) found that highly cited physics papers also cited highly cited papers, and so on. If we did not know that biogeographic papers cited very few of their influences, we might come to the same conclusion as the Coles: that only a small number of individuals contribute to scientific progress. But knowing that the vast majority of influence is not cited and that influence is not to be found in the Thomson Reuters-monitored journals leads to a different conclusion: that manynot a fewcontribute to scientific progress. Cole 在 1972 年发现 高被引的物理学论文同样也会应用高被引论文等等 如果我们不了解生物地理学论文引用很少的对文章产生巨大影响的文献,我们可能得出与 Cole 相同的结论:仅有少数的个体对于科学的进步是有贡献的。但是,如果我们知道大量有影响的内容不会被 SCI 所引证,也许会导致一个不同的结论:是许多个体 而不仅仅是少数人 对于科学的进展有贡献。 (一) 举了两个例子: 1. The latitudinal gradient of species-area relationships for vascular plants of North America. published in 2007 in American Naturalist 一文中引证了 A total of 1,742 floras of North America north of Mexico ( 1742 种植物群),而这些植物群的资料范围覆盖了政府文献、论文、未出版的报告、网页内容、短评以及 2000 多页的参考资料。这部分内容也被提及,出现在 Appendix A ,然而该论文仅引用了 85 篇文献,而这些被引文献仅仅是 SCI 文献,这些文献主要是用于解释物种的多样性的文章。 2. 作者本人发表了一篇 2 页的短文 Palhinhaea cernua (L.) Vasconcellos Franco (Lycopodiaceae) new to Texasin Phytologia ,该期刊不是 SCI 论文。这篇文章通过 SCI EXPANDED 和 GOOGLE SCHOLAR 检索均发现没有任何引证,然而,这篇文章确被整合进了德州和北美的植物地理文献中,该信息被广泛的应用;另外, USDA 植物数据库以及自然服务( NATURESERVE )数据库都将该文章的研究纳入进去。换言之,该论文即被印刷版也被电子版的出版物所引用,这篇文章的研究目的已经达到了。 上面两个例子证明了,被引文献仅仅只能代表有影响文献资料的一个片段。 (二) 作者同样做了一个小的定量实证:(哈哈!虽然作者认为定量分析并不是一种包打天下的方法) We selected 10 theoretical/analytical biogeographical articles that were published in journals that are monitored by Thomson Reuters and examined their bibliographies. These 10 articles are from the 22 described in this study. We recorded whether the cited item was (a) a article from a journal not monitored by Thomson Reuters, (b) an article from a Thomson Reuters-monitored journal, (c) a book or chapter in a book, (d) an unpublished report, (e) a thesis or dissertation, or (f) an online Web source or CD-ROM. There were 530 citations in these 10 articles. We selected five data articles or sources used for data in the 22 theoretical/analytical articles, such as those listed in McLaughlin (2007). We recorded the same information that we recorded for the other sample. We stopped when we reached 530 items so that the two samples would be equal. Table 1 shows the data for the two groups. Statistical comparison of the two groups shows that there is no possibility of them being derived from the same population. Theoretical/analytical biogeographical articles predominantly cite theoretical/analytical articles from Thomson Reuters-monitored journals; data articles do not cite many Thomson Reuters-monitored articles but instead cite work from journals not monitored by Thomson Reuters, unpublished reports, theses/dissertations, and the grey literature. 对于两个群体的统计比较显示:理论或者分析类的植物地理文献主要引用了 SCI 的理论和分析文献;而数据类型的文献则没有引用太多的 SCI 文献,相反,他们主要引用的是非 SCI 文献、未发表的报告、研究论文,或者是灰色文献。 er二、反思 这篇文献对我的震撼是极大的。 主要有二点: (一) 以引文为基础的方法是不是对于所有学科的评价都有价值,是值得反思的。其实,自然科学中,除了植物地理学以外,很多学科的研究都包含了对于原始数据和基础理论分析的研究,而我们现在评价体系的一个重要指标 引文则是对于数据研究这部分内容的价值忽略了的。 (二) 文献计量学中 Cole 的理论:仅有少数的个体对于科学的进步是有贡献的 或者还应该包括 洛特卡定律 这些理论都从 分析方法(仅仅考虑第一作者) + 分析框架(仅仅展示核心作者) + 分析目的(评价作者贡献) 是出于一种狭隘、自私的学术观点。但是,如果我们反思 真的是只有小部分人对于科学的进步有贡献吗? 真的是一将功成万骨枯吗? 。这是我们图书情报学界急需要考虑的问题。 中国的情报学目前还从创作过自己有价值的理论,但研究中确充斥着各式各样标榜自己学术地位的所谓学科知识地图,这有时是一种讽刺。
个人分类: 专利|5101 次阅读|0 个评论
知识图谱报告-周宁丽citespace的报告ppt及录像
热度 1 smilesun 2010-12-5 23:14
11月25日邀请周宁丽老师给我班上的同学上了一次课,介绍citespace,感兴趣的朋友可以下载ppt和上课的视频录像学习。 下载地址: 第十一讲 周宁丽老师11月25日讲座的PPT和视频录像 http://biotech.ustc.edu.cn/upload/RMRA/2010/citespace20101125.wmv http://biotech.ustc.edu.cn/upload/RMRA/2010/citespace操作.wmv http://biotech.ustc.edu.cn/upload/RMRA/2010/citespace1125.ppt 《文献管理与信息分析》其它课件可以从下面的地址下载 http://biotech.ustc.edu.cn/forum/viewthread.php?tid=6479amp;page=1
个人分类: 文献管理与信息分析|9611 次阅读|2 个评论
周宁丽研究馆员报告:知识图谱
热度 1 smilesun 2010-11-24 20:33
周老师今天在科大做了一场知识图谱的报告,介绍了引文分析理论和citespace的用法等。 PPT下载地址如下: http://biotech.ustc.edu.cn/upload/RMRA/2010/zhouningli.ppt 明天还将邀请周老师给《文献管理与信息分析》西区班的同学上一次类似的课,届时应该会有视频录像。 欢迎关注。 明天上课时间是:6:15pM,西区3124教室。
个人分类: 文献管理与信息分析|6602 次阅读|2 个评论
引文分析软件histcite简介
热度 15 smilesun 2010-11-13 15:57
本文写于多年之前。附上能个近期学生写的补充,以及改进版的小程序。 https://zhuanlan.zhihu.com/p/20902898 这是上学期选修我课程的王庆撰写文件,并改写了一下程序,导入更加方便。 附王庆改写的程序下载链接: http://pan.baidu.com/s/1hsIwJzQ#list/path=%2F 官方网站的下载链接: http://science.thomsonreuters.com/scientific/m/HistCiteInstaller.msi http://ztever.com/histcite-manu/ 快速进入陌生领域:HistCite使用教程 来自 杨蔚的博客。 我在网易云课堂的视频教程: http://study.163.com/course/introduction/1373003.htm#/courseDetail 2016年12月06日 ========================================================================================= 这是《文献管理与信息分分析》课程内容的一部分。 对于科研工作者来说,除了掌握快速的收集信息和有效管理信息的能力之外,还需要有一定的信息分析能力。譬如,检索某个研究方向,结果文献有上千篇,此时我们该如何对待这些文献?精炼检索条件很可能会导致有价值的文献被排除在外。在交叉科学盛行的今天,如果想了解其它领域的进展情况,由于缺乏相应的专业知识,如何判断哪些文献是有重要参考价值的文献?这些问题的解决都需要我们具备一定的文献信息分析能力。 有人说,在WOS里按照引用次数排序,引用次数最多的必定参加价值更大,其实不然,后面会有解释。 我所知的文献信息分析软件有基于引文的分析软件histcite,基于内容分析的refviz、omniviz、Tda等,还有分析研究前沿的citespace等。 这里先简要介绍一下引文分析软件histcite它的功能和用法。 histcite=history of cite,意味引文历史,或者叫引文图谱分析软件。该软件系sci的发明人加菲尔德开发,能够用图示的方式展示某一领域不同文献之间的关系。可以快速帮助我们绘制出一个领域的发展历史,定位出该领域的重要文献,以及最新的重要文献。 软件的最新试用版本可以从 http://science.thomsonreuters.com/scientific/m/HistCiteInstaller.msi 网站下载到。 软件的试用非常简单,但如何从软件给出的图谱中得出有价值的信息,以及不同图谱展示的内在含义,需要我们不断揣摩和理解。 下面先介绍一下如何使用软件;然后介绍一下软件里涉及的一些概念;最后给出几个个示例。 一、软件使用 1、从histcite网站下载软件,安装之后,点击histcite图标即可开启软件;软件打开后的窗口类似IE的界面; 2、数据的获取;histcite目前用于分析的文献信息只能来源于web of science数据库;在wos 数据库进行检索后,在页面的底端选择需要导出的数据记录,由于wos目前只支持每次导出500条记录,如果检索结果超过500条需要分多次导出。选择导出的文献记录之后,第二步,一定要选择输出全记录,并且要包含引文信息;第三步将需要的文献保存成文本文件。一般来说,如果文献记录少于500条,分析的意义不是很大。合适的数据量个人认为在几百到几千条记录之间比较合适。 3、从file菜单下点击add file,导入上述保存的数据;如果有多个文本文件,可以重复执行导入; 4、数据导入后,软件会自动进行分析。初学者可以不去追究各种按钮的含义。在tool菜单下,选择graph maker,然后在新的界面点击左上角的make graph 按钮。软件会根据默认的条件作出一张引文关系图来,来展示当前数据库中重要文献之间的关联。 5、读图 作出图之后,理解图谱才是关键。一般默认会画出30篇文献之间的关联。图上有30个圆圈,每个圆圈表示一片文献,中间有个数字,是这篇文献在数据库中的需要。圆圈的大小表示引用次数的多少,圆圈越大表示受关注越多。不同圆圈之间有箭头相连,箭头表示文献之间的引用关系。多数情况下,你会看到最上面有一个圆圈较大,并有很多箭头指向这篇文章。那么这篇文章很可能就是这个领域的开山之作。 以上就是软件的简单使用过程。 二、软件功能和基本概念 将数据导入到软件之后,文献会自动排列在软件的主界面。文献的排序方式可以按日期,可以按杂志或按作者进行排序。 文献记录的上方还有一些蓝色字体的按钮。这些词都是可以点击的,并进行相应分析。如点击authors,软件会列出所有作者,并将每位作者的文献数、引用次数等信息列出来。这些命令较容易理解,不多做介绍。 在默认窗口的有侧,有LCS、GCS、LCR、CR。下面分别解释一下这几个功能。 GCS是global citation score,即引用次数,也就是你咋web of science网站上看到的引用次数。如果你点击gcs,软件会按照GCS进行排序,此时的结果与你在wos网站按被引频次排序的结果是一样的。 CR是cited references,即文章引用的参考文献数量。如果某篇文献引用了50篇参考文献,则CR为50。这个数据通常能帮我们初步判断一下某篇文献是一般论文还是综述。 LCS和LCR是histcite里比较重要的两个参数。 LCS是local citation score的简写,即本地引用次数。与gcs相对应,gcs是总被引次数。lcs是某篇文章在当前数据库中被应用的次数。所以LCS一定是小于或等于GCS的。 一篇文章GCS很高,说明被全球科学家关注较多。但是如果一篇GCS很高,而LCS很小,说明这种关注主要来自与你不是同一领域的科学家。此时,这篇文献对你的参考意义可能不大。举个离子,2003年发表在nature上的两篇文章P1 (GCS:580,LCS:12) 和 P2(GCS:36,LCS:24)。第一篇文章gcs很高,lcs很低,说明关注这篇文章的绝大部分作者与你关注的方向不同。而第二篇文章经gcs较低,但LCS比第一批要高,即很多引用p2的文章都在当前数据库,也即与你的研究方向相关。所以,p1 p2相比,p2应该更贴近你的研究方向,参考价值更大。 在第一部分的介绍中,make graph时,默认是按LCS排序的,也可以选择按gcs排序。你可以比较一下这两者的差异,一般LCS作图,得到的关联较丰富,而gcs作图往往文献之间没什么关联。这就回答了上面开始提出的一个问题,为什么按引用频次排序往往不是很有参考价值的原因。 LCR与CR对应是local cited references,是指某篇文献引用的所有文献中,有多少篇文献在当前数据库中。如果最近有两篇文章,p1 p2,都引用了30篇参考文献,其中p1引用的30篇文献中有20篇在当前数据库,p2只有2篇文献在当前数据库。此时,p1相对更有参考价值,因为它引用了大量和你的研究相关的文献。 根据LCS可以快速定位一个领域的经典文献, LCR可以快速找出最新的文献中哪些是和自己研究方向最相关的文章。 注;引文有些不规范导致引文分析结果偏差,这里暂不做讨论。感兴趣的朋友可以参考引文相关的理论文献或书籍。 三、部分结果示例 这里选择了一个我上课的例子,和学生作业中的例子。更多示例请大家参考中科大生命科学实验中心论坛上学生提交的作业。http;//biotech.ustc.edu.cn/forum 第一个例子是关于合成生物学(synthetic biololgy),2000年之后发展起来的、并在近年广受关注的学科。在wos里以synthetic biology进行检索,2009年10月30日可以获得2297篇参考文献。下载后导入hiscite,按lCS作图;结果如下: 从第一个图可以看出704这篇文献应该是一片开创性的工作,或是一篇重要的综述。后面的1077 1134 1089这三个圆圈较大,说明这几篇文献受到广泛关注,具有较重要的地位。 图2就是相同的数据库按GCS做图得到的结果,可以看到这些文献之间没什么关联。所以在wos中,按引用频次排序,即使排在前面的文献对您也未必有多大参考价值。 图3是学生提交的作业,原作者的分析附后,基本上是正确的。 (学生作业中对上图的解释:在web of science上检索主题包含G-quadruplex和detection的文章,一共108篇,用histcite作图,该图表明有关将G-quadruplex 应用 于各种检测的 研究 工作主要从05年Nagatoishi S;发表在德国应化和He F发表在JACS上的 全文 开始,逐渐有大量的文章发表,而前述两篇文章的LCS是最高的,其可读性也是非常大,从09年的数据来看,对同年发表的文章的引用次数大大增加,表明该领域在09年的发展迅速。从CR的分析来说,编号为64,55,和1的几篇文章引用 文献 的数量非常大,应该是综述性文章,对初涉此领域的人也有较大的可读性。) LCR分析结果 可以看出,排在前10位的都是近期非常具有参考价值的文献。 # Date / Author / Journal LCS GCS LCR CR 1 2009 Agapakis CM , Silver PA Synthetic biology: exploring and exploiting genetic modularity through the design of novel biological networks MOLECULAR BIOSYSTEMS . 2009 ; 5 (7): 704-713 0 0 29 103 2 2179 Purnick PEM , Weiss R The second wave of synthetic biology: from modules to systems NATURE REVIEWS MOLECULAR CELL BIOLOGY . 2009 JUN; 10 (6): 410-422 1 3 29 126 3 2284 Weber W , Fussenegger M The impact of synthetic biology on drug discovery DRUG DISCOVERY TODAY . 2009 OCT; 14 (19-20): 956-963 0 0 27 72 4 1699 O'Malley MA , Powell A , Davies JF , Calvert J Knowledge -making distinctions in synthetic biology BIOESSAYS . 2008 JAN; 30 (1): 57-65 5 6 21 78 5 1969 Leonard E , Nielsen D , Solomon K , Prather KJ Engineering microbes with synthetic biology frameworks TRENDS IN BIOTECHNOLOGY . 2008 DEC; 26 (12): 674-681 1 2 21 81 6 2165 Picataggio S Potential impact of synthetic biology on the development of microbial systems for the production of renewable fuels and chemicals CURRENT OPINION IN BIOTECHNOLOGY . 2009 JUN; 20 (3): 325-329 0 0 21 60 7 1451 Drubin DA , Way JC , Silver PA Designing biological systems GENES DEVELOPMENT . 2007 FEB 1; 21 (3): 242-254 20 32 20 107 8 2008 Tanouchi Y , Pai A , You LC Decoding biological principles using gene circuits MOLECULAR BIOSYSTEMS . 2009 ; 5 (7): 695-703 0 2 17 78 9 2184 Bhalerao KD Synthetic gene networks: the next wave in biotechnology ? TRENDS IN BIOTECHNOLOGY . 2009 JUN; 27 (6): 368-374 0 1 16 66 10 2132 Deplazes A Piecing together a puzzle An exposition of synthetic biology EMBO REPORTS . 2009 MAY; 10 (5): 428-432 0 0 15 38 结语; 文献信息分析只是为我们提供了不同的视角去了解别人的工作,让我们能够更快的找到最有价值的信息,但任何分析都不能代替我们阅读文献。 如果你想了解更详细的软件使用方法,可以下载《文献管理与信息分析》课程中相应的教学录像。也可以关注我后续将推出的软件教程。
个人分类: 文献管理与信息分析|188095 次阅读|25 个评论
[转载]E. GarfieldIs citation analysis a legitimate evaluation too
热度 1 chunlinj7873 2010-11-8 17:05
A comprehensive discussion on the use of citation analysis to rate scientific performance and the controversy surrounding it. The general adverse criticism that citation counts include an excessive number of negative citations (citations to incorrect results worthy of attack), self-citations (citations to the works of the citing authors), and citations to methodological papers is analyzed. Included are a discussion of measurement problems such as counting citations for multiauthored papers, distinguishing between more than one person with the same last name (homographs), and what it is that citation analysis actually measures. It is concluded that as the scientific enterprise becomes larger and more complex, and its role in society more critical, it will become more difficult, expensive and necessary to evaluate and identify the largest contributors. When properly used, citation analysis can introduce a useful measure of objectivity into the evaluation process at relatively low financial cost.
个人分类: 未分类|2789 次阅读|0 个评论
《湖泊科学》10大高被引论文分析
李万春 2010-11-3 14:21
《湖泊科学》 10 大高被引论文分析 这是来自 CNKI 的统计数据, 1989-2008 年《湖泊科学》创刊 20 年,期间统计的结果。由于这些论文都是我工作以后经手发表的,所以过程比较熟悉。今天读到 武夷山研究员的博文,再介绍一篇关于审稿的研究论文 ,武老师感觉到,高被引与论文质量几乎没有关系,索性我借机把这 10 大论文初步分析了一下,顺便也佐证一下,哪些论文会被高引用?当然,《湖泊科学》是小刊,样本代表性可能不够。 1 )好文 + 热点: , , 都是同一个主题,系作者博士论文的精华。人工湿地现在很热,相应的工程比比皆是,但是对于其中的科学问题、研究和究竟应该关注什么,却是非常欠缺的。作者现在已经是知名学者,这些论文算是开创国内人工湿地研究先河的倡导性论文吧,当时的审稿意见都不错,这 3 篇算是好文 + 热点。 2 )好文: , 是相应领域底泥污染国内最早发表的先驱性论文,现在对于底泥释放的研究已经铺天盖地,这 2 篇是经典文献,引用多,一点都不奇怪。 3 )名人:来自大教授的手笔,当初审稿时候尽管有一些争议,但是在主编的力排众议下还是以最快的速度发表了(施主编当时教诲的原则是:第一作者是知名教授的论文,只要不违反法律,有争议就让作者自己负责吧!)。 , 就是这样的论文,名人效应还是很明显,加上又是综述性论文,引用次数多,也不奇怪。 4 )综述:综述被引用次数往往会多,这似乎是定律, , , , 都是综述,其中 , 还出自名家之手。但是, , 作者发文当时不过是刚毕业的博士生,说明作者是不是名人与引用次数关系不大,只要写得好的,涉及的是大家感兴趣的话题,引用就可能会多。 5 )争议热点: 涉及的是争议话题,执笔者是名家,代表一种观点,当年审稿时候遭遇颇周折,主要是因为作者文笔和逻辑性有些欠缺,全文感觉有些零乱。后来以学术争鸣栏目形式发表,反响极好。 6 )热点区域: 进入 10 大论文非常出乎我的意料。这是一篇来自政府机关的在职博士人员撰写的,论文审稿时候颇费周折,一方面作者科技论文写作训练不够,公文写作思维总是无处不在;另一方面,对于数据的可靠性,审稿人总是抓住不放,非要作者给个说法。其实,关于面源污染的统计,直到现在都是一笔糊涂账,这篇文章在当时的条件下,相对合理的对太湖地区的面源进行了估算,方法本身和参数选取都基本合理;而关于太湖地区的面源问题,直到现在,依然没有更好的替代数据,这篇文章算是一篇划时代的热点区域论文吧。 附: 1989-2008 年《湖泊科学》 10 大高被引论文: 人工湿地植物研究 . 湖泊科学 ,2002,14(2):179-184. 长江中下游浅水湖泊富营养化发生机制与控制途径初探 . 湖泊科学 ,2002,14(3):193-202. 底泥疏浚能控制湖泊富营养化吗 ? 湖泊科学 ,2000,12(3):269-279. 香蒲、灯心草人工湿地的研究──Ⅰ . 净化污水的效果 . 湖泊科学 ,1997,9(4):351-358. 健康水生态系统的退化及其修复理论、技术及应用 . 湖泊科学 ,2001,13(3):193-203. 湖泊藻型富营养化控制技术、理论及应用 . 湖泊科学 ,2002,14(3):273-282. 环境因子对五里湖沉积物磷释放的影响 . 湖泊科学 ,1994,6(3):240-244. 太湖底泥及其间隙水中氮磷垂直分布及相互关系分析 . 湖泊科学 , 2000,12(4):359-366. 香蒲、灯心草人工湿地的研究──Ⅱ . 净化污水的空间 . 湖泊科学 , 1998,10(1):62-66. 江苏太湖地区水污染物及其向水体的排放量 . 湖泊科学 ,2000,12(2):147-153. ( http://www.jlakes.org/download/topcited20.htm )
个人分类: 生活点滴|5334 次阅读|4 个评论
2009年SCI影响因子及JCR新意初探
zhaoxing 2010-6-18 11:48
2009年期刊影响因子已于今日凌晨公布,若有权限,可查询: http://admin-apps.isiknowledge.com/JCR/JCR?SID=T12Ij35goO4cNHh9geN (谢谢 薛名山 老师提供的链接) 经初步考察,09年JCR中并未增加新的指标。JCR最新一次指标更新是09年1月,当时增加了 特征因子 和 5年期影响因子 等。 09年最大的变化之一是 增加了自引分析功能 ( Journal Self Cites )( 新增补充说明 ),提供的具体数据格式如下: Self Cites 4278 (0% of 483039) Self Cites to Years Used in Impact Factor Calculation 1088 (1% of 59996) Impact Factor without Self Cites 33.855 这是《Nature》的数据,一看便知人家牛刊是不玩故意自引的。 这一新功能将给今后的自引分析和研究带来很大的便利。 09年JCR中的另一重要变化是 增加了861种期刊 ,这无可避免的要总体上增加影响因子绝对值了。 --------------------------------------------------------------------------------- 补充说明: 感谢东北师范大学图书馆 王春蕾 老师来信提示。经查, 上文中JCR自引分析功能是09版JCR更新这一说法并不准确 ,此功能是Thomson于2009年即提供,并至少回溯到了2000版的数据。深感歉意,特此说明。 ------------------------------------------------------ JCR自引分析功能的使用方法请见下图
个人分类: 学术期刊|16975 次阅读|5 个评论
引文分析小软件——Publish or Perish
slyang2005 2010-5-26 12:11
Publish or Perish,在美国七十年代初期兴起,并在国际上流行,意思是(论文)不发表就会被埋没,发表还是灭亡,发表或消亡。 Harzing, A.W把自己设计的一款检索和分析学术引文的免费小软件叫做Publish or Perish( http://www.harzing.com/pop.htm )。目前有上百个博客和图书馆网站、还有报纸和杂志对其进行了报导;也有多篇论文以该软件作为数据收集和分析的工具。在宣称这个软件具有的评价个人或机构学术影响力的同时,作者也总结了应用局限。 软件的主要特色有三:一是 软件相当小巧,也十分简单易操作,仅有384K,有Windows和Linux多个版本。 它使用的原始引文数据来自于Google Scholar,适合进行网络引文的分析。作者在其博客中提到,希望看到软件结果与WoS分析出的结果的比较研究,这可能是对传统引文与网络引文对比研究的好题材。 软件可以得出多个最新的引文分析评价指标,如Total number of papers 、Total number of citations 、Average number of citations per paper 、Average number of citations per author、Average number of papers per author 、Average number of citations per year 、Hirsch's h-index and related parameters 、Egghe's g-index 、The contemporary h-index 、The age-weighted citation rate 、Two variations of individual h-indices 、An analysis of the number of authors per paper.
个人分类: 未分类|14110 次阅读|2 个评论
JCR五年期影响因子探析
zhaoxing 2010-5-24 01:50
Garfield提出的期刊影响因子大概是过去二十年影响最为深远的科学定量测评指标,其计算方法为:用某刊前n年发表论文在统计当年的总被引次数除以该刊前n年刊载论文数量。可见,总被引次数、刊载论文数量和论文及引文统计期(n年)是决定影响因子的三个关键参数,总被引次数和刊载论文数量是期刊自身属性,论文及引文统计期则是指标设计者设定。 长期以来,Thomson Reuters公司在期刊引证报告(Journal Citation Reports,JCR)中公布的影响因子(Impact Factor,IF)一直采用2年为论文及引文统计期,但也备受争议 。任胜利、王宝庆和郭志明等人 指出,2年统计期使IF在出版周期不同的刊物和引证行为各异的学科间的可比性受到制约。Archambault和Lariviere 也认为,以2年为统计期缺乏依据,时间跨度太短,导致IF不能合理的测度一些学科的期刊论文影响力。Glnzel和Moed 的研究显示,当统计期较短时,期刊《The Lancet》的平均引用大于《American Sociological Review》,当统计期较长时,情况则相反。Della Sala和Crawford 针对神经心理学期刊的案例分析发现,5年的统计期更适合此领域的期刊影响因子评价。 另一方面,ISI在期刊评价上的垄断地位正受到有力挑战。2005年,美国物理学家Hirsch 提出了h指数这一测评高被引论文数量及其被引强度的评价指标。匈牙利科学计量学家Braun 将h指数推广到期刊评价,引起了广泛关注。而作为Thomson Reuters Web of Science(WOS)系统的最主要竞争对手,Elsevier公司则不断强化Scopus数据库的评价功能。在其数据支持下,西班牙SCImago小组研制了基于Scopus的新型期刊评价指标SCImago Journal Rank(SJR),颇具新意和特点 ,Butler 认为SJR的出现将可能打破ISI在期刊评价上的垄断。 或许是迫于学界争议和市场竞争的双重压力,Thomson Reuters于2009年初发布了新版JCR,增加了包括5年期影响因子(5-Year Impact Factor,IF5)在内的新评价指标。IF5的计算方法是:用某刊前5年发表论文在统计当年的总被引次数除以该刊前5年刊载论文数量。IF5的公布有望解决IF不能较好衡量被引高峰出现较晚的期刊论文学术影响力的问题,Della Sala和Grafman 立刻发表评论文章对此表示欢迎,Jacso 则针对图书馆学和情报学被JCR收录期刊的IF5进行了定性讨论,认为IF5是IF的有益补充。 附件文章尝试以2008年JCR科学版6015种期刊数据为样本,探索性分析IF5的性质,并注重与IF进行比较讨论。 结果显示,作为能衡量期刊论文较长期影响力,具有代表性的平均性期刊评价指标,IF5更好反映了大部分期刊的被引高峰,符合布拉德福分布。IF5与IF即有较强排序相关,也有显著的统计学差异。IF5和IF的测评结果在少数较好和较差的期刊上较为一致,但在多数水平居中的期刊上存在区别。另外,给出IFa指数用于测度两种影响因子的差别,给出IFb指数用于综合两种影响因子的评价信息。 文章对于实践的可能启示在于,应注意IF5不仅是IF的重要补充,对于引文高峰到来较晚学科的期刊,IF5的测评或更具合理性;IF5的总体分布并非正态分布,今后的实证研究应注意数据变换或采用非参数统计学方法,IF5的布拉德福分布则提供了一种新的期刊分区方法选择;对中等影响力水平期刊进行测评时,IF5和IF的差异值得关注;IFa指数和IFb指数可作为今后期刊影响力评价的新方法。 此外,关于IF5仍有很多问题值得探讨。例如,5年是否最佳统计期?目前缺乏全面系统的实证;IF5的评价有效性如何?可用同行评议结果进行验证;不同学科的IF5有怎样的差别?尚需更多细化分析;引文时间分布对两种影响因子有何不同影响?可采用半衰期等相关属性进行深入的分学科探索。 研究过程中曾得到科学网博主 任胜利先生 和 贺天伟先生 的帮助和指点,特此致谢。当然,文责和错误自负。 文章信息:赵星.JCR五年期影响因子探析.中国图书馆学报,2010,36(187):116-123. 全文下载: JCR五年期影响因子探析 参考文献: 任胜利 , 王宝庆 , 郭志明等 . 应慎重使用期刊的影响因子评价科研成果 . 科学通报 ,2000,45(2):218-222. Archambault E, Lariviere V. History of the journal impact factor: Contingencies and consequences . Scientometrics,2009,79(3): 635-649. Della Sala S, Crawford JR. Impact factor as we know it handicaps neuropsychology and neuropsychologists . Cortex, 2006,42(1):1-2. Glanzel W, Moed HF. Journal impact measures in bibliometric research . Scientometrics,2002,53(2): 171-193. Hirsch J.An index to quantify an individuals scientific research output .PNAS,2005,102(46):16569-16572. Braun T, Glnzel W, Schubert A. A Hirsch-type index for journals .Scientometrics,2006,69(1): 169-173. 赵星 , 高小强 , 唐宇 . SJR 与影响因子、 h 指数的比较及 SJR 的扩展设想 . 大学图书馆学报 ,2009,2:80-84. Butler D.Free journal-ranking tool enters citation market .Nature,2008,451(7174):6. Della Sala S, Grafman J. Five-year impact factor . Cortex,2009,45(8):911. Jacso P. Five-year impact factor data in the Journal Citation Reports . Online information review,2009, 33(3):603-614. 任胜利 . 特征因子 (Eigenfactor): 基于引证网络分析期刊和论文的重要性 . 中国科技期刊研究 ,2009, 20(3):415-418. 赵星 . 期刊引文评价新指标 Eigenfactor 的特性研究 基于我国期刊的实证 . 情报理论与实践 ,2009, 32(8):53-56.
个人分类: 学术期刊|23569 次阅读|11 个评论
引文分析软件HistCite视频教程
热度 4 smilesun 2010-5-20 21:47
今晚是《文献管理与信息分析》课的第十二讲,我给大家介绍了基于引文分析的软件HistCite。 这个软件上手很容易,分析的结果也很有价值,能够快速帮你找出重要的文献,大家可以了解一下。 第十二讲 文献信息分析之一-基于引文分析的histcite介绍 下面包含PPT和录像,PPT实际上只有前面介绍的一部分内容,软件操作部分直接演示的。 http://biotech.ustc.edu.cn/upload/RMRA/2010/histcite.rar 这次还布置了本学期的课堂报告要求以及histcite的作业要求 http://biotech.ustc.edu.cn/upload/RMRA/2010/zuoye.rar 如果这个解压文件有问题,可以直接下载解压后的三个文件 http://biotech.ustc.edu.cn/upload/RMRA/2010/histcite.ppt http://biotech.ustc.edu.cn/upload/RMRA/2010/histcite1.exe http://biotech.ustc.edu.cn/upload/RMRA/2010/histcite2.exe
个人分类: 文献管理与信息分析|22263 次阅读|19 个评论
为什么要引用(续2)
zilu85 2010-5-8 11:11
尽管有了基于引文情景分析的方法和结果,对于引用动机的解释还是存在着争议。对于引文分析的评价也不都是消极: 1977年,G. Nigel Gilbert认为引用是为了说服别人,即:作者为了证明引用文献中所发布的结果,选择引用他们认为是权威的论文,因此,可以说作者通过引用被引文献提供了说服性的支持。通过引用,作者可以既显示出他们对科学界某一特殊领域的忠诚,也为被引用论文的价值建立起一个共识做出了贡献。这种想法为论文质量研究和同被引分析研究中的发现提供了合理的解释,也对以往引用内容分析的研究结论进行了反驳。 引用情景分析方法通过检查引文标号附近的文本文字,确定引用作者的具体想法与被引文献之间的关联,但是很多研究都是对引用进行了简单的分类,没有注意到引文情景的科学内容。为此,Henry G. Small于1978年对化学领域高被引论文样本进行了涉及到具体内容的引文情景分析,发现在引用文献中,对特定文献的引用情景(即引用文献中的上下文)具有高度的一致性,所以引文可以作为化学领域中特定想法、方法和实验数据的标准符号。他们得出结论:作者是按照科学研究的正规要求把特定的思想与特定的文献关联起来的,因此,被引文献实际上是作为在文本中表达的想法的符号而存在的,在这个过程中,高被引论文由于其典范意义而被频繁引用。 上述研究证明被引文献可以作为概念符号或者说服别人的手段,因此引文与被引文献之间具有实质上的联系,作者力图证明引文计数作为引文分析的基本指标还是可靠的指标。尽管如此,作者为什么引用这一篇而不是另一篇,依然是引用动机研究中不可回避的问题,已有的研究中都认为这是明显地受到了马太效应的影响,但是一直以来没有过深入系统的研究。
个人分类: 生物医学文献计量学|4787 次阅读|2 个评论
为什么要引用(续1)
zilu85 2010-4-30 11:00
几乎是与 Moravcsik 同一时期,康奈尔大学的 Daryl E. Chubin 和Soumyo D. Moitra 也设计和应用了一个根据引用情况对引文进行分类的系统,与Moravcsik的引文分类略有不同,他们的研究包括:(1)重新细化了Moravcsik的分类体系,使类目间相互排斥;(2)从4种实验和理论物理学领域的期刊中抽取论文,然后用修改过的分类体系对这些论文进行分类。(3)将《科学引文索引》的计数与从我们引文分布中不同类别的引文中抽取出来的样本进行比较。发现正式的论文中95%的引文是肯定性的,这算做是对引文计数活动的初步支持。但是作者还是强调:首先,无论是对来源文献还是被引文我们都不应该只根据数字评价其价值,论文被引次数上的变异不过是给形形色色的正式交流的动机和标准提供了证据。其次,作者认为科学界是按照年龄和威望分成等级的,这种等级划分又都控制在具有很高的学术共识的学科之内,在高能物理学界,大家绝对不会同等地理解和实施引用文献的规矩的。最后,作者认为应该重建学科知识史(类似今天说的知识图谱),包括研究期间的统计,例如专业数目,文献的分布,设备的使用等等情况。只有这样才能了解到专业的变化,这样一来,不仅仅研究者发表论文的情景,而且可能他们引用某篇著作的原因也可以了解了;也只有到那时,我们才可以充分利用引文计数,也充分使用让引文计数有效的其他测量指标了。 【这篇文章提供给我们一个线索,也许可以把知识图谱和引文情景结合起来,让引文分析的研究重新焕发青春】 D. O. Edge and M. J. Mulkay, 'Case Studies of Scientific Specialties' (Edinburgh: Science Studies Unit, University of Edinburgh, 1974
个人分类: 生物医学文献计量学|4960 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-1 18:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部