近日,读到 JASIS ( 2010 年第一期的第一篇文章) Problems of Citation Analysis: A Study of Uncited and Seldom-Cited Influences ,对我的启发十分大,开始彻底颠覆我并不牢固的情报学基础认识,因此,我把我及时的感受写出来与大家分享,希望能够得到科学网前辈们的指点。 作者: M.H. MacRoberts and B.R. MacRoberts 全文: Problems of Citation Analysis: A Study of Uncited and Seldom-Cited Influences Problems of Citation Analysis: A Study of Uncited (论文下载仅作为学术用途) 一、 读文感受 文章提到了 引文分析的基础 : Cole and Cole (1972) found that highly cited physics papers also cited highly cited papers, and so on. If we did not know that biogeographic papers cited very few of their influences, we might come to the same conclusion as the Coles: that only a small number of individuals contribute to scientific progress. But knowing that the vast majority of influence is not cited and that influence is not to be found in the Thomson Reuters-monitored journals leads to a different conclusion: that manynot a fewcontribute to scientific progress. Cole 在 1972 年发现 高被引的物理学论文同样也会应用高被引论文等等 如果我们不了解生物地理学论文引用很少的对文章产生巨大影响的文献,我们可能得出与 Cole 相同的结论:仅有少数的个体对于科学的进步是有贡献的。但是,如果我们知道大量有影响的内容不会被 SCI 所引证,也许会导致一个不同的结论:是许多个体 而不仅仅是少数人 对于科学的进展有贡献。 (一) 举了两个例子: 1. The latitudinal gradient of species-area relationships for vascular plants of North America. published in 2007 in American Naturalist 一文中引证了 A total of 1,742 floras of North America north of Mexico ( 1742 种植物群),而这些植物群的资料范围覆盖了政府文献、论文、未出版的报告、网页内容、短评以及 2000 多页的参考资料。这部分内容也被提及,出现在 Appendix A ,然而该论文仅引用了 85 篇文献,而这些被引文献仅仅是 SCI 文献,这些文献主要是用于解释物种的多样性的文章。 2. 作者本人发表了一篇 2 页的短文 Palhinhaea cernua (L.) Vasconcellos Franco (Lycopodiaceae) new to Texasin Phytologia ,该期刊不是 SCI 论文。这篇文章通过 SCI EXPANDED 和 GOOGLE SCHOLAR 检索均发现没有任何引证,然而,这篇文章确被整合进了德州和北美的植物地理文献中,该信息被广泛的应用;另外, USDA 植物数据库以及自然服务( NATURESERVE )数据库都将该文章的研究纳入进去。换言之,该论文即被印刷版也被电子版的出版物所引用,这篇文章的研究目的已经达到了。 上面两个例子证明了,被引文献仅仅只能代表有影响文献资料的一个片段。 (二) 作者同样做了一个小的定量实证:(哈哈!虽然作者认为定量分析并不是一种包打天下的方法) We selected 10 theoretical/analytical biogeographical articles that were published in journals that are monitored by Thomson Reuters and examined their bibliographies. These 10 articles are from the 22 described in this study. We recorded whether the cited item was (a) a article from a journal not monitored by Thomson Reuters, (b) an article from a Thomson Reuters-monitored journal, (c) a book or chapter in a book, (d) an unpublished report, (e) a thesis or dissertation, or (f) an online Web source or CD-ROM. There were 530 citations in these 10 articles. We selected five data articles or sources used for data in the 22 theoretical/analytical articles, such as those listed in McLaughlin (2007). We recorded the same information that we recorded for the other sample. We stopped when we reached 530 items so that the two samples would be equal. Table 1 shows the data for the two groups. Statistical comparison of the two groups shows that there is no possibility of them being derived from the same population. Theoretical/analytical biogeographical articles predominantly cite theoretical/analytical articles from Thomson Reuters-monitored journals; data articles do not cite many Thomson Reuters-monitored articles but instead cite work from journals not monitored by Thomson Reuters, unpublished reports, theses/dissertations, and the grey literature. 对于两个群体的统计比较显示:理论或者分析类的植物地理文献主要引用了 SCI 的理论和分析文献;而数据类型的文献则没有引用太多的 SCI 文献,相反,他们主要引用的是非 SCI 文献、未发表的报告、研究论文,或者是灰色文献。 er二、反思 这篇文献对我的震撼是极大的。 主要有二点: (一) 以引文为基础的方法是不是对于所有学科的评价都有价值,是值得反思的。其实,自然科学中,除了植物地理学以外,很多学科的研究都包含了对于原始数据和基础理论分析的研究,而我们现在评价体系的一个重要指标 引文则是对于数据研究这部分内容的价值忽略了的。 (二) 文献计量学中 Cole 的理论:仅有少数的个体对于科学的进步是有贡献的 或者还应该包括 洛特卡定律 这些理论都从 分析方法(仅仅考虑第一作者) + 分析框架(仅仅展示核心作者) + 分析目的(评价作者贡献) 是出于一种狭隘、自私的学术观点。但是,如果我们反思 真的是只有小部分人对于科学的进步有贡献吗? 真的是一将功成万骨枯吗? 。这是我们图书情报学界急需要考虑的问题。 中国的情报学目前还从创作过自己有价值的理论,但研究中确充斥着各式各样标榜自己学术地位的所谓学科知识地图,这有时是一种讽刺。
A comprehensive discussion on the use of citation analysis to rate scientific performance and the controversy surrounding it. The general adverse criticism that citation counts include an excessive number of negative citations (citations to incorrect results worthy of attack), self-citations (citations to the works of the citing authors), and citations to methodological papers is analyzed. Included are a discussion of measurement problems such as counting citations for multiauthored papers, distinguishing between more than one person with the same last name (homographs), and what it is that citation analysis actually measures. It is concluded that as the scientific enterprise becomes larger and more complex, and its role in society more critical, it will become more difficult, expensive and necessary to evaluate and identify the largest contributors. When properly used, citation analysis can introduce a useful measure of objectivity into the evaluation process at relatively low financial cost.
Publish or Perish,在美国七十年代初期兴起,并在国际上流行,意思是(论文)不发表就会被埋没,发表还是灭亡,发表或消亡。 Harzing, A.W把自己设计的一款检索和分析学术引文的免费小软件叫做Publish or Perish( http://www.harzing.com/pop.htm )。目前有上百个博客和图书馆网站、还有报纸和杂志对其进行了报导;也有多篇论文以该软件作为数据收集和分析的工具。在宣称这个软件具有的评价个人或机构学术影响力的同时,作者也总结了应用局限。 软件的主要特色有三:一是 软件相当小巧,也十分简单易操作,仅有384K,有Windows和Linux多个版本。 它使用的原始引文数据来自于Google Scholar,适合进行网络引文的分析。作者在其博客中提到,希望看到软件结果与WoS分析出的结果的比较研究,这可能是对传统引文与网络引文对比研究的好题材。 软件可以得出多个最新的引文分析评价指标,如Total number of papers 、Total number of citations 、Average number of citations per paper 、Average number of citations per author、Average number of papers per author 、Average number of citations per year 、Hirsch's h-index and related parameters 、Egghe's g-index 、The contemporary h-index 、The age-weighted citation rate 、Two variations of individual h-indices 、An analysis of the number of authors per paper.
几乎是与 Moravcsik 同一时期,康奈尔大学的 Daryl E. Chubin 和Soumyo D. Moitra 也设计和应用了一个根据引用情况对引文进行分类的系统,与Moravcsik的引文分类略有不同,他们的研究包括:(1)重新细化了Moravcsik的分类体系,使类目间相互排斥;(2)从4种实验和理论物理学领域的期刊中抽取论文,然后用修改过的分类体系对这些论文进行分类。(3)将《科学引文索引》的计数与从我们引文分布中不同类别的引文中抽取出来的样本进行比较。发现正式的论文中95%的引文是肯定性的,这算做是对引文计数活动的初步支持。但是作者还是强调:首先,无论是对来源文献还是被引文我们都不应该只根据数字评价其价值,论文被引次数上的变异不过是给形形色色的正式交流的动机和标准提供了证据。其次,作者认为科学界是按照年龄和威望分成等级的,这种等级划分又都控制在具有很高的学术共识的学科之内,在高能物理学界,大家绝对不会同等地理解和实施引用文献的规矩的。最后,作者认为应该重建学科知识史(类似今天说的知识图谱),包括研究期间的统计,例如专业数目,文献的分布,设备的使用等等情况。只有这样才能了解到专业的变化,这样一来,不仅仅研究者发表论文的情景,而且可能他们引用某篇著作的原因也可以了解了;也只有到那时,我们才可以充分利用引文计数,也充分使用让引文计数有效的其他测量指标了。 【这篇文章提供给我们一个线索,也许可以把知识图谱和引文情景结合起来,让引文分析的研究重新焕发青春】 D. O. Edge and M. J. Mulkay, 'Case Studies of Scientific Specialties' (Edinburgh: Science Studies Unit, University of Edinburgh, 1974