如何客观公正地衡量一个人的学术产出? 影响因子?H指数?替代计量? 影响因子H指数都是基于引文,通过引文情况衡量影响因子,真的很靠谱吗? 首先,影响因子具有时间上的滞后性。必须是发表了之后,才可能被引用。有了引用的数据,影响因子的计量才开始。其次,影响因子具有内容上的片面性,部分引用,只是因为概念上的相关,甚至是指出原文献的不科学之处,对施引文献的产生实质贡献的力度有待进一步挖掘和衡量。再次,存在特别有分量的作品,与其同时代的人不能读懂,尚无能力客观评价其贡献的现像。 以这篇文章为例 McKee P A, Castelli W P, McNamara P M, et al. McKee P A, Castelli W P, McNamara P M, et al. The natural history of congestive heart failure: the Framingham study . New England Journal of Medicine, 1971, 285(26): 1441-1446. 这篇发表在1971年的文章在WOS上引文数为1698,在Scopus上的引文数为1700,在Google Scholar上的引文数为2608,以哪个为准? 这篇文章在1972年,WOS上的引文数为7,Scopus上的引文数为1,Google Scholar上的引文数为4,从差别如此之大的数字来看,所谓的权威数据库,所谓的全球收录最大的数据库,在学术评价上真的客观吗?再细看WOS、Scopus、 Google Scholar 上提供的引文清单,不相互重合。WOS中的7篇不包含Scopus中唯一的一篇, Google Scholar 上1972年引用此文的4篇,与WOS收录的1972年引用此文的7篇中仅3篇重合。 即使假定这些数字为真,仅从引文数字看起来,是个表现平平的文章。 WOS上对此文的引文情况,按年度排列 WOS上,该篇文章的发表后的第一个10年的引文情况 Scopus上,该篇文章发表后的第一个10年的引文情况 由此可见WOS、Scopus、Google Scholar中的原始数据集均有待完善,基于不完善的数据集的引文量化进行学术影响力评价,得出的结论,看看可以,信以为真,甚至作为指南和目标,恐怕不行。其实引文索引的创始人E.Garfield对基于引文计量的评价价值有天生的不足( The use of journal impacts in evaluating individuals has its inherent dangers)参见 。 文章在互联网上可以被公开发现和评论,给基于文章价值本身的发现带来了更多的机会。于是,有人提出了替代计量学(Altermetics)。但是目前,替代计量学未引起国内机构和学者的广泛认可 ,且不完全符合中国学者的研究行为习惯,会引起因在网际知名社交网络上爆光度不高带来不客观的评价。长期关注计量研究的学者邱均平提出了金字塔型的替代计量指标分层 。分为应用层,社交媒体层,应用层三个层次,在文章的讨论部分,依然导向了基于引文的评价。 那么,引文可不可取,可不可信?应该如何客观公正地评价一篇文章的学术贡献呢? 笔者认为,引文、社交媒体等信息,均来自外部评价,并不能武断地依据这些信息对一篇学术作品的影响力下定论。就像我们知道了一个人的身高和体重,不能断定这个人是什么样的人一样。对文章贡献度的评价,应该回归到文章内容上来。但是评价文章内容本身,是有学术门槛和时间成本的。不适宜大规模大批量的应用。而研究的支持方需要知道他们对某个团队或者某个方向的资助值不值得,资金的提供方又没有高深的学术水平,社会的竞争异常激烈,谁抓住了创新的原始股,谁就赢在了起跑线上。 焦虑啊,这可怎么办呢?只能求助于社会资本理论中的信任了。 1、基于引文的衡量还是有重要参考价值的。只是不单是看文章发表在什么样影响因子的期刊上,不单是看文章被多少人引用了,而是要细化到在哪些地方被引用,该文章的内容为后继研究做了哪些贡献。如杜建、武夷山等对”睡美人型“、”王子型“文献的识别研究。这需要较大的时间跨度。 2、从文章如何引用别的文献,查看作者相关研究综述的功力。从文章语言用词和图表规范,判断作者的学术写作功力。这需要基于全文的分析和基于大规模优质样本的学习,这个工作,机器可以做些辅助。 3、研究文章作者的可信度。所谓风过留痕。一份重量级文章的出现,必然出自持续积累和敏锐洞察。如何建立基于作者的可信模型,笔者目前还没有思路。但基于笔者对中国工程院12名1950年之后出生主要在高校从事研究的信息与电子工程学部院士的网上可分开获取的素材来看,信息源视野,也就是说,这个人在每个阶段都和哪个学术声望层级的人接触与联系,他能够使用的有组织的知识资源状况,他可以用的技术条件和手段等,是个很有参考价值的指标。 为什么会想到上面这三点呢?笔者认为这和中国的传统文化有关。 笔者认为中国的文化传统,是在全球文明中是个独特的存在。对个人价值的认可,不依附为他人的认定,不依附于官方的指派,是天人合一的存在,是个人与时空、空间的对话。 例如: 前不见古人 ,后 不见来者 。念天地之悠悠,独怆然而涕下。陈子昂 例如:君不见黄河之水天上来,奔流到海不复回。君不见高堂明镜悲白发,朝如青丝暮成雪。黄河走东溟,白日落西海。逝川与流光,飘忽不相待。春容舍我去,秋发已衰改。人生非寒松,年貌岂长在。吾当乘云螭,吸景驻光彩。李白 例如:兰亭集序,时间、空间、自我情感的描绘。 研究论文纵使不能如同文学般行云流水,任意发挥。但好的文章,首先应基于作者对自己研究,在自己所研领域的精确时空定位。本文提出的第一条,基于引 文的衡量,能侧面反应作者对自己研究的定位。如果阅稿人是在正式发表之前看到文章,例如是审稿人,则本身是相近领域学者,可了免去对低水平文章高估的误判。如果阅稿人是在正式发表之后看到文章,本身已经说明该文章至少被所刊的期刊认可。本文提出的第二条,虽然咎于形式,但形,神之所附也。基于内容级别的深度挖掘,已经相对客观了。本文提出的第三条,其合理性和科学性,希望与诸位共同探讨。 Garfield, Eugene. The history and meaning of the journal impact factor. Jama 295.1 (2006): 90-93. Garfield E. Citation analysis as a tool in journal evaluation . American Association for the Advancement of Science, 1972. 邱均平,余厚强. 论推动替代计量学发展的若干基本问题 . 中国图书馆学报 . 2015(01) 邱均平, 余厚强. 基于影响力产生模型的替代计量指标分层研究 . 情报杂志, 2015 (2015 年 05): 53-58.
(本文发表在《Scientometrics》 March 2013 , Volume 94 , Issue 3 , pp 1037-1056 ) Visualization of patents and papers in terahertz technology: a comparative study Guifeng LIU Abstract Terahertz technology is one of the most promising research areas in the 21st century. In this work, we intend to compare the research status quo on terahertz technology between 1990 and 2010 using knowledge domain visualization techniques. Our data consists of 633 patents retrieved from Aureka management platform and 10,344 journal articles indexed in the ISI web of knowledge. Our analysis is a combination of two information visualization tools for analysis, Aureka and CiteSpace. Aureka is allowed for the analysis of patents filed/granted each year, priority country, inventors, assignees, citation counting, and cluster analysis, while networks of co-authors, countries, institutions, document co-citation networks and document co-citation clusters, are performed by CiteSpace. This research provides a comprehensive domain visualization map of innovation and knowledge in the area of terahertz technology. Our result shows that Aureka and CiteSpace are two promising visualization approaches to analyze patents and papers in any given field. Keywords Scientometrics–CiteSpace–Aureka–Thomson innovation–Visualization–Patent–Terahertz 2013-Visualization of patents and papers in terahertz.pdf