如何用Web of science查询某个学者的H-index 现在越来越多的人用H-Index指标来评价研究人员的学术水平,尽管有人指出这个指标有瑕疵,并提出科学是不可以用来排名的。不过我想这个指标还是很有用的,在评价学术人员特别是大学教授的工作时。当然这里面有一个概率的问题,我觉相似研究方向的两个学者,H-index指数相差越大,则拥有高H-index的学者的工作有更高的概率比拥有低H-index的学者的工作要好。比如如果A、B两人的H-index分别是56和50。那么我想A比B的工作要更好一些的概率可能只有50%多一点,也就是说很难说A比B好。但是如果A、B两人分别是56和5,那么我想99%的概率A的工作比B的工作好很多。当然也存在那么1% 的概率B的工作实际很好很有意义,只是现在没有被发现而已,不过小概率事件很难发生的。 如何用Web of Science获得H-Index? 进入 http://isiknowledge.com/isip, 找到“Auther Finder”链接,点击, 根据提示输入某个学者的相关信息,注意选择单位时,尽量将该学者的所有曾经工作的单位都选中, 最后“Finish Now”,你就会得到一个包含该学者所有文章的页面(也可能含有其他人的文章), 在右上角有一个“create citation record”的链接,点击即可或者相关信息,包括 Sum of the Times Cited, Average Citations per Item以及h-index。并且可以去掉它引。 还有其他的办法获得学者的H-index,比如Scopus,不过不同方法统计的数据是有差别的,所以数值也不一样。 http://www.zhoulei.info/%E5%A6%82%E4%BD%95%E7%94%A8web-of-science%E6%9F%A5%E8%AF%A2%E6%9F%90%E4%B8%AA%E5%AD%A6%E8%80%85%E7%9A%84h-index/
h 和 g 指数是目前比较常用的同时考虑了文章篇数和引用次数的科学计量学指标。 h 指数存在的主要问题是降低了核心文献 ( 排在 h 指数内的文献 ) 的贡献,事实上核心文献引用的变化对 h 指数的增长没有贡献。而 g 指数有时会过分突出了个别核心文献的贡献。本文考虑将聚集度指数 C( 定义见博客“二八定律与 C 指数”和“关于聚集度指数的补充” ) 和 h 指数结合起来建立一个新的指数 M ,并定义 M=C*h 。也就是,当 h 指数相同时,聚集度越大, M 指数也就越大,其影响力也就越大。 M 指数能否用于科学计量学评价,期待能够得到相关研究者的实际检验。
现在 h 指数有愈加流行的趋势,大家认为相较于影响因子, h 指数能从总体上更客观地评价研究者的水平。影响因子更多地是对期刊的评价,而 h 指数则兼顾了研究者的被引次数和文章数量。文双春老师被推荐至头条的博文用了个刺激人的题目《 h 指数准确预测科学家伙能否成大器 》。但其实,姑且不论预测一个家伙能否成大器是很难的一件事儿,如果从 h 指数计算的本质来看,它仍然有不靠谱性。 一个缺陷是,基于不同的检索数据库如 Web of Science 、 Scopus 、 Google Scholar ,算出来的某个研究者的 h 指数常常不一样,这跟数据库的收录范围有关。这时候,我们选择用哪个?估计很多人愿意用比较高的那个。这三个里头,更多时候或许 Google Scholar 给出的 h 指数最高,我发现它有时会将非论文的材料算作引用(如果这个材料提到了你的文章)。实情是,这些检索数据库并不能体现你文章的所有引用,比如 WoS ,更侧重于 SCI 收录期刊的引用,直到最近才稳定的将一些中文期刊的引用算进去。另外,不同学科领域被这些检索数据库收录的程度不同,比如分类学期刊被收录为 SCI 的比例小,而分子生物学和医学则高很多。因此,不同领域科学家的 h 指数其实并没有太多可比性。 但我觉得一个更加值得关注的缺陷是: h 指数没有区分作者的实际贡献 。 来看一个简单的例子。 A 和 B 是紧密的合作者,两者共同发表论文,共同署名了 20 篇引用次数超过 20 的文章。这时候两者的 h 指数都是 20 ,表面上看好像科研水平相当。但是,在这 20 篇文章中, A 是 15 篇文章的第一作者,而 B 只是 5 篇文章的第一作者。很明显, A 作者应该有更大的贡献。所以, h 指数倾向于对大的研究团队有利,多个合作者会共享比较高的 h 指数(大合作的实验学科就比常单兵或小集团作战的理论学科 h 指数高),这种情况下混淆了不同作者的实际贡献。 要真正衡量研究者的实际贡献,应该对 h 指数做适当的改进。比如, 只统计某位研究者作为第一作者或通讯作者时的 h 指数。 对于上面的例子, A 的 h 指数就应该是 15 ;而 B 是 5 。这个简单的改进也是很粗糙的,因为有时候难以界定研究者在非第一作者文章中的实际贡献。 为了让评价更细致客观,可以考虑在 计算 h 指数时对不同顺序的作者有个权重 。比如,第一作者权重为 1 ,第二作者权重为 0.7 ,第三作者为 0.4 。如果第一作者同时是通讯作者,那么权重为 1 ;如果通讯作者非第一作者,其权重计为 0.8 。还是上面的例子,假定 A 是 15 篇文章的第一作者,是另 5 篇的第二作者; B 是 5 篇文章的第一作者,另 15 篇的第二作者。这时候计算两者的 h 指数: A 为( 15*1 + 5*0.7 ) =18.5 ; B 为( 5*1 + 15*0.7 ) =15.5 。我们可以发现,用现有的计算 h 指数的方法, A 和 B 用 h 指数所代表的科研贡献都被高估了,并且现有的方法掩盖了 A 和 B 实际贡献的大小。 不知道科学计量学领域是否已经有人用这个思路修正 h 指数,我在 Scientometrics 期刊用“ author+order ”做关键词进行检索,没有发现相关的论文发表。如果还没有关于作者顺序对 h 指数影响的研究发表,我建议相关领域的同志们考虑下这个问题并且设计一定的算法。当然要考虑到其他一些问题,比如作者排名的权重问题(即如何更客观地衡量在文章中的实际贡献)。同时,也不得不考虑到修正算法的简洁性,太复杂不利于推广使用, h 指数和影响因子之所以能流行,就是因为其简单性。当然,对于发表论文时作者不按实际贡献排名(比如可能按名字字母顺序)的领域,就要想其他能反应实际贡献的修正算法。 注: 本文是想谈h因子可能存在的缺陷,希望大家能提出相应的看法,而非说h指数没有合理性,或者说建议只看第一或通讯作者。留言中有些同志说“你整个标准出来”,我觉得这是非理性的讨论方式,恕不予回复。从大家的留言可以看出,很多人都认为用某个指数评价人不靠谱,所以需要思考的是如何更综合地评价。