Avenue du Reclus分享 http://blog.sciencenet.cn/u/Nancyback

博文

科学计量学:熔炉中折射的幻影与固化的晶花 精选

已有 6432 次阅读 2009-12-27 14:22 |个人分类:生活点滴|系统分类:科研笔记|关键词:学者| SCI, 论文质量, 科学计量

中国学术经过(SCI+官法)15年的熔炼。这熔炉中温度较均一的主体,借助不同的分光和频谱工具,看过去会有美丽的光晕,不同频率激发和吸收光的干涉,加以主观的想象,也许会看到不同的光线相互作用形成的点状、环状、晶状、树状的神奇的驻波和漩涡。不同的低温区域,局部也形成固化瘤、疤和凝块,甚至结出美丽的晶花。以SCI为基础的 “科学计量学”是一个研究这一类真真假假、虚虚幻幻、飘缥缈渺、多重干涉、折射形成的斑纹和晶花及其之间关系的“学科”?最近SCI的创始人Garfield,还被封了“科学计量学”之父http://www.sciencenet.cn/m/user_content.aspx?id=255744

SCI被引入熔炉的早年,对科学的评价是简单的数SCI收录的论文篇数。近年来逐步发展,更看重于引用率。那么,这收录和引用的实质是什么呢。

SCI1963年创刊的一个数据库,和其它数据库的显著不同,是它收录了文献的引文部分,这样可以分析文献的引证关系。在90年代以前,由于容量的关系,它的作用有限。90年代中期以后,由于计算机和网络技术的极大进步,逐步成为一个重要的检索工具。SCIE(Science Citation Index Expended)今年已经收录了6650多种自然科学和工程学科的杂志,并为这些杂志编制了包含引文关系的索引。显然,这是一个十分有用的工具。由于这一数据库的容量扩大,提供了很多以前没有的关联数据,比如,一个期刊的被引用情况和一个作者发表的论文的被引用情况,当然也可以检索一篇具体论文的被引用情况。

那么收录的含义是什么呢?SCI是确定收录的期刊杂志,来做索引的,不收录的期刊论文的引证关系自然也不包括。这样就排除了大量的科技期刊。那么SCI不收录的期刊中发表的是不是都不是科技论文呢?显然不对!那么SCI收录的期刊中,是不是都是科技论文呢?也显然不对(参见近期评论:http://www.sciencenet.cn/m/user_content.aspx?id=281079。昨天,有一位研究生在我的博客中留言“本人只是一名普通的研究生,我觉得数据的错误很大程度上是学生造成的,因为导师已经脱离了实验,不可能再有实验的直觉,顶多就是数据的直觉;还有就是您所说的导师和学生交流的时间短,内容浅!科学是什么,我觉得就是把真实的数据表现出来,你可以把你的数据进行美化,但是绝对要能把原始数据完整的表现,但是现在把完整的数据表现就出不了好文章,很纳闷“Why?”我的回答是“那么,好文章的定义是什么呢?数据脱离真实,还叫科技论文吗?”显然,期刊杂志只是载体,装的大部分是科技论文,但是有了社会导向,就什么东西都可能装进去了http://www.sciencenet.cn/m/user_content.aspx?id=266893)。

论文之间的关联关系,是十分有趣的,但是显然这本身不是科学,因为引用本身也受到很多因素的影响,不是能够准确计量的。记得在刚刚开始做研究工作的那几年,研究的课题是甲醇和低碳混合醇的合成。当时用的是共沉淀法制备催化剂,在共沉淀中若获得水滑石(Hydrotalcite)结构,制成的催化剂具有优异的性能。在80年代就此发表了若干篇论文。1990年到了荷兰Twente大学Julian Ross教授的实验室,逐步发现,原来Julian是把这一结构用于复合氧化物催化剂制备的先驱,在70年代有多篇论文发表,十分经典。但遗憾的是,我们早年没有机会看到这些论文,所以就没有引用。当然可以说那时的检索数据库和计算机不够发达,国内那时的大学图书馆,订购期刊量也有限。记得有一次给Julian提起,我们工作不够严肃,以至于没有引用他的经典论文。老先生说:“永丹,你有点过于严肃了”。

历史的看,互联网时代之前的引用,常常是不充分的,那么不充分的引用,新发表的和应该被引用而没有引用的论文,显然都是科技论文。那么互联网时代以后,特别是强调引用率以后,引用又常常是超越充分的(见杨明的博文,原来国内有这么“牛”的SCI杂志(影响因子8.5),http://www.sciencenet.cn/m/user_content.aspx?id=279289。这超越充分的论文和引文,当然本身的意义,也仅是一篇科技论文而已。

不充分和超越充分,显然已经失去了代表性和真实性,不能作为“科学”研究的对象。当然上述例子,只是SCI收录论文的一小部分,那么大多数引用是不是客观、充分、必要的呢?数据库的主体,或者多数引文,是不是充满科学意义的呢?2000年,SCI已经有了相当大的样本,Elsevier出版社作为 “Perspectives in Publishing, No. 1”发表了系统的分析文章,题目为“Impact Factors: Use & Abuse”。这篇文章基于大样本统计,系统的分析了“影响因子”的统计特征。得到如下结论。1. 不同文体的论文,被引用数的统计特征不一样,比如Letters, Full Papers, Reviews的引用统计特征和时间关系是不一样的。2. 期刊的容量,对影响因子有影响。3. 任何期刊的影响因子,都是波动的。4. 不同领域的杂志,平均的影响因子不同。5. 按照领域划分以后,每篇论文的平均作者数,与影响因子正相关。2002年,[Nature]发表题为 “The counting house”的文章,开始的第一句话是 “There are, it is said, three types of lies: lies, damned lies and statistics.”。此文进一步分析了引文统计分析作为科学评价依据的不科学性。

2002年初,姚建铨院士领导下的民进天津市委,组织召开“高等教育发展与改革:天津研讨会”。这一会议专门组织了一个国际单元,由我出面邀请了四位国际友好人士来作报告。当时任国际催化理事会主席的Michel Che先生应邀作了大会特邀报告。题目是“Can man play against computers in evaluating research?”Che先生优美的演绎了科学和化学的历史。先生认为,在科学史上,现在看来最重要的思想,一个是公元前430Democritus提出的原子的概念,另一个是1820Michael Faraday提出的电荷的概念,在20世纪以前漫长的历史中,科学形成了,但在那时候,既没有科学的定量评价,也没有诺贝尔奖。先生统计了1978-2002年化学和物理领域的诺贝尔奖获得者的被引用情况,在物理领域只有11/58位诺贝尔奖获得者的被引用次数,可以进入前1000名,而化学呢,稍微好一些,有31/51位诺贝尔奖获得者进入了引用数的前一千位。那么,这一数据的物理含义是什么呢?是化学的诺贝尔奖获得者的公认程度好于物理吗?是诺贝尔奖给的不公平吗?Che先生引用了罗斯福总统战后雄心勃勃的美国科技振兴计划,现在回过头来看,之后真正称得起革命性进展的,多数没有进入该计划。

那么,引用数作为具体论文的关联,意义在那里呢?下面一个表格给出我们大约10年前发表的几篇论文的SCI引用数统计,其中*表示发表的年头,三篇论文发表当年都没有被引用。

编号

1999

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

1

 

1

2

6

10

6

6

6

23

14

2

0

0

3

2

1

1

2

3

1

5

3

3

3

5

6

2

0

2

5

2

1

论文1前两年只有3次引用,20082009年两年则有37次引用,中间的多年是很平稳的,但属于低引用量。论文2前两年的引用为零,但今年被引用了5次。论文3则比较复杂,是有一大部分引用写错了卷期页,SCI也没有办法归属的清楚,表中给的是SCI数据库能给出的数据。有趣的是,论文1还在发表3个月后,被杂志主编选为主编精选论文放在杂志主页上好几年,也没有带来在开始几年的高引用数。

这个表中的数据是有用的,说明了什么时候同行就此专题做的工作多少。但与论文的科学质量,是完全不相干的。

引用率和这网站上博文的点击率,有点类似,只不过是一个时间段内,与感兴趣的或做工作的人的多少相关的一个数据。与文件的质量、文学内涵、科学内涵等等一概不相干。

当科学被曲解为数字,科学家就沦为奴婢!

 

20091227日于天南大联合楼。

附件:

1. Impact factors: Use and abuse

Impact factors: Use and abuse

2.  The counting house

 The counting house

3. The editors choice articles

 The editors choice articles



https://m.sciencenet.cn/blog-281175-281795.html

上一篇:猫和老虎的故事与“既要你钱、也要你命”
下一篇:年终算工分:学术单位行政计量学?

13 刘华杰 王晓明 郭向云 朱志敏 杨远帆 钟炳 许浚远 陈苏华 吕喆 金凯 李志俊 李学宽 liangqiang

发表评论 评论 (8 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-4 15:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部