科学网 › 标签 › 评价体系

标签: 评价体系

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

连续、动态和复合的单篇论文评价体系构建研究: 热度 2 xianwenwang 2015-5-8 10:03; 连续、动态和复合的单篇论文评价体系构建研究王贤文，方志超，王虹茵（大连理工大学科学学与科技管理研究所 WISE实验室，辽宁大连 116024 ）摘要：当前的科学论文评价主要建立在核心期刊的选择和期刊评价体系之上，但是现有的评价机制正逐渐暴露出滞后性、片面性等弊端。随着信息计量技术的发展和数字图书馆的兴盛，单篇论文评价指标逐渐丰富，构建单篇论文评价体系的资源和技术条件已经具备。通过对现行期刊评价体系积弊的分析，论证了构建单篇论文评价体系的必要性；通过对单篇论文评价体系运作原理的解释，以及实证研究，论证了构建单篇论文评价体系的可行性。我们认为，被引次数适合对论文的长期学术影响力进行评价，期刊影响因子只适合评价期刊而非单篇论文， altmetrics 适合对论文的社会影响力进行快速评价。如果把这些指标综合起来，建立一种连读、动态和复合的单篇论文评价体系及数据库，将会使对科学论文的评价更加全面合理，为学术评价提供一种崭新的思路。关键词：单篇论文评价；评价体系；评价数据库；动态评价；学术影响；社会影响引文评价和期刊评价体系，是当前科学论文评价的主流方法；被引次数与期刊影响因子则是这一体系之下使用最为普遍、接受程度最高的两个评价指标。长久以来，被引次数在衡量一篇科学论文的影响力方面具有很强的权威性，也是评估科研人员绩效的最重要手段。期刊影响因子则在科学论文尚未积累足够被引次数的情况下，补充性地担当着衡量新发表论文潜在影响力的重任。二者在学术界共同构筑起了根基深厚、影响广泛的学术评价体系。甚或，在被引次数和期刊影响因子之外，在一些国家还发展出Web of Science（SCI/SSCI）收录与否这一评价概念。SCI/SSCI收录同样也是基于核心期刊遴选的结果。然而，随着信息计量技术的发展、论文全方位评价指标的丰富、数字图书馆的蓬勃兴盛和科学文献出版行业的变革，现有的基于核心期刊遴选和期刊评价体系暴露出一系列的局限性。被引次数虽然在评价论文学术影响力方面独领风骚，但面对伴随着网络社交新媒体的兴起而突现的论文社会影响力评价需求则无能为力。不仅如此，被引次数的时间滞后性还使其无法对新发表的论文做出有效的评价。因此，现有的科技成果评价体系应当做出改变以适应科学计量学的发展潮流、满足科学共同体对于更加全面完善的评价体系的迫切需要。我们认为，对于学术论文评价来说，开展单篇论文综合评价是相对于单一被引次数评价和期刊影响因子评价更好的选择。目前对于单篇论文评价的研究主要集中在单篇论文评价指标方面，包括提出并推广诸如Altmetrics系列指标等新型单篇论文评价指标、挖掘当前普遍使用的单篇论文评价指标的数据变化规律和适用范围、对多项单篇论文评价指标进行相关性分析以验证其有效性等等。伴随着单篇论文评价指标研究的深入，有学者开始反思期刊评价体系在为研究者遴选值得阅读的高水平论文方面的效力，特别是对用期刊影响因子来概括一篇论文的质量这一传统的做法产生了质疑，并且在总结了多项单篇论文评价指标优点与缺陷的基础上，提出了将论文评价的基本单元由期刊层面过渡到单篇论文本身的主张。日益丰富的单篇论文评价指标带来了海量的数据，同时也带来了数据爆炸所必然造成的困境，如何挖掘这些评价数据的真实内涵、如何恰当地使用这些数据以及如何有效组织数据以形成一个可靠的评价结构，成为了有待解决的新问题。系统化多项评价指标进而构建一个内部能够顺畅调理复杂数据的体系，是解决这类问题的一种有效手段。曾有学者利用这种手段构建了大学教师职称晋升的综合评价和决策模型。而在论文评价方面，尽管有学者提出过将传统引用指标和Altmetrics指标相结合以覆盖长期和短期影响力评价的构想，但是尚未有研究成果将多项评价指标进行系统综合、成功构建出颠覆期刊评价体系的单篇论文评价体系，更没有进一步将单篇论文评价体系运用于具体论文评价的实践。近年来涌现的绝大部分论文评价指标，无论是学术影响力评价指标还是社会影响评价指标，其立足的根本、着眼的对象都是单篇论文。不同类型单篇论文评价指标愈发丰富并且影响力日益提升，越来越多的学术出版商开始公开提供单篇论文评价指标的详细数据。同时，科学文献出版行业的变革，特别是如PLoS ONE、Scientific Reports等打破传统期刊限制的开放获取平台的出现，也真正意义上让单篇论文成为评价的基本单元。这一切都标志着构建单篇论文评价体系的时机已经逐渐成熟，单篇论文评价体系已然具备了诞生的资源和技术条件。 1 建立在期刊评价基础上的论文评价体系的积弊 1.1 对论文社会影响力评价的忽视由于科学论文最主要的读者是科学共同体内部人员，所以论文的学术影响力评价指标在整个评价体系中占据着最重要的地位。而被引次数作为最权威且使用最广泛的学术影响力评价指标，就像王冠上的明珠一般，必不可少、弥足珍贵。因此在论文影响力评价方面的研究中，研究主题主要集中在引用次数上。但是随着网络社交媒体日新月异的蓬勃发展，科学借助新媒体平台逐渐走入社会公众的视野，仅仅依靠学术影响力来度量一篇论文的质量已经不够充分，一批社会影响力度量指标开始萌发兴起，例如Altmetrics的提出引起了全球学术界的强烈关注。被传统期刊评价体系忽视的论文社会影响力评价领域，可以被Altmetrics系列指标所覆盖。科学技术给人类社会带来的深远影响使得社会公众对于科技发展的关注度越来越高，每个个体，包括论文作者自身都可以成为科学研究成果的传播者和普及者。在此情形下，社会公众已经不再是科学的局外人，论文的社会影响力必将成为衡量科研成果价值的另一个重要的方面。论文被媒体报道、社交媒体的热烈讨论等都是社会影响力的体现。对于有些学科，尤其是社会科学的论文来说，成果所产生的社会影响力不容忽视，甚至比被引次数还重要。期刊评价体系对于论文社会影响力评价的忽视，表明该体系已经不能完全跟上时代发展的步伐。 1.2 对新发表论文的潜在影响力缺乏评价手段在一篇论文发表之后的大约两年时间里，论文的被引次数很少，远没有积累到足够做出准确评价的程度，被引次数的时间滞后性特征使得这一评价指标面对新发表的论文无法发挥作用。这就意味着，被引次数在评价论文的学术影响力方面，只能做出长期影响力的评价，而难以对新发表论文的潜在影响力做出准确的判断。这是当前的学术出版规则和流程导致的，因此只能寻求补充性的解决办法，用另一种指标替代被引次数进行短期影响力的评价。而期刊评价体系给出的替代性指标便是期刊影响因子。期刊影响因子本质上是论文被引次数这一评价指标的拓展延伸，所以其诞生之初就被赋予了相对权威的学术影响力评价效力。又因为期刊影响因子不具有被引次数的特异性、单独性和频繁变动性，弥补了单篇论文被引次数滞后性的不足，因而期刊影响因子长久以来一直被视为被引次数的有效替代评价指标。基于期刊影响因子，期刊评价体系得以建立并盛行起来。对于新发表的论文来说，由于其没有被引次数的数据，便用其发表来源期刊的影响因子对其进行评价，这一做法被科学共同体普遍接受，并且已经成为了评价科研人员工作绩效的重要指标之一。但是，期刊影响因子的滥用引起了众多学者的批评。一方面，同时期发表于同一本期刊上的论文被用同一个影响因子来代表评价，忽视了论文质量的良莠不齐。另一方面，每年的期刊影响因子都不一样。论文刚发表时和发表几年后，所在期刊的影响因子可能会有较大幅度的变化。显而易见，期刊影响因子的变化不等同于论文学术价值的变化。因此，期刊影响因子只能算是对新发表论文的价值评估的一种权宜之计，它不仅不能准确地反映科学论文的学术影响力，反而往往高估或者低估了一篇论文的真实水平，其效度和信度暴露出诸多劣势。期刊评价体系之下，尚缺乏有效且可信的评价论文短期影响力的方法。 1.3 基于期刊评价的数据库收录原则存在诸多弊端在期刊评价体系之下，以Web of Science为代表的数据库是以期刊为单位进行论文的收录。一篇论文无论其实际质量如何，只要发表在了一本Web of Science数据库收录的期刊上，就能在Web of Science这一致力于“发掘高影响力论文”的数据库中被检索到，这导致Web of Science数据库中充斥了大量零被引的论文（虽然并非所有零被引论文都是低质量论文，但是“睡美人”类型的零被引论文少之又少）。包括去年 Nature 推出的 Nature Index 也存在同样的问题。高影响因子的期刊刊载的并不一定都是高水平的论文。在期刊编辑部的同行评审程序中，由期刊主编以及2-5位同行对投稿论文的研究质量进行评判，决定论文录用与否，难免会有部分低水平研究侥幸过关，混杂其中。所以，绝对地以期刊为单元进行论文的收录遴选，不可避免地会将部分低质量的论文一并收录到数据库中。有些学术期刊甚至利用这一漏洞开展违反学术道德的营利活动，这样的结果违背了Web of Science数据库的初衷，因此有必要对造成这一局面的根基——期刊评价体系做出必要的调整。 2 单篇论文评价的时机已经成熟 2.1 社会影响力评价指标的兴起社会影响力评价指标主要侧重于评价科学论文在多种类型的社会舆论媒体、网络社交媒体和网络学术工具上的影响力，最典型的代表便是Altmetric Score。Altmetrics 这一概念甫一提出，很快就成为了科学计量学的研究热点，它作为论文社会影响力评价方法，弥补了被引次数等传统学术影响力评价指标的不足。 Altmetrics着眼于科学论文在舆论媒体、社交网络、网络学术工具等平台上的传播热议程度，网络传播速度快、范围广的特点避免了如学术引用一般的低速率、长周期。另有研究表明，一篇论文的部分Altmetrics计量指标得分，特别是Twitter mentions（推特讨论）与其被引次数之间有一定的正相关关系，因此Altmetric Score 被认为是能够对新发表论文做出快速评价的指标之一。但是，Altmetrics的各项计量指标得分与被引次数之间的相关关系也受到了众多学者的质疑。并且一篇论文之所以可以在社交网络上广泛传播，其原因更多的可能不在于它的学术价值，而在于它的新颖性、趣味性和话题性，所以侧重于社会影响力评价的Altmetrics能否有效进行学术影响力的评价还有待进一步研究。但是作为社会影响力评价手段，Altmetrics填补了以往评价体系的空白，前瞻性地开拓了论文社会影响力评价的研究领域，为科学计量学插上了网络信息计量技术的翅膀，拓宽了科学计量学的研究视域。 2.2 短期影响力评价指标的涌现为了弥补被引次数在短期影响力评价方面的缺位，有学者开始尝试以被引次数为基础对评价方法进行延伸和变形。例如将一篇论文的被引次数和其参考文献数目做比较，将被引次数大于其参考文献数的论文定义为“成功论文” ，或者是利用引用滞后的特点，将论文的首次被引时间距发表时间的长短作为评价的指标。但是这些评价指标的变形，立足点都默认了被引次数的滞后性事实，并不能弥补被引次数在评价短期影响力方面的缺陷。随着网络信息计量技术的发展和电子期刊的普及，越来越多的学术出版商开始提供科学论文的被浏览次数和被下载次数等使用数据。相比于被引次数2年左右的时间滞后，论文的被浏览次数和被下载次数具有实时性的绝对优势；并且，大量的研究证明一篇论文的使用数据，特别是其被下载次数与其后来的被引次数之间有着明显的正相关关系，于是被浏览次数和被下载次数开始作为一种替代型评价指标，在一篇论文发表初期代替被引次数来进行学术影响力评价。但浏览数据和下载数据用于论文学术影响力评价也存在许多争议。相比于被引次数，它们在反映学术影响力的权威性方面显得不够，就连被下载次数与被引次数之间是否真的存在正相关关系也有质疑的声音。不过，以被浏览次数和被下载次数为代表的使用数据极大地缩短了论文评价所需的时间，将影响力评价的起始时间向前推进到了论文发表后的极短时期内。 3 构建单篇论文评价体系的必要性不管是论文的学术影响力评价指标还是社会影响力评价指标，都有着自身的局限性，正是由于尚未出现一种足以全方位、无延迟进行论文评价工作的综合评价指标，导致为了弥补现有指标的缺陷而不断涌现出新的评价指标或改进方法，继而造成了目前评价指标臃肿冗杂的局面。日趋多样的评价指标不成系统地分散于论文发表后的各个阶段，何时、何种情况对不同的指标做出怎样的取舍，是对愈发庞杂的评价指标体系的一个严峻考验。需要明确的是，在当前的学术出版规则、论文写作规范、科学计量技术水平的条件下，不能寄希望于推出一种足以承担全部任务的单一评价指标。但是，现有的各项评价指标业已积累了丰硕的研究成果，它们的优劣长短、适用范围、时间效力等特征已经得到较为充分的论证和发掘，将现有各项评价指标进行综合的时机已经成熟。此外，电子期刊、数字图书馆和开放获取运动的蓬勃发展，使得每篇科学论文都可以实现单独的观测评价。在这种情况下，仍旧以整本期刊为评价单元，便丧失了提供一系列单篇论文评价指标数据的意义。所以，构建单篇论文评价体系将会是契合当今评价指标和学术出版行业发展趋势的研究方向。 3.1 社会影响力和学术影响力一样不容忽视被引次数、SCI收录和期刊影响因子是整个科学共同体内部量化论文学术影响力的准绳，Altmetrics系列指标则是衡量论文社会影响力的标尺，二者各自为政，任意单一指标都无法全面反映论文的综合影响力水平。而构建单篇论文评价体系的设想，立足于至今已经积累起来的关于各项评价指标的丰硕研究成果，深入考量各项评价指标的特点及效力，力图调和多个代表性的学术影响力评价指标和社会影响力评价指标，融学术影响、社会影响于一炉，通过单个体系最大限度完整地呈现出一篇科学论文在科学共同体内部和社会公众两个层面的影响力状况。 3.2 短期影响力和长期影响力需要双重兼顾被引次数测度的是论文的长期影响力，使用数据和Altmetrics数据更多地致力于反映论文的短期影响力。不同的评价指标数据不仅在评价长期或者短期影响力的侧重点上有所区别，甚至单个评价指标的数据量随时间变化的情况也不一而同，所以在使用某种影响力评价指标时，需要考虑当前的时间是否适用也要考虑该指标未来可能的变动，这将会导致对一篇论文进行评价需要持续跟踪多个指标的复杂困境。而单篇论文评价体系，在调和多项影响力评价指标的同时，将各项指标的最佳效力发挥时间、数据量的时间变化规律纳入体系框架内，统一了论文发表后的各个时间段使用何种指标数据以及不同指标数据所占权重的规则，通过单一评价体系兼顾了长期影响力和短期影响力的测度和评价。 3.3 评价结果的动态调整是更优解决方案当今大部分评价指标在单独评价科学论文的影响力时都具有动态的特性，例如被引次数、被下载次数、AltmetricScore等指标都会随着时间的变化而发生变化。即使是长期没有积累被引次数或社交传播次数的论文也有着变动的潜力和预期，这些评价指标的价值也正是基于它们的动态性。但是期刊评价体系、Web of Science收录规则抹灭了评价指标的动态性，致使评价质量大打折扣。而单篇论文评价体系的成果之一便是建立一个动态的科学论文数据库。唯有经过单篇论文评价指标体系筛选后的一定比例的高影响力论文才能够被收录到数据库中，更重要的是，数据库并非“一次收录即永久收录”，而是“择优收录、动态调整”。一旦某篇论文经过一段时间的洗礼后，其综合评价得分降低到不能进入数据库收录的比例范围之内，那么这篇论文将被从数据库中剔除，而前期表现不佳的论文如果在后期奋起直追，那么也有可能被重新考虑收录进数据库里。因此，虽然单篇论文评价体系的各项指标和指标权重是确定的、静态的，但是单篇论文评价体系的数据库却是动态的，评价体系与数据库实现了静态与动态的有机结合。 4 单篇论文评价体系的构建与实证研究 4.1 单篇论文评价体系的构建思路单篇论文评价体系以单篇论文为评价的基本单元，以论文发表后生命周期的不同阶段为时间线索，以代表性单篇论文评价指标为计量工具，以各指标赋权后的综合得分为输出结果，以动态调整的单篇论文评价数据库为实践形式，从单篇论文发表之时起，便对论文开展连续、动态、复合的追踪评价。单篇论文评价体系主要由两个部分构成。其一为单篇论文评价指标体系，其二为单篇论文评价数据库。在单篇论文评价体系之下，论文从发表一刻起往后的生命周期被分为四部分，涵盖了论文发表之后的短期、中短期、中长期和长期四个阶段。单篇论文评价指标体系选取了多种不同类型的评价指标，囊括单篇论文的学术影响力、社会影响力、长期影响力和短期影响力评价，部分具体评价指标如下所示： • 引用：被引次数（Web of Science/Scopus/Google Scholar） • 使用数据：摘要浏览、全文浏览或下载（html、pdf）等 • 网络采集：网页收藏、Mendeley读者数等等 • 网络讨论：评论、博客报道、媒体报道等等 • 社交媒体：转发、分享、推荐、点赞等等由于不同类型指标自身的特点，它们在论文的各个生命周期阶段发挥的效力也不尽相同。我们选择了PLOSComputational Biology 期刊2012年6月期发表的46篇论文作为跟踪对象，监测这一批论文在发表后5个月到发表后2年4个月之间的引用数据、社交媒体数据和使用数据变化情况，如图1所示。引用数据、社交媒体数据和使用数据分别以被引次数、社交媒体数据和被下载次数（为代表。根据图中三项计量指标的变化趋势可知，被引次数在论文发表后短期内数据量较少，因而在评价新发表论文影响力时效力暂时不足；但是随着时间的推移，被引次数数据量增长显著，在图1中三项计量指标之中被引次数的数据量增长幅度最大。在论文发表约两年后，被引次数已经积累了足够的数据量，可以在评价论文影响力方面发挥作用。而社交媒体数据和使用数据的时间变化趋势则与被引次数数据有着较为明显的区别。在论文刚发表的短时间内，社交媒体数据和使用数据就已经快速积累了较大的数据量，特别是使用数据的数据量在短期内已经相当庞大，远超这一阶段被引次数的数据量，这使得社交媒体指标和使用数据指标在论文刚发表后不久便可以对论文的影响力展开评价。值得注意的是，随着时间的推移，社交媒体数据和使用数据的数据量变化情况也显示出明显的差异。在论文发表后的两年多时间里，使用数据的数据量仍然呈现增长态势，但增长幅度不如被引次数的涨幅大。社交媒体数据量在其后的两年多时间里几乎没有发生什么变化，数据在短期内实现快速积累之后便基本持平。由此可见，被引次数在中长期和长期的论文影响力评价方面作用突出，但在短期和中短期内效果不佳；使用数据在短期和中短期内拥有丰富的数据量来开展论文影响力评价，但随着中长期和长期阶段被引次数权威效力的施展，使用数据的效力相对减弱；社交媒体数据在短期内能够迅速发挥作用，但是放眼中期和长期则鲜有显著变化，因而其发挥效力的阶段主要集中于论文发表后的短时期内。图1 论文的各项计量指标的时间变化趋势根据不同指标在各个阶段效力的大小可以比较出它们的相对重要程度，进而运用层次分析法确定出不同指标的权重系数。然后，根据各阶段单篇论文不同指标的得分结合权重系数，可以得出单篇论文的总得分。由于各阶段单篇论文不同指标的权重系数不同，并且不同论文因为质量有所区别而在各类指标的衡量之下有不同的表现，所以单篇论文影响力的变化将体现在四个阶段评价得分的上升、下降或持平中。根据各个阶段的总得分，同时期发表的一定学科领域内的所有论文可以根据分数高低进行排序，论文排名越靠前表明该论文在同时期发表的所有本领域论文中的影响力越高，每个阶段排名靠前的一定数量比例的论文可以被收录进单篇论文评价数据库中。如果某篇论文在第一阶段排名符合收录标准而被收录进数据库，但在第二阶段排名下降，不符合该阶段的收录标准，则该论文又会被从数据库中删除。通过这样的动态评价手段，能够保证数据库中收录的始终是各阶段影响力较高的论文。综上所述，构建单篇论文评价体系的研究思路如图2所示。评价指标体系的设计和评价数据库的建设共同构筑起了单篇论文评价体系的构建研究。第一部分的研究工作是设计评价指标体系。首先，遴选出代表性的计量指标，包括被引指标、社交媒体指标、使用数据指标和网络采集指标，涵盖对论文的学术影响力、社会影响力、长期影响力和短期影响力的评价工作；其次，将论文发表后的生命周期划分为四个阶段，覆盖论文的整个生命周期，保证评价体系的连续性；最后，通过各阶段各指标重要性的比较确定好各个阶段的指标权重体系，实现多样化计量指标的综合，保证评价体系的复合性。第二部分的研究工作是建设评价数据库。首先，针对评价指标体系选取的计量指标收集各阶段论文评价的元数据；其次，根据确定好的各阶段指标权重体系，计算出各阶段的论文评价数据；最后，基于论文评价数据得出综合评价结果，将各阶段符合收录标准的论文收录进数据库中，并遵循裁汰机制，保证评价体系的动态性。图2 研究思路 4.2 实证研究：各阶段单篇论文评价结果的动态比较为了更清晰地说明单篇论文评价体系的运作原理、论证其可行性，我们选取了被引次数、HTML浏览量、PDF下载量和Altmetrics系列指标的Facebook、Twitter、Mendeley、CiteUlike数据共7项计量指标。在这7项计量指标中，被引次数代表了对论文长期学术影响力的评价，HTML浏览量和PDF下载量这两项用户使用数据代表了对论文短期学术影响力的评价，其余4项Altmetrics系列指标则代表了对论文社会影响力的评价。由此构建起综合了论文多方位影响力评价的单篇论文评价指标体系。在上文图1中，我们比较了多种计量指标数据量随时间变化的趋势，并在其基础之上分析了不同计量指标发挥效力的时间阶段，由此可以判断出不同阶段各指标的相对重要性（如表1所示）。表1 四个阶段各指标的相对重要性阶段相对重要性 1 ( 发表0-6 月) PDF 下载 HTML 浏览 Twitter Facebook Mendeley CiteUlike 引用 2 ( 发表6 月-2 年) PDF 下载 HTML 浏览 Mendeley CiteUlike 引用 Twitter Facebook 3 ( 发表2 -5 年) 引用 Mendeley CiteUlike PDF 下载 HTML 浏览 Twitter Facebook 4 ( 发表5 年以上) 引用 Mendeley CiteUlike PDF 下载 HTML 浏览 Twitter Facebook 根据表1中的相对重要性，并且需要考虑指标之间的具体的相对重要性程度，利用AHP层次分析法，计算得到7项指标在四个阶段中不同的权重系数，如表2所示。至此，初步完成了构建单篇论文评价体系的第一部分工作，即设计评价指标体系。表2 四个阶段各类计量指标权重系数表 CiteUlike Mendeley HTML 浏览量 PDF 下载量被引次数 Facebook Twitter 阶段 1 0.0477 0.0477 0.1996 0.3901 0.0234 0.1109 0.1806 阶段 2 0.1723 0.1723 0.1182 0.2108 0.1321 0.0828 0.1116 阶段 3 0.1514 0.1514 0.0481 0.0921 0.3979 0.0644 0.0947 阶段 4 0.1269 0.1269 0.0455 0.0809 0.4819 0.0570 0.0810 在这一评价指标体系的基础上，我们可以开展实证研究以验证建设动态评价数据库的可行性，进而论证整个单篇论文评价体系的科学性。我们依旧使用PLOS Computational Biology 期刊2012年6月期发表的46篇论文作为跟踪对象，以检测评价方法和评价数据库运行的可行性。首先，我们收集了这46篇论文在前三个阶段内（2012年发表的论文尚未进入第四阶段）的数据，如图3所示。图3中列出了46篇样本论文的出版数据和计量指标数据，包括每一篇论文的DOI号、计量指标的收集日期（harvest date），以及7项计量指标的数据。并且，在本文作者的个人英文网站上（ http://xianwenwang.com/research/ale/index.html ），通过交互式的点击，可以在三个阶段（Phase 1、2、3）的原始指标数据（metrics data）和标准化数据（Normalized data）切换。图3 46篇样本论文在三个阶段内7项计量指标的元数据 http://xianwenwang.com/research/ale/index.html 对46篇样本论文7项计量指标的原始数据进行标准化处理，得到标准化数据以及在前三个阶段的综合得分，输出综合评价结果，如图4所示。图3和图4中最后一列的score为论文的综合得分结果。图4 数据标准化及综合得分 http://xianwenwang.com/research/ale/index.html 最后，根据各阶段的综合得分，可以对这46篇论文在每一阶段分别进行排序，三个阶段的论文排序变化情况如图5的交互可视化所示，详细展示结果见网站： http://xianwenwang.com/research/ale/dynamic.html 。图5 样本论文前三阶段的得分排名变化情况 http://xianwenwang.com/research/ale/dynamic.html 在网站的交互式界面上，鼠标悬停在每篇论文的doi号或者曲线上方，选中的论文即会加亮显示，并且会弹出该篇论文在每一个阶段的综合得分结果和排序情况。红色曲线表明排名上升，绿色和黄色分别表明排名下降和不变，可见绝大部分论文在不同阶段排名都有显著的变化，有的论文甚至实现了颠覆式的逆转，可见单篇论文评价体系之下，论文的综合影响力在各阶段的变化情况被清晰地捕捉并且呈现出来，初步验证了单篇论文评价体系和评价数据库的可行性，这一研究结果被科学计量学权威国际会议ISSI2015全文录用。 5 结论与研究展望 5.1 研究结论针对目前学术评价中以期刊影响因子进行单篇论文评价、忽略成果的社会影响力、无法利用被引次数对新发表论文进行评价等诸多问题，本研究基于论文的学术影响力和社会影响力、短期影响力和长期影响力等多重维度，构建出连续、动态和复合的单篇论文评价指标体系和评价数据库，并且开展了对科学论文的实证评价研究。研究结果证实了本文提出的单篇论文评价具有可行性。 5.2 研究展望（1）优化评价指标体系无论是被引次数、被下载次数等学术影响力评价指标，还是Altmetrics系列社会影响力评价指标，都属于外在的后验型评价指标，均是外界对科学论文发表一段时期之后的外在评价。除了这些外在指标之外，论文的内在指标也值得考虑。内在的先验型评价指标是指论文在发表之时便已经具备的、无特殊情况不会随着时间的推移而发生变化的特征与属性因素，例如论文的合作作者数、机构数和国家数、全文长度、图表数、公式数、参考文献数、普赖斯指数、发表期刊的影响因子、论文作者过去的影响力、结构变异指数等等，这些因素是新发表论文“与生俱来”的真实价值的载体，发表之后便不受外界主观因素的干扰。外在指标数据采集相对容易，内在指标数据收集难度较大，有的指标还需要经过复杂计算。论权威性，以被引次数为代表的外在评价指标的效力和科学共同体的接受程度都要强于内在评价指标；但是论时效性，伴随论文发表即时产生的内在指标数据则相对较强。因此单篇论文评价体系未来的研究方向可以致力于实现内在指标和外在指标的兼容并蓄，通过即时的内在指标评价做出初步的判断，继而接受时间的检验再做出较为准确的定量评价，从而将评价体系在时间维度上实现完全覆盖，容纳论文从发表一刻起的整个生命周期。（2）增强指标权重体系的科学性在各阶段计量指标体系的确定过程中，首先涉及到在4个阶段对各指标的相对重要性进行判断，在前期预研中我们形成了一个初步判断结果，在未来的深入研究中，我们将采取专家打分对各项指标相对重要性程度继续完善。（3）扩大实证数据覆盖范围在目前的实证研究中，我们选择PLOS的数据作为研究对象。未来，我们计划将研究对象扩展到其他主要学术出版商和期刊，包括Springer、Nature及系列子刊、Science、PNAS等等。这些出版商和学术期刊均已经开始面向公众提供论文被下载的数据和altmetrics数据等。在今后的研究中，还将逐步扩大到更多的学术出版商和期刊，以期在更广泛的数据范围内验证单篇论文评价体系的普适性、可行性和科学性。（4）对其他科技成果评价的扩展单篇论文评价体系的评价对象是科学论文，而单篇论文评价体系的思想则可以扩展到对于其他多种科技成果的评价工作中。这种扩展既包括单一评价指标的跨界运用，也包括对多种指标进行有序综合的思想的扩散传播。例如，对著作的评价，可以采用的指标包括被引次数、电子版下载次数和销售量、纸质版销售量、亚马逊星级评分、altmetrics等；以及对专利的评价，指标体系包括被引次数、专利家族、技术周期时间、Altmetrics、普赖斯指数等。目前来说，Altmetrics仅能够对科学论文进行社交媒体的数据收集和得分计算，这一思想还没有应用到专利的评价上，但是借鉴Altmetrics对科学论文的评价思想，开展对专利的Altmetrics评价也是可行的。例如，苹果公司申请的关于iphone手机新摄像头的专利“Digital camera with lightsplitter”（专利文件号为8988564）的相关新闻被多个媒体报道，仅知名科技网站techcrunch的报道就被社交媒体转发774次。和科学论文一样，技术专利在社交媒体中引发的反响也可以作为技术的社会影响评价，进而体现专利价值的一项指标。在此基础上，倘若各项指标的评价效力、数据量、适用范围等条件符合体系化的标准，那么将有助于更好地做出科技成果的单篇层次评价。参考文献 Priem J, Taraborelli D, Groth P, Neylon C. Altmetrics: Amanifesto. In (Vol. 2014) . http://altmetrics.org/manifesto. Wang X, Mao W, Xu S, et al. Usage history of scientificliterature: Nature metrics and metrics of Nature publications .Scientometrics, 2014, 98(3): 1923-1933. Adie E, Roe W. Altmetric: enriching scholarly contentwith article-level discussion and metrics . Learned Publishing, 2013, 26(1):11-17. de Winter J C F. The relationship between tweets,citations, and article views for PLOS ONE articles . Scientometrics, 2014,102(2): 1773-1779. Neylon C, Wu S. Article-Level Metrics and the Evolution ofScientific Impact . PLoS Biology, 2009, 7(11): e1000242.doi:10.1371/journal.pbio.1000242. Lane J. Let's make science metrics more scientific .Nature, 2010, 464(7288): 488-489. e Costa C A B, Oliveira M D. A multicriteria decisionanalysis model for faculty evaluation . Omega, 2012, 40(4): 424-436. Handel M J P. Article-level metrics–it's not just aboutcitations . The Journal of experimental biology, 2014, 217(24): 4271-4272. 张静 . 引文 , 引文分析与学术论文评价 . 社会科学管理与评论 , 2008, (1): 33-38. Watson A B. Comparing citations and downloads forindividual articles at the Journal of Vision . Journal of Vision, 2009, 9(4):i. Alberts B. Impactfactor distortions . Science, 2013, 340(6134): 787-787. Bordons M, Fernández M T, Gómez I. Advantagesand limitations in the use of impact factor measures for the assessment ofresearch performance . Scientometrics, 2002, 53(2): 195-206. Garfield E. The history and meaning of the journal impact factor . Jama, 2006, 295(1) : 90-93. Opthof T. Sense and nonsense about the impact factor . Cardiovascular research,1997, 33(1) : 1-7. PLoS_Medicine_Editors. The impact factor game . PLoS medicine, 2006, 3(6) : e291. Seglen P O. Why the impact factor of journals should not beused for evaluating research . Bmj, 1997, 314(7079): 497. Priem J, Groth P,Taraborelli D. The altmetrics collection . PLoS ONE,2012,7(11): e48753. Thelwall M, Haustein S, Larivière V, et al. Doaltmetrics work? Twitter and ten other social web services . PloS one, 2013,8(5): e64841. Shuai X, Pepe A, BollenJ. How the scientific community reacts to newly submitted preprints: articledownloads, Twitter mentions, and citations . PLoS ONE, 2012, 7(11): e47523. Eysenbach G. Can tweets predict citations? Metrics of socialimpact based on Twitter and correlation with traditional metrics of scientificimpact . Journal of medical Internet research, 2011, 13(4). Davis P. Tweets ,andour obsession with alt metrics . The Scholarly Kitchen, 2012, http://scholarlykitchen.sspnet.org/2012/01/04/tweets-and-our-obsession-with-alt-metrics/ Haustein S, PetersI, Sugimoto C, Thelwall M, Larivière V. Tweeting Biomedicine: An Analysis ofTweets and Citations in the Biomedical Literature . Journal of theassociation for information science and technology, 2014, 65(4):656-669. Van Noorden R. Twitter buzz about papers does not meancitations later . Nature News ,doi:10.1038/nature.2013.14354 王贤文，刘趁，毛文莉 . 数字出版时代的科学论文综合评价研究 . 中国科技期刊研究 , 2014, 25(11): 1391-1396. Kosmulski M. Successful papers: A new idea in evaluation of scientific output .Journal of Informetrics, 2011, 5(3): 481-485. Bornmann L, Daniel H D. The citation speed index: A useful bibliometricindicator to add to the h index . Journal of Informetrics, 2010, 4(3):444-446. 刘春丽 . Web 2.0 环境下的科学计量学：选择性计量学 . 图书情报工作 , 2012, 56(14): 52-56, 92. Lippi G, FavaloroE J. Article downloads and citations: Is there any relationship? . Clinicachimica acta; international journal of clinical chemistry, 2013, 415: 195. O'Leary D E. Therelationship between citations and number of downloads in Decision SupportSystems . Decision Support Systems, 2008, 45(4): 972-980. Jahandideh S,Abdolmaleki P, Asadabadi E B. Prediction of future citations of a researchpaper from number of its internet downloads . Medical hypotheses, 2007,69(2): 458-459. Coats A J S. Top of the charts: download versuscitations in the International Journal of Cardiology . International journalof cardiology, 2005, 105(2): 123-125. Wang X, Fang Z, Yang Y. Continuous, Dynamicand Comprehensive Article-Level Evaluation of Scientific Literature . arXivpreprint arXiv:1411.7004, 2014. Didegah F, Thelwall M. Determinants of research citation impact in nanoscienceand nanotechnology . Journal of the American Society for Information Scienceand Technology, 2013, 64(5): 1055–1064. Natsuo O, Fuyuki Y. Factors affecting citation rates of research articles .Journal of the Association for Information Science and Technology, 2015, 66(4):739-764. Chen C. Predictive effects of structural variation on citation counts .Journal of the American Society for Information Science and Technology, 2012,63(3): 431–449. PengT Q, Zhu J J H. Where you publish matters most: A multilevel analysis offactors affecting citations of internet studies . Journal of the AmericanSociety for Information Science and Technology, 2012, 63(9): 1789-1803. 胡小君 , 陈劲 . 基于专利结构化数据的专利价值评估指标研究 . 科学学研究 ,2014, 32(3): 343-351. 作者按：本文已经被国家自然科学基金委员会管理科学重要学术期刊《科学学与科学技术管理》录用。关于这篇论文的详细实证研究于 2014 年 12 月投稿至科学计量学权威国际会议第 15 届 ISSI 会议，被全文录用。英文论文下载地址： http://arxiv.org/abs/1411.7004 王贤文-连续、动态和复合的单篇论文评价体系构建研究.pdf; 个人分类: 论文|8042 次阅读|4 个评论

合理社会综合评价体系构建: lbjman 2014-1-2 19:39; 从上传到执行，是需要过程和时间的。。。。。。。。。; 38 次阅读|0 个评论

[转载]致工管院的朋友们及湖南大学教研同仁的一封信湖南大学杨飞: ajygz 2013-10-10 10:19; 致工管院的朋友们及湖南大学教研同仁的一封信（转发）湖南大学杨飞各位朋友和领导，今年7月，学校通知我不予续聘，原因是过去两年我没有完成科研任务：没有在任何杂志上发表论文。人事处拟让我转任图书管理员。这是个好事。我喜欢书，也很高兴能为喜欢书的大学生们服务。不过，从7月到现在，不断有同事和朋友询问我转岗的原因。此事说来话长，我干脆利用国庆假期写点文字解释一下。工商管理学院130多位老师，我是唯一被转岗的。湖南大学两千多老师，这次转岗的也只有七人。按某些同事的理解，这是给工商管理学院丢脸了。说实话，湖南大学对讲师的科研任务要求很低，两年发表一篇论文即可，而且对期刊等级没有要求。理论上说，在《读者》或任何野鸡杂志发表都行。众所周知，在二流杂志上发一篇论文，只要给点钱（版面费），那实在是易如反掌，很多本校学生都干得比我强。为啥我不去干？科研不合格意味着饭碗不保，难道我不知道其严重性？作为一个10多年来战斗在管理学、经济学和金融学教学第一线的任课老师，这么简单的事都干不来，最后导致下岗，很多同事觉得不可思议。不瞒你说，我自2002年离开企业界来湖南大学教书，十多年来没有公开印刷发表过任何科研论文，也没有申报任何级别的科研项目。说我科研工作不合格，确实名至实归。但是，不发论文并不说明我没干科研。正相反，我在低碳经济学研究领域投入了大量的时间和精力，数篇论文成果也早已在我自己的网站和微博上公布。但为啥不申请项目课题，也不去期刊发表？个中缘由，乃是出于我自己的“三个凡是”原则： 1 ，凡是行贿受贿的事，再小也不能干； 2 ，凡是不属于自己应得的钱财，一分钱也不能拿； 3 ，凡是没有流传价值的东西，再短也不应该印刷出来。下面分别谈谈以上三点，并说明一下我多年来从事的“地下”科研工作，最后提几点对高校科研工作的个人建议，大家砸砖。先说说1，凡是行贿受贿的事，再小也不能干。早在今年3月，学院领导就通知我必须在5月之前发表一篇论文，否则岗位不保。虽然鄙人的两篇低碳经济研究论文还待完善，但为了饭碗，我还是联系了好几家杂志。情况是，每家都说发表没问题，但都得先交钱（版面费），从一千到数千元不等。因为我要在两个月之内发表，加急还得另外加钱。最让我诧异的是，有编辑居然电话暗示要给点个人好处。千言万语我可以总结一句话：要发论文，没钱免谈。针对我的批评，有位老师说：你不发表论文已经多年了吧，不知道学术文章现在都是要交钱的吗？这不是潜规则，这已经是明规则，大家都是这么干的。我觉得话不能这么说，大家都这么干不见得就合法。贪污腐败横行中国，是不是因为干的人多了，就合法了？现在有一件事，不给钱怎么也办不成；一旦给钱，达不到要求也能给你办了。如果这还不算行贿受贿，那我就不知道什么叫行贿受贿了。而这正是很多学术期刊的办刊现状。我要提醒诸位，国家新闻出版总署早在2000年就发布了《关于禁止收费约稿编印图书和期刊的通知》，明文规定任何出版单位不得以任何名义向供稿人和单位收取任何费用，一经发现，将严肃处理。2002年颁布的《出版管理条例》，2005年颁布的《期刊出版管理规定》，都作出了明确的禁止性规定，任何单位都不得“约稿收费”“出卖、出租版面”。本人坚决支持新闻出版署的规定。作者倒给钱给出版商，这是哪门子逻辑？工管院的老同事都知道，我业余爱好摄影和写作。十多年来，我的图片和文字作品发表了一大堆，从地方报纸、航班杂志到国家地理，每次都是我坐在家里收钱。从哪一年起，作者给杂志社投稿，把自己的劳动成果交出去，还要倒给钱？这明显违背了著作权法，违背基本的逻辑。事实很明显：版面费既不合理也不合法，它是不折不扣的索贿受贿行为。有编辑朋友曾辩解说学术期刊发行量不够，学术杂志社理论上属于非盈利性机构，不收费无法生存。这毫无道理。我从来没有听说过强制收费的非营利性机构。期刊收费，直接证明了其就是盈利性的。非营利性组织只能靠财政拨款以及自愿捐款来支持。如果混不下去，干脆关门好了，改为电子出版不行吗？不要当了婊子还立牌坊，强制收费还说自己非营利性。再说了，学术期刊也受新闻出版总署管辖，通俗期刊不准收费，学术期刊难道可以例外？有朋友曾劝我，不就几千块钱吗，吃饭唱歌一晚就没了，都还不够你的汽车买个保险，事关饭碗，你就不能变通一下？我实话实说，这二十年来，我没有妥协的传统。中华民族传统古训有句话：勿以恶小而为之，勿以善小而不为。面对歪风邪气，每个人都要坚决抵制。从自己做起，从小事做起，小学老师不是这么教导大家的吗？我要再次明确态度：事无论大小，钱无论多少，凡是行贿受贿，对不起，一分钱也别想从我这里得到。我愿意再举个小例子。2004年我在岳阳考驾照，考场三令五申严禁收受任何现金或礼品，违者严惩。但头天晚上我们组还是决定凑钱每人买一包蓝色软包芙蓉王，第二天装在塑料袋里带上考试车，据说这是岳阳考场的潜规则，别的组都买了。大夏天挥汗如雨一起练车一个多月，我真的不想得罪本组朋友们。一包烟70块钱实在事小，但它违反了我的原则。最后，我是本组考生中唯一一个没买烟的。每个人都在抱怨行贿受贿，从驾校、医院到学校，没有一个人愿意送烟，送红包，没有一个人愿意交版面费，但是，一旦涉及到具体的事，涉及到自己的利益，基本没人敢站出来说不。这就是中国的现状。“大家都这么干的，我也是没办法”，满大街都是这样的托辞，这个社会只会越来越黑。金钱与学术赤裸裸的交易，吞噬了国家财政，加剧了学术腐败，败坏了社会风气。学界目前的情况，和高校的每位师生都脱不了干系。现在的校园里，代办论文的广告已经泛滥成灾，在岳麓山的大树上，在教员休息室里，在大学的停车场上，在打印社的门边，在每个老师的信箱和电子邮箱里。“版面费”、“加急费”、“增刊费”等等收费名目，使发表学术论文变成了一条黑生产线。这些广告有少数骗子，但更多的是诚信经营的，有的还只交定金，发表之后再付全款。学校打印社的小妹都很热心的介绍这些诚信期刊，而且包开发票，要发哪里发哪里，妈妈再也不用担心我的论文了，呵呵。少数期刊编辑和论文贩子掌握了大多数高校师生的命运，这不是个笑话吗？根据武汉大学副教授沈阳的团队2010年1月研究结果，我国买卖论文已经形成产业，销售额达到l0亿元。这还只是保守估计，有的估计为20到30亿元。这绝不是无中生有。有学生毕业后告诉我，很多毕业论文就是在淘宝上买的。我很高兴离开教学岗位，原因之一就是终于可以不指导本科毕业论文了。大部分本科毕业论文质量极其低劣，很多就是抄的买的。我呼吁过多次取消本科毕业论文。一个假东西，从学生、教务、系部到学院，大家都玩得那么high，活生生的皇帝新衣再版。 2 ，凡是不属于自己应得的钱财，一分钱也不能拿；不发表论文可以理解，为什么我不也申报科研项目？兄弟我一直认为，就人文社科研究来说，重大成果不是靠钱堆出来的，人文社科研究只需要敏锐的观察与独立的思考。如果花钱上项目就能搞出重大科研成果，那阿拉伯酋长和山西煤老板早就是是全世界最学术的人了。除非需要请人做问卷调查，否则申请了一笔项目经费我也不知道怎么花。假如搞来几万元乃至几十万元，最后该如何在财务处报账？个人开支若以科研经费报销，此种行为形同偷窃，应为广大高校师生所不耻。本人一直独立从事低碳经济学研究。几年来，我没发现有地方需要花钱。图书馆是免费的，办公室互联网是免费的，我的研究资料都来自这两个地方。没处花钱，我申报项目干啥？更正一下，我自己还是花了一点钱的。举个例子：所有的低碳经济学研究都有一个重大前提：全球气候正在变暖。这是一个有争议的话题，但又是最重要的前提，说得不好听一点，如果气候变暖被证伪，所有的低碳研究成果立马变废纸。本人是气候学外行，为了快速掌握气候学知识，让自己的论文有理有据，我打印装订了联合国政府间气候变化专门委员会（IPCC）《2007气候变化综合报告》，全文好几百页，我一页一页仔细读过并做了眉批。一点打印费，我懒得去麻烦报销。不知道诸位注意到了财务处报账规则的变化没有？从去年开始，学校财务处规定火车票只有往返的才能报销，遭致大家一片怨言。财务处也是没办法，因为已经堆积了太多子乌须有的单程车票以及各种莫名其妙的单据。兄弟我一直认为，非科研开支以科研经费报销，这就是偷窃。一方面财务处的科研账务一地鸡毛，另一方面，我花着自己的时间（和钱）搞研究，此种行为应该算得上科研活雷锋吧？然而我却被学校认定为科研不合格，这个逻辑在哪里？我觉得湖南大学应该推广科研雷锋精神，少上项目，给国家节约经费，把经费让给更需要的同事。大家都知道，高校现在变成了“项目化生存”，直接的经济利益都在于项目。某院长曾说，现在这么抢（项目），我们也知道不好，可是如果你不抢，你连吃屎都吃不上热的！即使不为个人，为了你所在的集体，你也不得不抢，这是一种恶性竞争。关键在于如何拿下项目，至于拿下来后怎么结项，是很容易的事情。我不愿意谴责湖南大学太多。归根到底，中国的学术腐败，教育部是最大的发动机。正是它各种各样的评价体制（和项目审批），一方面导致了权力寻租，一方面导致大多数学者都落入了体制性圈套，为争夺眼前利益疲于奔命，急功近利，全然不顾个人、学校和学科的长远发展，乃至走上违法犯罪的道路。 3 ，凡是没有流传价值的东西，再短也不应该印刷出来。这里的流传价值，主要指以下三点： A, 经得起时间考验； B ，对学科有重大突破； C ，对社会发展（百姓生活）有重大贡献。经得起时间考验意味着几年，几十年甚至百年后，你的成果依然被人重视。目前大多数科研成果，别说几十年，绝大多数论文印出来立马就没人看，平均阅读人数小于7。不要说外人，本校同行都懒得瞟一眼。很多论文是典型的copy and paste，充斥着一些前无古人后无来者的新名词。在我看来，如果不能用简明易懂的语言将一个概念解释清楚，十有八九是自己没有真正搞懂它，或纯属装B。这个社会垃圾信息已经泛滥成灾，作为社会文化先锋的高校师生，不应再为这座垃圾大厦添砖加瓦。有朋友在饭局时对我的观点表示疑问：你怎么知道某论文某书几十年之后不会成为经典？经得起时间考验的标准在哪里？well，未来当然不可知。但是，高校老师乃精英人士，学科精通，某篇论文某本书有几斤几两，自己应该心中有数。鄙人愚见，目前中国高校科研状况一地鸡毛，以论文和项目数量论英雄。高校科研大跃进已经将中国推上了世界第一论文大国（发表数量）和第一书籍出版大国的位置，但是，中国哪几个学科达到了世界顶尖水平？我所看到的是抄袭和造假肆虐，枪手和论文贩子横行，从院士评选到讲师晋升，都在玩虚的。有学者认为中国学术研究已经到了崩溃的边缘，鄙人相当同意。我之所以不发表任何不成熟的论文，还出于本人一个严重教训。本人业余爱好摄影和写作，2006年我的第一本长篇小说《滇藏星空》在北京出版。当时我挺高兴的，但此书今天再看我冷汗直冒，内容及写作手法都极显幼稚，恨不得就地销毁，可是数千本已在读者手里和图书馆里，如何是好？这垃圾现在变成了我自己的一个笑柄。我决定退休之前不再印刷出版任何作品，以免将来再次后悔。真正的好作品陈年愈久愈显价值，但凡垃圾，堆积再多也是一滩破烂。请换位思考，作为读者，你在书店和阅览室翻阅那一堆堆垃圾时做何感想？各位兄弟姐妹，提笔之前要牢记，浪费读者的时间等于慢性谋杀。任何公开印刷发表的东西，须慎之又慎。造纸业是地球上污染最大的行业之一，图书馆里堆积如山的垃圾论文和书籍是对环境最大的破坏。本人是一个铁杆环保主义者。我顺便提一下湖南大学一个很不好的传统：自产教材。这也是学生吐槽最多的。我总是在想，如果每个学科只能选几本经典教材传世，有几本能出自湖南大学？除非确信能胜过公认的经典著作，否则我建议诸位老师不要轻易浪费宝贵的纸张。我妈妈是中南大学退休教授，教了一辈子高等数学，桃李满天下。她也编过教材发过文章，但谈到对数学的贡献，她想了半天告诉我，还真没有。我认为她的教材和论文都是白忙乎，浪费了自己的时间，浪费了宝贵的社会资源。我不想再重复我妈妈的做法。补充一点，不随便出版并不是说高校教师都不要写讲义。我的《国际金融》讲义已长达十万字，本身就是一本书稿，但目前我并无出版打算。在目前的科研考核机制下，我其实可以理解诸位老师为啥要奋发写教材发论文，人都要吃饭不是？不过，钱够吃够用就好，作为高校老师，要耐得住一点寂寞和清贫。2002年我离开银行界来教书，就没多想过赚钱的事了。我在湖南大学的薪水，连投行同学的零头都不到。但是，湖南大学给了我丰富的图书资源和时间，让我能从事自己喜欢的研究工作。搞学问不是为了发财。淘宝开店，山西挖矿，哪个不比学校来钱快？每年发表一堆没人理的文章也许会换来一些奖金、职位或教授的头衔，但几十年后在学界没有任何人会记住你的名字。人生短暂，我若如此，到老一定追悔莫及。人是要有一点理想的。我们需要为什么样的人生而奋斗，这是一个巨大话题，我并不打算在这里展开。但有一条可以肯定，我不太注重目前立即的利益和好处，我一直强调经得起时间考验。这就要求我们出版的东西必须是精品，不管是期刊短文还是长书大作。急功近利，快速得来的东西一般都不是啥好东西。现在高校的年度考核，逼得每人每年都要出研究成果，结果无可避免：绝大部分是垃圾。我无论如何也不能这么干。人生成功无否，不是看你得到多少，而是看你贡献多少。这是我的座右铭，与诸位共勉。我之所以懒得去追逐大家都喜欢的职称和项目，原因正在于此。现在默默无闻甚至穷困潦倒我都不那么在乎。如果在我死后几十年，上百年，还有人在图书馆找我的著作，那就达到了我人生最大的目标：我总算为社会，为他人有所贡献。基于以上“三个凡事”，我11年没有印刷发表任何论文，也没有申报任何科研项目。不过，这并不意味着我没有从事研究工作。下面我简单介绍鄙人五年来从事的“地下”科研工作情况。从2008年起，我的研究方向是能源与低碳经济学。我没有申请项目，也没有团队，本人独立完成并在自己的网站上发表了两篇论文，《对全球气候变暖的综合分析》以及《论一切低碳经济学都是纸老虎》。我的基本观点：目前的主流低碳经济研究和所谓的绿色能源都是皇帝的新衣，说简单点，都是蒙钱的主，基本属于搞诈骗的。（鉴于篇幅，此处不做表述，详见我论文分析）但是，2008年开始，中央和地方政府开始强行推进太阳能和风力发电产业。我通过自己的论文（及其他方式）表达了强烈质疑。多晶硅的制造正是污染最大的行业之一。抛开环保不谈，让我们只谈钱，在实验室里都还没有达到起码的经济效益，就开始大规模工业化生产，纯属瞎搞。这种政策的逻辑在哪里？再举个电动汽车的例子，这也正是目前政府强力补贴的产业。表面上看电动车确实够绿色，但系统地看，从发电量增加的污染，动力电池的制造和回收，如果汽车全变成电动的，我预计将是更大的环境灾难。离开了国家的巨额财政补贴，新能源产业一天也活不下去。你可以小范围短时期大量补贴，但可能长时期大范围大补贴吗？这种盲目发展的政策，坑害了国家财政，肥了少数利益相关者。具体是哪些人从中获得了巨大利益，我在这里暂不点名。少数人赚得盆满钵满走了，留下一个巨大烂摊子。新能源产业2012年陷入了全面危机。2013年3月，中国太阳能领军企业无锡尚德宣告破产，71亿元的政府指令性银行贷款直接烂帐。其他大型新能源公司如华锐风电和江西赛维也都陷入了裁员减薪的困境。但各级政府依然在变着法子力挺新能源产业。各位兄弟姐妹，这里我愿再次强调，以目前的技术水平，太阳能和风力发电为代表的新能源产业是一个吞噬国家财政和百姓资产的无底洞。 2013 年5月某天，系里聚餐欢送一位老师去中科院工作，她正好在中科院从事低碳经济研究，而且他们研究所有一本相关专业刊物。我问能否把我的论文带去投稿。沟通了半天，她说：你这种论文是不可能发表的，中央已经决定继续推进新能源产业，我们中科院只研究如何推进中央的决策。听到这句话，我只能说，中科院低碳研究已死，有事请烧纸。中科院这种所谓的研究已经背离了学术争鸣的基本准则，变成了决策者的马屁精，上面有什么样的政策，马上就上项目为其歌功颂德。这可以理解，中科院是国家拨款的。拿人钱财，替人消灾。但是，作为知识分子，还是需要有一点骨气、良心，以及基本的治学素养，不是吗？　复旦大学的陈尚君老师曾评论现在的各种所谓学术计划与学术工程：“现在折腾许多的名义，不愿意从面上普遍提升教师的薪资，说穿了还是一种急功近利的行为。同样的钱，普赐民爵一级，没有显著的效应，必要堆成一个塔尖，让极少数所谓精英得到，追求轰动效果。其实这正是中国教育或学术失败的根本。当代无神仙，大牌拿去还得雇人操刀，最后是集体平庸或造假。” 鄙人愚见，1980年代以来，全世界科学发展已经进入了瓶颈阶段，数学、物理和化学界三十多年基本没有重大突破，经济学等应用科学相对好一点（如果经济学可以算作一门科学的话），但发展速度也慢了下来。其他人文学科我就不说了，文学哲学之类的东西，根本不是可以研究出来的，也根本不是花钱上项目就可以搞出成果的。与科学发展逐渐减速相反，全球各国大学的科研要求却年年在加码。教师要年年出成果，大学也是年年新排名。这样一来，大家除了造假，已经别无选择了。学术造假是世界性问题，只是中国人更加厉害一些。兄弟我是教金融学的。金融理论说一千道一万，可以总结五个字：快速钱生钱。从期货、期权到CDS等高级金融衍生工具，从1980年代到现在，金融业（及其理论）发展速度惊人。但本人的金融学讲义认为，这几十年来金融业的道路是彻底错误的。2008年危机以来的情况大家都看到了，本应该帮助实体经济成长的金融业，变成了祸害实体经济的罪魁祸首。金融业正在损害大多数人的利益，帮助少数人快速致富。金融业目前这种情况乃是整个社会急功近利的缩影，这是一个急功近利的社会。快点把现金搞到手最重要，坑蒙拐骗在所不惜。理想这两个字已经是一种奢侈品。 “不能让孩子们输在起跑线上”之类的广告词比比皆是。个个争先恐后，唯恐不能快速发财。这种急功近利的思潮反映到高校科研工作中，其结果就是一窝蜂的高校科研大跃进。科学研究并不是每个人都可以搞的。干哪一行都需要有点天份才行。鄙人愚见，50%以上的大学老师不具备从事学术研究的基本素质，他们完成教学任务已经很不容易了，还要每年出版论文，除了造假和花钱买，他们还有别的办法吗？目前高校强逼人人搞科研，和1958年人人大炼钢铁的阵势差不多，最后一地鸡毛，误国，害人，害己。有鉴于此，本人有如下几条建议： 1 ，应再次重申新闻出版总署的规定，出版单位不得以任何名义向供稿人收取任何费用。有偿发表文章应定性为索贿受贿行为，立法予以严惩。高校师生要联合起来，抵制任何收费的杂志社，抵制任何论文中介行为。 2 ，教育部应取消70%以上的各种学术工程和学术项目，省下钱来提高教研人员的普遍待遇。 3 ，凡论文抄袭和造假，当事人一律开除。 4 ，严禁科研经费用于非科研开支，违者一律开除，并报司法机构。 5 ，高校人事考核制度一般不得包含论文数量指标，特别是人文社科专业。 6 ，对少数坚持要求论文数量的高校（专业），应该鼓励无门槛的无纸化论文发表体系。建议由教育部牵头设立全国科研论坛，任何人均可在论坛上注册，自由发表文章。博客、微博以及其他社交工具发表论文均可，只要证明该文章属本人原创。国庆短暂，文字仓促，诸位请多砸砖。杨飞， 2013/10/4 PS ，结束本文时，刚巧看到台北新闻，2013年度“晨兴”数学奖颁给了美国新罕布什尔大学张益唐讲师。张益唐先生年界六旬，在新罕布什尔大学默默无闻教数学几十年，没有发表什么论文，只是普通讲师。2013年5月，张益唐在《数学年刊》（Annals of Mathematics）发表题为《素数间的有界距离》一文，证明了存在无数多素数对，并且每一对素数之差不超过七千万。2013年5月，《Nature》杂志报导了此重大成果。在丘成桐教授的邀请下，张益唐先生日前在哈佛大学给数学界人士做了相关专题讲座。张益唐讲师是长期淡泊名利“真正做学问”的典范。兄弟我真心希望国内科研制度能有所改观，大家不用年年为蝇头小利奔忙，社会腐败之风也能有所遏制，诸位同仁能在有生之年为学科和社会做出真正的贡献。附短文两篇。欢迎砸砖：; 2567 次阅读|0 个评论

[转载]某省高考材料作文:小鸟飞越太平洋: 热度 2 mathmhb 2013-6-14 20:38; 我的阅读提示： 1、傻鸟不傻，悲的是造出傻鸟的人和被面对傻鸟的人。 2、同样的题目，如果允许开放式答题，亦可选出人才。 3、最重要的是学会独立思考，而不是只背诵标准答案。 4、科学思辨与人文素养相得益彰，但人们都置之不顾。某省高考材料作文:小鸟飞越太平洋　　阅读下面的材料，根据要求作文。　　有一种鸟，它能够飞行几万公里，飞越太平洋，而它需要的只是一小截树枝。在飞行中，它把树枝衔在嘴里，累了就把那截树枝扔到水面上，然后飞落到树枝上休息一会儿，饿了就站在树枝上捕鱼，困了就站在树枝上休息。谁能想到，小鸟成功地飞越了太平洋，靠的却仅是一小截的树枝。　　试想，如果小鸟衔的不是树枝，而是把鸟窝和食物等所有的用品，一股脑儿全带在身上，那小鸟还飞的起来么？　　根据上述材料作文，要求自定立意，自拟题目，自选文体（诗歌除外）；不要脱离材料的内容及做含意范围作文，不少于800字。　　一考生零分答卷：　　《我不相信傻鸟的道理》　　作为一个理科生，我看到这个题目的时候，立刻石化了。　　我很想抽人！很想狠狠地抽命题老师一巴掌——代表我的物理老师。让一只鸟，叼着树枝飞太平洋——什么样的极品智商才能编出这样的故事呢？我不知道命题老师的鸟，是如何威猛，是如何神奇。一个正常人的思维却让我不得不怀疑一些东西。我不跟你计较，一个叼着树枝的鸟，如何跟同伴打情骂俏；我不跟你计较，一个不会游泳的鸟，如何踩着树枝捕鱼；也不跟你计较，太平洋的海浪会不会打翻树枝。我只问你一个问题：你知道，究竟多大的一根树枝，才可以让一只鸟浮在水面上。铁丝一样粗的？筷子那样粗的？找抽的命题老师，请允许我教给你一个关于浮力的公式，如果你想让一块木头能载动一只鸟，那么需要符合如下条件（出于对您智商的尊重，我不使用各种字母）：木头产生的浮力须大于木头本身的重力+鸟的重力。为了能让木头发挥最大的作用，我们假设木头可以被完全踩到水面以下。那么可以得出这样的结论：水的密度×木头的体积×重力加速度-木头的密度×木头的体积×重力加速度-鸟的质量x重力加速度，合并同类项并简化之，得出：木头的体积×（水的密度-木头的密度）-鸟的质量　　水的密度约为1000千克/立方米，而木头的密度在400-750千克/立方米之间，我们权且当这个鸟很聪明，找了比较轻的一种，木头的密度按500千克 /立方米算。可得出：500x木头体积必须大于鸟的质量，就是这样的结论：如果鸟是1公斤重，那么，木头的体积必须大于1/500立方米即0.002立方米=2立方分米。　　2立方分米什么概念呢？——我们常见的砖头，大约两块！！！一公斤的鸟什么概念呢？这么说吧，普通的母鸡一般三四斤重，一公斤重的也就是只小雏鸡。一只小鸡那样大小的鸟，衔得动两块砖头大小的木块或者说是一个胳膊粗细的木棒吗？就算可以，风对木块的阻力，也会让鸟儿飞到大西洋，而不是太平洋的。　　命题老师可能会说他的鸟大，鸟大分量也重啊！那可能要衔的就不是胳膊粗的木棒了，而是一根柱子了。　　总之，科学告诉我。不管是什么鸟，都不会叼着树枝飞太平洋。如果一定要这么干，肯定是只傻鸟——淹死在太平洋里喂鱼的傻鸟。　　对于建立在一个傻鸟故事上的傻鸟道理，只有傻鸟才会信。; 个人分类: 科教评论|1888 次阅读|2 个评论

谈谈我所了解的科研合作: 热度 11 chenbinmse 2011-4-25 21:52; 如果时光回溯到一二百年前，我们会发现那时的很多科学家仅凭一己之力就能做出很多科研成果，我们学到的很多定理就是以他们自己的名字命名的。反观现在，由于科学和技术的进步，学科的划分更加专业和细致，一个人很难有精力涉及好几个领域。如果我们想把自己的领域做深做透甚或有些突破，那么相关领域内或者跨学科的科研合作就显得尤为重要呢。根据从朋友那里了解到的（或许有所片面），国内的科研合作氛围不是很浓厚，一个主要原因可能是评价系统只认第一作者和通讯作者的贡献，合作作者的贡献很小或者不考虑。自然而然的，很多人就不愿合作了，而是倾向于自己申请大项目来购买相关仪器，问题就在于购买的仪器不是自己的本行范围，既不可能做深入细致的研究，也浪费了钱财。下面谈谈我所了解的一些良性循环的科研合作的例子：日本：说起日本，可能它的科学基础研究不如美国，但大家一个突出的感受就是它的技术实在是太强大了。日本最大的资助项目NEDO，额度很大，动辄几十亿几百亿的。要想申请该项目，必须要有好几个科研研所和大公司共同参加，制度规定你必须找到合作单位，即使你非常不喜欢那个合作单位。比方说我所参加的SiC高功率器件项目，除了我们所之外，还有诸如丰田，三菱等大公司介入。研究所研制出好的产品原型，最后由公司做出实际产品，各自发挥出自己的最大功用，最后日本政府也看到自己投的资金得到了实际的产品。意大利：去年有机会去德国开了个会，会上看到一个来自意大利的课题组做出了很好的成果，而且他们所做的也是我所关注的领域。于是，吃饭的时候，我和他们其中的一个聊了聊天。我说：“你们既生长出了好的材料，又把表征工作做得深入透彻，得到了这么好的结果。你们是如何做到的？”他非常高兴有人欣赏他们的工作，他说其实他们组只是做材料表征工作的，有很多这方面的仪器，但他们从来不做材料生长，材料是由另一个单位的课题组提供的。我又问道“他们很乐意给你们提供样品吗？你们从来不用担心样品的来源吗？”他回答的很轻松“不是他们乐不乐意，而是他们必须要提供样品，是制度规定了的。我们把我们的表征工作做好做透，他们把他们的材料生长好，互不干扰，而且我们表征所得到的结果反馈给他们，又能帮助他们寻找更优越的材料生长参数。” 澳大利亚：在申请fellowship或者奖学金的时候，澳大利亚是这样评价作者的贡献的：第一作者加8分，非第一作者加6分，也就是说只考虑第一作者和非第一作者，这样合作作者也不用考虑排名的先后次序了。而且我们可以看到，第一作者和非第一作者的差距很小。在这种情况下，又有谁不愿意合作呢？反正样品放着也是放着，拿出去让专做表征的组表征一下，既能得到相关的材料信息，最后发文章什么的，也能得到加分。以上只列举了一些我所知道的情况，不是说他们多愿意合作，而是科研制度和评价系统决定了他们只有合作，才会有更大的双赢。他们也没有失去他们自己的本行，况且合作让他们更有精力专注于把自己的本行做深做透，赢得他们自己本行的国际认可。从国家层面上讲，也避免了重复投资，不用把每个课题组都建设成大而全但缺乏特色的组。; 个人分类: 纸上“练”兵|11283 次阅读|26 个评论

评论：中文学术期刊不要陷入“马太效应”的漩涡: 热度 9 ysxbhxf 2011-4-21 01:15; 因为曾老师谈到的是中文学术期刊的问题，所以作为从事中文学术期刊出版工作的编辑，忍不住来凑个热闹了。 “马太效应”有两个方面：一是让多者更多；二是让少者更少。对于目前的中文学术期刊而言，很不幸，大多处于后者的境况。然而，这种境况不是公平竞争的结果，是利益驱动的结果：当前的科研评价体系将论文的发表与众多影响学者生存和发展的实际利益挂钩，同时又偏重于国外的期刊，尤其是SCI期刊，导致了优质稿源的外流，使得中文学术期刊即使在拥有好编辑、好的编委会和好的出版质量的条件下也无法与国外一般的SCI期刊公平竞争，更不说与国外顶级期刊相比了。对中外期刊的比较不能简单用个别的例子来归纳出结论。我不否认在中国的学术期刊里，尤其是中文学术期刊的某些编辑部存在诸如稿件处理速度慢的缺点，但并非所有的中文学术期刊编辑部的稿件处理速度都比国外SCI期刊编辑部的慢，在小木虫论坛里，可以看到很多抱怨国外SCI期刊编辑部稿件处理拖沓的帖子。更重要的是，优质稿件外流的主要原因并不是中文学术期刊编辑部的稿件处理速度慢，而是我上面所说的利益驱动问题。此外，目前中文学术期刊编辑部送给国内审稿专家审稿时，常常在等待了一段时间后才获知稿件被拒审，不得不另找审稿人。而拒审的理由很多是“最近事很多，太忙了”之类的理由，但对于国外期刊送来的评审稿件，国内审稿人往往给予较多的重视和配合，及时审稿。这是为什么？大家心里是很明白的。其实，有不少国内的精品学术期刊编辑部都在使用远程稿件处理系统，一般在10个工作日内就能对不合格的稿件做出初审退稿处理。我记得在几年前，有个在日本的学者向我们期刊投来一份关于日本最新镁合金进展方面的评述性论文，我们认为有必要尽快发表，结果通过努力，在2个月内就让其见刊了。对于时效性很强的论文，国内期刊还是有快速发表的途径的，这当然需要作者首先给编辑部打招呼并得到编辑部的认可。关于中文学术期刊国际化的问题，我记得中华医学会的期刊负责人游苏宁先生曾有专门的论文对此进行了分析，各位有兴趣的话不妨在百度搜索一下，应该已经OA了。在我看来，中文学术期刊的国际化目前只是一种好看但不中用的方案。在当前的科技评价环境下，中文学术期刊的稿源中已经非常缺乏能代表中国一流科研水平的投稿，即使邀请来了海外的优秀华人学者当评审人，编辑也不好意思将二流或三流水平的论文送给他们去评审，那简直是在浪费他们的宝贵时间，当然，他们也很有可能会拒审这类水平的论文。而请不懂中文的老外来当中文学术期刊的编辑或审稿人，显然就是一种摆设，这实在应该是中国英文学术期刊编辑部要考虑的事。本人认为，中文学术期刊国际化其实就是要进入海外的英文文献检索系统，使得用中文发表的有一定学术价值的论文的英文题目和摘要能被只懂英文的老外看到，在世界科学发展史上留下中国人应有的足迹。中文学术期刊的服务对象主要还是国内的学者，这才是办中文学术期刊的出发点和目的地。 CELL RESEARCH的成功并不是中文学术期刊可效仿的例子，甚至也不是中国英文学术期刊可以效仿得到的例子，其中的原因有很多，这里就不细说了。值得强调的是：我们需要的是刊登着很多优秀中国科研论文的国际化英文学术期刊？还是刊登着很多一般性科研论文的国际化英文学术期刊？对于前者，这需要广大国内学者和编辑的共同努力；对于后者，这也许就只需要英文学术期刊编辑的努力奋斗。在当下的中国，要办出世界顶级学术期刊不是个简单的靠编辑努力就能做到的事情，这需要有适宜的办刊环境以及国内学者和编辑的共同努力，需要中国科研水平的提高，需要有较长时间的学术声誉的积累。借用屈老夫子的一句话与各位共勉：路漫漫其修远兮，吾将上下而求索。; 个人分类: 观点辨析|7146 次阅读|27 个评论

[转载]吴申庆：唯SCI论文数量的评价体系必须终结: yuxin218 2010-8-29 15:39; 转载之前，首先提醒读者题目中的唯，唯SCI论文数量的评价体系与SCI论文数量的评价体系大不相同！！！，以下是转载内容：十多年来，在我国科教系统已经形成了以SCI收录论文数量为重要考核指标的论文评价体系。现在大学的学科评估排名，博士硕士学位授予点评审，重点学科、重点实验室的申报，科研项目审批结题等，无一不以发表SCI论文的数量为重要考核指标和依据。国家自然科学基金以及各级科研项目最终验收均要以SCI的论文数量进行考核。此外，对科研人员的业绩考核，职称评定，年终奖励，优秀人才选拔，引进人才等，SCI论文的数量也是一个极其重要的指标。在这种指挥棒长期影响下，我国科教界已经形成一个唯SCI论文数量的固定思维模式。唯SCI论文数量评价体系操作简单，无须动脑筋，最方便外行领导内行的行政化领导，也最适合全国一盘棋的管理模式。这也是这种评价体系可以大行其道，经久不衰的原因之一。现在即便由专家组成的各种评审班子，也是根据汇总材料，数数SCI论文数目，就可以进行各类评审，几乎不须去考察论文的内容和实际水平如何。需要大声疾呼的是：仅仅根据SCI收录论文的数量来进行重奖的政策正在走向其初衷的反面，SCI已经被泛化滥用甚至异化。这种评价奖励体制再不改变必将成为阻碍我国科教事业发展的绊脚石！我国SCI的畸形增长是重奖激励的结果 SCI是由美国科学信息研究所1961年创办出版的引文数据库，其学科覆盖面和收录范围广阔，目前自然科学数据库收录了全世界5000多种期刊，是目前国际上3大检索系统中最著名的一种。上世纪80年代末，南京大学最先将SCI引入科研评价体系。短短几年，南京大学被SCI收录的论文数，连续排名全国高校第一，同时其综合实力的排名也跃居全国前列。此后，各高校开始跟进，纷纷将SCI与职称评定、考核，科研经费等挂钩，并制定相关的奖励政策。应该看到，这种奖励政策和激励措施在高校发展的初级阶段，对于提高科研论文的学术水平，鼓励我国科研成果走向国际舞台，与国际接轨确实起过积极有效的作用。汤森路透集团Thomson Scientific发布的《全球科研报告：中国》中发现，中国的科研论文产出量2004年以来发生了爆炸性增长。SCI论文数量从1998年的2万多篇增加到2008年的11.2万篇。2006年超越了日本、英国和德国，目前仅次于美国。这难道是中国科技水平的真实反映吗？毫无疑问，这种大跃进式的畸形增长是十多年来我国推行重奖政策的结果，粗算一下，在此期间单单SCI论文作者的奖金就高达数十亿元！为制造大量泡沫论文而耗费的人力的物力还未计算在内。过度强调SCI必然导致学术畸形 SCI论文的数量与日俱增，伴随而来的是学术泡沫化，学术腐败和创新精神的沦丧，而且这种现象日趋严重。我们看到，一些所谓的SCI专业户找到了诀窍，可以连篇累牍地发表所谓的SCI收录论文，成了SCI百万富翁。新语丝网站揭露，某教授3年发表了82篇SCI收录的论文，平均不到两周就完成一篇论文。凭借这些论文，该教授不仅获得巨额奖金，而且成为科技明星，享受国务院特殊津贴，具有一级教授、国家优秀教师、省政协委员、市人大代表等多个头衔。类似情况在各大学比比皆是。按照现行的科研评价体系，拥有这样人才的大学，其学术水平的排名必定名列前茅，学校领导也皆大欢喜。此种激励不仅带来只求数量，不求质量的结果，而且必然导致学术畸形，学术泡沫和学术腐败。更为可怕的是，在这种政策的长期影响下，科学研究的目的不再是创新和社会进步，而是一迭迭打印的文书！高质量，高水平，高影响力的学术成果很难脱颖而出。 SCI并不是高水平的同义词 SCI体系本身并没有问题，问题在于我国对SCI体系的误读和异化。实际上，强大的检索功能使SCI具有最为突出的优点：引文功能，但引文次数及影响因子等反映科技论文质量和学术水平的数据指标却被我们忽略了。 SCI并不是高水平的同义词。按照SCI的收录统计方法，凡在SCI系统期刊上出现标题的文章，无论是研究论文，综述还是简讯，甚至更正，都算作一篇。同样被SCI收录的专业期刊，其影响因子差别巨大。在国外大学中影响因子是评估论文水平的重要参考，可是在我国的评价奖励体系中，无论影响因子高与低，他们都是被不加区别地同样对待的。在SCI系统中，能够很方便地查询到一篇学术论文被引用的情况，这更具体地反映出此文的学术影响力。在国外大学对教师的评估中，这是一个重要的参考。但在我国，只有少数单位和个别情况下会关注到影响因子和论文的引用情况。近年来，我在访问哈佛大学，牛津大学，MIT，帝国理工，斯坦福，伯明翰等著名大学以及一些普通大学时，曾就此问题进行过调研和交流。实际上，在英语体系国家，一篇SCI论文只是表明这篇论文按常规被收入了一个公认的庞大数据库，并不能说明什么。我的一个学生去波斯顿某大学求职，当他自我介绍说发表了多少篇SCI论文时，那位美国教授竟反问：什么是SCI？足见在我国如雷贯耳的SCI在美国却并不当回事情。许多西方学者对我国动辄成千上万元地重奖SCI收录论文的现象感到难以理解，甚至戏称中国的SCI为Stupid Chinese Idea（或可译为愚蠢的中国概念）。就连创立SCI体系的Engene Garfield博士在2009年访问我国时也明确表示：不能以SCI论文数量评价科学水平，而应该运用更科学的评价标准体系。评价体系和奖励政策起到导向和指挥棒的作用，必须根据形势的变化及时改革。应该把有限的奖励资源花在最有成效的政策上，这是领导者的责任。最近中央召开的教育工作会议明确提出要把教育发展方式的转变作为深入贯彻落实科学发展观的重要目标和战略举措，改革和完善教育体制机制、政策导向，希望这次会议能够在中国的科教界刮起改革和转变的旋风。唯SCI论文数量的评价奖励体系到了必须摒弃和改革的时候了！（作者单位：东南大学材料科学与工程学院）; 个人分类: 科研|3008 次阅读|0 个评论

全国应急管理能力评价体系的基本框架: lxj6309 2010-7-18 09:56; 以下文章载于：汪寿阳.刘铁民.陈收.郑桂环主编，突发性灾害对我国经济影响与应急管，科学出版社，2010 由本博主完成。 8.4 应急管理能力评价的理论基础 8.5 全国应急管理能力评价体系的基本框架; 个人分类: 系统科学与系统工程学|4059 次阅读|2 个评论

评价体系: wdfzacw 2010-7-15 10:23; 培养人才需要良好的评价体系,其成员应该: 1. 学识渊博; 2. 道德高尚; 3. 1至3门顶尖知识; 4. 有爱心; 5. 爱国; 6. 坦荡无私; 7. 眼光锐利; 8. 爱才; 9. 无嫉妒之心; 10. 无私欲.; 个人分类: 未分类|2227 次阅读|0 个评论

造假应震倒我国的科研评价体系: 热度 1 accsys 2009-12-29 07:38; 一个国家科技论文的好坏，都要以国外的评价为准，这大概是世界历史上少有的事情。大凡由于周围人群的无知和无能，让骗子屡次得手，也不能全怪骗子，没有愚昧的人群，骗子何能够得逞？井冈山大学的70篇造假论文被国外揭露出来确实很痛，中国科研界人士的脸面丢尽，中国人科研成果的真实性将会受国际国内长时间的质疑，看来会成为不可避免的事情。用国外发表文章造假，进而蒙骗国内人士，最终获得荣誉和经济利益，这看起来的坏事，也许会成为教育我们，引起国内科研评价体系改革的好事情。请看下面对井冈山大学造假事件报导的部分内容：除了论文数据涉嫌造假，两名作者的身份也从讲师摇身变成了教授和博士，许多网友对这双重欺骗非常愤慨。记者采访了井冈山大学党委书记万继抗，在万继抗的介绍中，第三重造假又浮出水面。万继抗：刘涛是搞工学的，从专业发展上他不可能在这个领域里研究，但他偏偏在这个领域里发这么多文章(27篇)。他也是受到钟华的启发，钟华私下里把这里面的奥秘告诉他，然后他就也有意在上面发文章。井冈山大学校方并不是没有发现其中的玄机，刘涛的论文内容并非所学，然而却能够在国际期刊上发表，这难道不是明显的问题吗？给他们提薪提职，其中的原因一定包含给本校带来荣誉和名声的效益吧？这件事不仅反映造假者的愚昧，更反映出我国教学科研评价体系的落后和不实际，反映出科研管理手段和方法的不科学性。一个好的科研评价体系应该是实事求是的系统，特别是科研领导或有权力的专家在弄不懂问题的时候，一定要让作者来解释说明，或寻求其他的方式获得真谛。理论性质的论文容易从理论上分析审查，技术或实验成果类论文，一定要尽可能实际地走一遍，或者试验，或者到现场考察，这才是负责任的态度。商品社会的经济大潮中，用金钱往往可以办科学的事情，这是难免的毒瘤，我们的科研评价体系一定要设法排除这种事情。井冈山大学要能够认真地对这些造假论文评价，也不会给造假者那些相应的荣誉和利益。我们整个国家的科研评价体系如今已经完全交给国外了，国内的大学或科研机构几乎成了人家的应声虫。只要有人在国外Science或Nature杂志上发文，作者会立即在国内成名。由于一味追求外文，发表在英文杂志上的东西，很难让那些以汉语为母语的中国专家鉴别和评论，因而一片混沌也是必然。难道老外们就完全公平？诚然，国外的专家学者一般都学风严谨，但绝对不会是百分之百，近些年世界上造假的现象屡屡出现就是证明。依靠国外刊物发论文来确定科研成果的做法，确实省时省力，但除了让外国人讥讽中国科学家，或者给一些施舍性的赞扬之外，不会给中国的科技发展带来多少好处。这种评价体系的弊端随便可以找出几条：第一、如果真是我国科学家费力研究出来的原创，会拱手送给了人家；第二、在国外的科技引导下，会培养一大批追随他们的中国科学家，这些科学家多数只会按着人家的模式思考问题，因而创新科研基本上就会成为了一句空话；第三、我们失去了对其他国家科研成果品评的机会，也没有了自己对科研成果的评价能力，我们将会永远地落后下去。一个正确的科研评价体系是在自强自立的基础上建立起来的，我们重大的科学研究项目和成果，一定要在国内一定的范围内认真公开评审，发表在国外期刊上的论文，不能作为评价的唯一依据，而应该作为参考，实事求是地进行认真的鉴别，最终来确定真伪。井冈山大学出现的造假，如果在校内能够认真地评价分析，也不至于现在如此现眼。当然，井冈山大学内部有没有能够进行这方面评价的学者，也是一个重要的问题。但如果校领导认真，即使自己没有，还可以外请高人评价也是可行的事情。总而言之，此类造假事件在我国多次发生，应该说是我们的科研评价体系有问题和科研成果和利益直接挂钩造成的，而评价体系的落后，又是造假层出不穷的一个重要原因。在科研水平落后的情况下，如何确立正确的评价体系呢？那就是公开品评策略，将欲评教授级的作品都放在相应的职称评定网站上，让大家评。俗话说三个臭皮匠，赛过诸葛亮，如果这样我们都不能识别出造假者，那么我也只好认栽了。这种公开的评价方式绝对优于我们实行的专家评价体系。近些年来，由于商业炒作的需要，各种宣传场合，所谓的专家都经常出现，其中冒牌专家和过时的专家大有人在。就是申请国家科研项目基金的问题上，也有这种专家评审的弊端。从汉芯造假到巨资科研项目的无果而终，都已经充分暴露出了我国专家评价体系的问题，已经到了必须彻底改变的地步。也许会有人说网络公开评价会过于公开，但这比起让国外评定的方法来，还是有更多好处的，起码国内学者能够参加评论，避免不懂装懂的所谓专家胡评乱砍，进而提高我们的科学评价水平。网络评价可以交流，可以批评和反批评，在全面地抒发见解之后，哪些项目需要国家出资支持自然就会一清二楚，而无须像现在这样实行专家暗箱操作，使国家科研基金的申请者多有不服。专家不能总是专家，随着领域和时间的变迁，以往的专家有些人有可能成为无知者，在网上晒晒他们的评语，看看他们的真实真实水平，也是避免他们误事误国的好事情。当然，网络公开评价体系会给科研行政管理者带来很多的麻烦。其实，科研行政管理就是一个麻烦的事，不这样，中国的科学研究就难以摆脱受人耻笑，造假风行的落后的困境。 2009-12-29; 个人分类: 随笔|15895 次阅读|21 个评论

为什么中国科学落后于经济与体育发展?: 蒋高明 2009-12-22 13:24; 蒋高明笔者经常参加一些国际会议。遇见老外，一个非常尴尬的事是如何介绍自己。我们的名片上赫然印着研究员，翻译成英文用的是professor。是的，如果按照国内的标准，笔者是1994年破格提副研究员，1997年底破格提研究员的，也是有十几年资格的老研究员了。我们在给国外会议主办方提供的信息中，也是这么理直气壮地填写的。但当我们到会场入座时，我们的头衔变成打狗托(Dr)了。笔者仔细观察，不光是我这样无权无职的研究员给这样的待遇，就连我的一个好朋友，一个四个所合并的中科院大所所长、973首席、上亿万课题主持人、杰青获得者、老资格的研究员(当然年龄上看起来还不够老成，才四十七八岁，但看起来四十出头)，也是给打印一个Dr头衔。而伊朗、埃及、日本的科学家却享受了professor头衔，当然人家肯定在国内也是professor的。国际会议承认他们，为什么不承认我们？有些愤愤不平。我很不服气了，查查伊朗科学家发表的东西，无论是数量还是质量，我的SCI远远超过他啊，我怎么也有七八十篇SCI了，也有七八篇圈内高分过4的呢。你伊朗人发表的还都是用蝌蚪一样的伊朗文写的，俺中文的也一百多篇呢。我们恰恰这样的心态里被人瞧不起。中国科学家得到这样的待遇我想不是个别现象，我们出去一个年轻人，看似不过30出头的，都是professor了，他们也是靠的SCI评上来的。那些对教授非常尊重乃至崇拜的国家，欧洲、阿拉伯国家，亚洲的日韩，美洲的美国加拿大，澳洲的澳大利亚，都怀疑我们教授的含金量。你是教授吗？我去美国使馆签证时，签证官就问这样的问题，还得让我回去开了单位的研究员证明或者拿来研究生院的教授证才勉强承认。就为这，我得跑两趟；也因为此，前年去美国国际交流我拒绝了去美使馆签证。是的，我们是教授吗？我们做出了什么样的贡献让人家尊重？教授头衔为什么在中国贬值呢？这个问题很值得我们反思。于是，我们只被保留了打狗托。如果按照海龟们的标准，我们是土博士，根本不配姓赵，连Dr也不应该有的。可洋人还算承认俺的Dr，毕竟俺也是中国科学院来的，当年千军万马考中国科学院，俺是植物所考生的第二名呢(1985年考植物所，全国100多名考生，录取19人)。我们轰轰烈烈SCI了20年，产生一大批一大批的院士、教授、博士，可是整体上我们的水分大大增加了。这与我们的评价标准有关，与我们引进了SCI，丧失科学文化有关。N篇SCI，N分以上，就得到研究员、教授，一把简单的尺子，看似非常公平，客观上促使了科研浮躁，职称、博士、硕士头衔的贬值。看到比自己差的人凭着几篇SCI上了教授、研究员或者院士了，还分了房子，搞到很多经费，俺也能够写出来，干嘛吃这个亏？实在写不出来，搭人家一个车也行。当然，那得给人家一点好处的。君不见，现在有双通讯作者，2-4个并列第一的SCI文章吗。一篇文章三五个人受益。于是，全体科学工作者都来赶这个早集，至于做出了什么，有什么贡献，甚至发表的SCI是错误的结论，全然不顾的。整体而论，我国这二三十年的科学是落后于经济和体育的。经济的标准很好衡量，就是钞票，一张一张数就行了，看穿的服装，开的汽车，住的房子就能够看出来。外国人观察中国的街道，年年不断涌现的高楼大厦，而我们去欧洲二三十年了没有变样。他们太寒酸了，不值得一提。在经济方面，如果不管环境破坏或人的道德水准的下降，我们肯定也是成功的；体育上，从第一块奥运金牌，到全球金牌第一，一块一块地数金牌就行，日本人也不用再骂我们是东亚病夫了，尽管田径和足球上我们还有弱点。然而，科学上，似乎还难以看到这样的明显成就。除了SCI数量外，能够炫耀的成果，或者标志的成果很少，老外们并没有感觉到中国科学家对他们形成威胁。而中国科学家或者全体的华人，靠的是经济和体育成就，才在待遇上翻的身。科学研究或者文化研究，与经济和体育的规律是不同的。科学研究是枯燥的，不坐十年几十年冷板凳是出不了东西的；而做经济，只要肯吃苦、有韧劲、有基本的诚信、具备商人的精明或敢干，是可以暴富的。财富是员工或农民工创造的，是资源换来的，是环境换来的。君不见许多做大的企业老总都是小学没有毕业或者干脆不识字。体育呢，靠的是体格，还有吃苦精神，目标明确，靠奋斗也能达到目标，再加上重奖之下必有勇夫的物质刺激，得奖就来得容易些。但用经济或体育的办法就做不了科学。不识字肯定不行；物质刺激下，只能出次品。做科学，绝对的是慢工出细活。目前我们正在用经济或体育的办法管理科学，采用的尺子小学生都会用的。用SCI管理老九，无论是篇数还是点数，或是引用率，只要有小学水平或不识字的管理者都能做到的。按照SCI标准，中国400万个农村里的会计人人都能够胜任研究所或大学的科研处长，乃至研究所所长职务的。在这样农村会计就能管理科学的体制下，科学家就不可能安心做科研，出不了好成果，出不了大成果，急功近利是难免的。不信我们就走着瞧。; 个人分类: 科学人生|9932 次阅读|19 个评论

人文社会科学评价体系和标准问题大讨论: xupeiyang 2009-9-14 14:37; http://www.cass.net.cn/file/20090430231660.html 人文社会科学评价体系和标准问题大讨论人文社会科学评价体系和标准问题大讨论 2009年首届人文社会科学评价学术研讨会综述改革开放30年来，中国人文社会科学形成了繁荣发展的局面，但与此相应，人文社会科学评价却成为颇具争议性的课题。如何科学、客观、公正、合理地评价人文社会科学研究工作、成果、人员和机构等问题，是人文社会科学在发展中面对的迫切问题。为了这一问题的解答，学术界不断探索，尝试采用不同的评价方法，其中包括引文分析法、同行评议法、学术期刊评价等等，但直到目前，中国人文社会科学评价的科学标准问题依然处于探索中。围绕这一主题，2009年4月2425日，南京大学中国人文社会科学评价国家创新基地、南京大学信息管理系、南京大学中国社会科学研究评价中心召开了2009年首届人文社会科学评价暨第5届科研绩效评价学术研讨会。会议论文包括：《中国人文社会科学发展的结构性危机》、《学术期刊与中国社会的知识转型社会科学期刊的当下使命》、《人文社会科学评价的多元化和国际化标准》、《人文社会科学评价中若干亟待矫正之问题》、《人文社会科学学术评鉴特性及指标探讨》、《基于SSM分析的哲学社会科学科研评价研究》、《学科知识图谱的绘制方法及在人文社会科学评价中的应用》、《引文的本质及其人文社会科学评价功能辨析》、《论被引频次评价的适应性、局限性和不合理性》、《H指数与大学文科测评探讨》、《基于SSCI的中国社会科学研究国际合著分布研究》、《我国大陆高校SSCI论文定量分析：19782007年》、On the relation between the Wos impact factor, the Eigenfactor, the SCImago Journal Rank, the Article Influence Score and the journal h-index、《多指标加权值对多学科学术期刊排序初探》、《法学期刊的修正h指数分析》、《管理科学期刊影响因子评价比较研究基于国内学术期刊引证数据》、《基于ESI的国家/地区高水平科研产出与影响比较分析》、《长尾分布、幂律的产生机制和西蒙模型》等等。此次会议是首次人文社会科学评价学者与自然科学评价学者共同参与的人文社会科学评价问题研讨会，议题涉及人文社会科学评价理论与方法、引文评价与同行评议、学术期刊与论文评价、科技研究绩效评价等，既有国外科学计量学和文献计量学的研究，也有国内人文社会科学评价方面的成果；既有对引文本质和引文索引作用的思考，也有对同行评议制利弊的分析；既有对人文社会科学特点及其评价体系的探讨，也有涉及国外评价领域前沿问题的研究。此次会议的主题研讨，将有利于推动科学的人文社科评价体系的建构与完善，有利于公正合理的学术秩序和学术环境的逐步建立。南京大学党委副书记张异宾教授致开幕词指出，这次会议是学术链中的学者、编者、索引编制者、图书情报管理者、科研管理者就共同关心的问题进行交流，这是一件非常重要且具创新意识的事情。他提醒大家注意，如何科学客观公正地评价人类的精神劳动成果是国际性难题，主要难点在于如何用一套行之有效的方法和指标体系来衡量人类复杂的精神产品质量。学术评价的导向不仅影响着科学研究导向，更为重要的是它也决定着科学研究的创新动力和源泉。知识创新或科学研究创新迫切需要改进评价体系中的不合理部分，让评价推动和引导科研活动朝着更具创新力的方向发展。人文社会科学评价中的若干问题及应对方法目前，中国人文社会科学评价在理论上还不成熟，在实践中又遇到了极其复杂的现实环境，因此需要谨慎对待。中国人民大学教授刘大椿认为，中国人文社会科学评价中存在的错位问题，主要是把人文社会科学评价视为对象存在价值的绝对判断，忽略了它们实际上是对评价的评价，不可能完全客观，但又必须寻求共识性。他提出，目前亟待矫正的评价问题是对人文社会科学评价本土化的忽视问题。人文社会科学总是要受到所在文化情景的文化限定的，人文社会科学评价也是无法脱离本土化的文化土壤的。中国人文社会科学的本土化是将人文社会科学的一般理论、概念和方法与中国的文化传统、价值观念和具体实践相结合，描述、解释和说明中国的人文现象和社会问题，预测中国社会的未来发展，形成自己的理论特色。因此，我们不能照搬SSCI、AHCI及ISTP的标准，把它们作为我国人文社会科学论文评价的指标，而要建立并使用属于我们自己的引文索引和评价指标。人文社会科学的本土化是人文社会科学发展成熟的重要标志。中文人文社会科学引文索引的建立，标志着我国人文社会科学的评价正在走上一条符合自己需要的发展道路。所有这些，都是我国社会科学发展逐渐成熟的标志。然而，现在人文社会科学成果评价的有关本土化问题尚未引起人们足够多的关注。就这一观点，记者曾采访中国社会科学院《中国人文社会科学核心期刊要览》主编姜晓辉，他也谈及了相同意见，相对国外的统计方法、采集方法而言，我们的统计手段应该本土化一些，因为学术环境、实际情况都有所不同，比方说通过问卷，了解期刊在学者中的口碑如何。如果一味采用现成的量化统计手段，不做调研工作、不对指标进行调整、不做符合中国期刊实际的统计分析工作，那就不能客观反映中国学术期刊的情况，那么核心期刊、核心区也就都是不准确的。来自中国台湾大学图书资讯学系的黄慕萱教授认为，人文社会科学的研究议题具有本土性及引用较旧的文献资料等特征，因此进行学术评价时应注意不能仅就英文期刊文章数及其被引用次数进行评价，同时必须考虑较长时间的出版品数量和品质。此外，为了能符合人文社会科学的特定性，必须结合同行评价与数目计量指标，以多元指标进行评价。中山大学任剑涛教授认为，中国人文社会科学的发展存在结构性危机，需要一个多元的制度平台；清华大学王宁教授认为，在全球化时代，我国人文社会科学研究的国际化是非常重要的，并提出了一种多元评价标准除了重视在SSCI、AHCI来源期刊上发表论文外，人文学科的学者还应当在国际著名的出版社出版专著，同时注重自己文章的被引用率和实际影响力。此外，来自中国科学技术信息研究所、青岛大学等单位的自然科学研究者，也从定量分析的角度提供了论文评价指标的测算方法。引文评价及同行评价在目前普遍采用的人文社会科学评价方法中，将引文分析应用于评价学术成果及其影响力，无疑是最有代表性的一种方法。南京大学信息管理系、评价基地副主任叶继元教授提出，为了准确理解和利用引文的评价功能，利用概念分析法和社会学原理，可以通过分析引文、参考文献、文献注释概念的异同，考察引文的含义和类型的多样性，来论证在一定条件下引文的有序性和层次性，探讨引文的本质及其一定的评价功能。同时，他对目前片面利用引文的评价功能的现象，提出了对策性的建议。来自中南大学的学者，就通过被引频次评价来进行成果评价的方式进行了深入探讨。他们认为，被引频次评价是指用学术论文发表以后被引用的次数来评价以学术论文形态表征的研究成果，是评价与学术论文有关的期刊、学科、国家、单位、个人的一种方法。被引频次评价是由美国科学信息研究所倡导的、以学术论文为载体的研究成果评价体系。目前，被引频次评价似乎已成为评价期刊学术论文质量和科学等学术水平的唯一方法，其实，它不是万能的。被引频次评价只适应于基础研究，不适于开发研究，在应用研究方面有很大的局限性。在同行评议问题的讨论中，有学者认为，我国目前虽然也有一些高等教育评价中介机构，但主流的评估还是由政府职能部门组织的。从执行情况来看，缺陷不少。首先，为评估而评估，使高校不堪重负；其次，形式主义、弄虚作假现象比比皆是。现有的评估指标过多强调数量和规模，这种导向本身存在引导有误的问题。有鉴于此，重视中介机构的社会化评价，坚持同行评议原则，将有助于解决上述问题。同时，这也是政府职能转变的重要一步，使教育部门能集中精力加强宏观管理，而不必再担心中介机构的社会化评价不够准确和科学。只要坚持将定量指标和同行评价的专家定性分析相结合，将评价指标体系、评价方法、程序和结果对外公开，增强透明度，并接受大学和公众的质疑，大学评估甚至各种科学奖励，也可以交给经过批准委托的中介机构去做。当然，中介机构也有越轨、腐败行为，但克服起来，成本较低。此外，来自浙江大学、上海交通大学等单位的学者，从定量分析的角度探讨了评价领域的一些前沿问题，如h指数、g指数等用于评价学术机构、学术期刊和学者等方面的问题。学术期刊及论文评价学术期刊评价作为人文社会科学评价的一个重要范畴，既取得了一定的科学性发展，同时也出现了一些问题，比如唯核心论、评价指标单一、小众化评价等等。在这个问题的探讨中，有的学者认为，学术期刊的一个重要使命是要引领中国社会科学研究实现两个根本性转变：一是从那种因西方化倾向所导致的中国之缺位中解放出来，重新找回或发现中国。当然，这里的中国不是意识形态视野中的中国，也不是中国传统知识视野下的中国，更不是西方知识视野下的中国，而是一个基于中国自己的文化身份与政治认同、具有后发发展经验并处于世界结构中的当下中国。二是从那种唯学科化倾向所导致的肢解化的中国中解脱出来，用问题导向的、综合性的交叉学科或无学科性研究去解释处于变革中的整体性中国。中国社会科学期刊只有引领中国社会科学实现了这样两个根本性转变，进而促进中国社会科学的知识转型，才能够用综合性研究成果使西方社会比较确切地认识整体的中国。有学者指出中国社会科学期刊目前存在的一个主要问题是，中国社会科学期刊不仅在国际，而且在国内的学术影响力也很有限。比如研究者个人在学术论文或专著的撰写过程中，一般征引的都是其他论者的个人专著或论文集，而很少引用或不引用散见于各种学术刊物中的研究相同论题的论文。有相关统计数据可以证明：法学研究方面，中国法学研究者著作的他引率要比他们所发表的学术论文的他引率高得多；哲学研究也是如此，20002007年，各类哲学期刊的h指数相对较低（最低为1，最高仅为12），这说明，哲学学者特别注重著作引用，尤其是经典书籍，而论文引用相对较少。针对核心期刊存在的问题，有学者提出治理建议：要调整评选机构，确保评选结果科学公正；明确核心期刊的使用方向，加强对核心期刊的监管力度；净化科研环境，使核心期刊健康生长。从期刊及论文评价定量分析的角度出发，来自南京大学信息管理系的几位学者，以一段时期内的引文数据为基础，对不同学科领域的学术期刊h指数进行了计算，并从h指数排名、与期刊被引篇次、与影响因子的对比等方面对计算结果进行了深入地分析研究，以此揭示不同领域学术期刊的学术影响及分布规律。文章出处：中国社会科学院报; 个人分类: 科技评价|1923 次阅读|0 个评论

突破重论文轻实践评价体系: xupeiyang 2009-9-9 14:14; http://www.sciencenet.cn/htmlnews/2009/9/223201.shtm 突破重论文轻实践评价体系三医师四科学家分获周光召基金会临床医师奖及应用科学奖中国科协名誉主席周光召院士在9月8日上午第十一届中国科协年会开幕式上宣布，赵玉沛、姜建元、凌峰等3位医师获得周光召基金会临床医师奖，邱勇等4位科学家获应用科学奖。周光召表示，临床医师为保障人民身体健康，实现和谐社会，发挥了极其重要的作用。一位医德高尚、医术精湛的临床医师，以高度的责任心和仁爱心，治病救人，应当得到社会热情的支持和赞誉。但在目前重论文、轻实践的评价体系下，很多优秀的临床医师未得到社会应有的承认。他认为要改变公众的印象，既要制裁那些医德败坏的分子，也要发扬正气，表扬医德高尚、医术精湛的优秀临床医师。周光召说，今年基金会决定给3位优秀的临床医师颁奖。北京协和医院院长赵玉沛对胰腺癌进行了全面的基础和临床研究，提出并建立了胰腺癌诊治绿色通道，规范了胰腺癌诊治流程，使大多数患者在一周内得到确诊，为更多患者赢得手术切除的机会，使胰腺癌手术切除率由29%提高到35.5%；上海华山医院骨外科大夫姜建元积累了丰富的脊柱手术临床经验，十分注意培养合格的临床医师，举办各种学术活动，亲自讲授临床经验，主编出版了《脊柱应用解剖图谱》；北京宣武医院的凌峰创立了北京市脑血管病中心和北京市急性脑血管病事件综合防治体系，创立了提出了医学整体施治的理念，成功抢救了凤凰电视台主持人刘海若。此外，邱勇、张建春、张涛、赵宪庚等4位通过基础研究掌握规律、具备自主知识产权后，快速应用于市场和国家急需的项目中，形成有竞争力的技术和产品的科学家荣获周光召基金会应用科学奖。; 个人分类: 科技评价|1734 次阅读|0 个评论

对大学排行榜的质疑: zdwang 2009-5-17 07:56; 评重理轻文的评价体系王振东最近揭发出中国管理科学院科学学研究所的大学评价课题组（即武书连课题组）有索取赞助和接受贿赂的潜规则，惹出了一些是非，使人们在报刊和网络上对大学排行榜一事产生了热议。笔者4年前在美国时，看到2005年2月27日纽约《世界日报》周末出的《世界周刊》上，有一篇介绍中国管理科学院科学学研究所大学评价课题组2005年中国大学排行榜研究报告的文章，曾对他们发布的大学排行榜的科学性和客观性产生过疑问。这期《世界周刊》介绍，他们给大学打分的评价体系是：人才培养的权重是0.5780；科学研究的权重是0.4220。而在科学研究下又设两个二级指标：自然科学研究的权重是0.3312；社会科学研究的权重是0.0913。我产生的质疑是：自然科学研究与社会科学研究两者的权重竟有3.6倍以上的差别，对于大学来说，这两种科学研究的权重怎么能差别这么大呢？这个课题组公然歧视人文社会科学研究，做出这种重理轻文评价体系的权重设计有什么科学依据呢？自从有了这个疑问，后来就注意他们每年在发布大学排行榜时，对评价体系有没有说明和变化。结果除了在美国看到过《世界周刊》上那次对评价体系有说明外，后来几年在国内都看不到说明，所以只好怀疑他们是不敢公开评价方案，以便进行暗箱操作。因为只要在国内公布出这样的权重设计评价方案，肯定会受到非议的。在最近对大学排行榜的讨论中，还看到有大学校长说，所有这些排名机构，没有任何一家向学校要过数据，数据来源至少是不完整的，因而也怀疑其数据的可靠性。在价值多元化的今天，可以有各式各样评价体系的大学排行榜。一所大学可以在甲排行榜上名列前茅，因为评价体系的不同，在乙排行榜上又可在排在较后的位置，是十分正常的事情。所以必须要对照评价体系方案，来看排行榜才有参考的意义。一个客观、科学、公正的大学排行榜，除了课题组需要廉洁自律外，数据来源要可靠，还要说明出处；评价体系的权重设计方案要科学，并公布于众，接受捡验。这样产生的大学排行榜，才有公信力。; 个人分类: 教育思议|5060 次阅读|2 个评论

人文社会科学评价体系和标准问题大讨论: rbwxy197301 2009-5-16 11:41; 人文社会科学评价体系和标准问题大讨论转引自：http://www.chinanbsk.com/index.php?categoryid=22p51_articleid=3429 2009年首届人文社会科学评价学术研讨会综述发布时间: 09-5-11 14:09:38 来源：中国社会科学院院报阅读：70次　改革开放30年来，中国人文社会科学形成了繁荣发展的局面，但与此相应，人文社会科学评价却成为颇具争议性的课题。如何科学、客观、公正、合理地评价人文社会科学研究工作、成果、人员和机构等问题，是人文社会科学在发展中面对的迫切问题。为了这一问题的解答，学术界不断探索，尝试采用不同的评价方法，其中包括引文分析法、同行评议法、学术期刊评价等等，但直到目前，中国人文社会科学评价的科学标准问题依然处于探索中。围绕这一主题，2009年4月24 25日，南京大学中国人文社会科学评价国家创新基地、南京大学信息管理系、南京大学中国社会科学研究评价中心召开了2009年首届人文社会科学评价暨第 5届科研绩效评价学术研讨会。会议论文包括：《中国人文社会科学发展的结构性危机》、《学术期刊与中国社会的知识转型社会科学期刊的当下使命》、《人文社会科学评价的多元化和国际化标准》、《人文社会科学评价中若干亟待矫正之问题》、《人文社会科学学术评鉴特性及指标探讨》、《基于SSM分析的哲学社会科学科研评价研究》、《学科知识图谱的绘制方法及在人文社会科学评价中的应用》、《引文的本质及其人文社会科学评价功能辨析》、《论被引频次评价的适应性、局限性和不合理性》、《H指数与大学文科测评探讨》、《基于SSCI的中国社会科学研究国际合著分布研究》、《我国大陆高校SSCI论文定量分析：19782007年》、On the relation between the Wos impact factor, the Eigenfactor, the SCImago Journal Rank, the Article Influence Score and the journal h-index、《多指标加权值对多学科学术期刊排序初探》、《法学期刊的修正h指数分析》、《管理科学期刊影响因子评价比较研究基于国内学术期刊引证数据》、《基于ESI的国家/地区高水平科研产出与影响比较分析》、《长尾分布、幂律的产生机制和西蒙模型》等等。　此次会议是首次人文社会科学评价学者与自然科学评价学者共同参与的人文社会科学评价问题研讨会，议题涉及人文社会科学评价理论与方法、引文评价与同行评议、学术期刊与论文评价、科技研究绩效评价等，既有国外科学计量学和文献计量学的研究，也有国内人文社会科学评价方面的成果；既有对引文本质和引文索引作用的思考，也有对同行评议制利弊的分析；既有对人文社会科学特点及其评价体系的探讨，也有涉及国外评价领域前沿问题的研究。此次会议的主题研讨，将有利于推动科学的人文社科评价体系的建构与完善，有利于公正合理的学术秩序和学术环境的逐步建立。南京大学党委副书记张异宾教授致开幕词指出，这次会议是学术链中的学者、编者、索引编制者、图书情报管理者、科研管理者就共同关心的问题进行交流，这是一件非常重要且具创新意识的事情。他提醒大家注意，如何科学客观公正地评价人类的精神劳动成果是国际性难题，主要难点在于如何用一套行之有效的方法和指标体系来衡量人类复杂的精神产品质量。学术评价的导向不仅影响着科学研究导向，更为重要的是它也决定着科学研究的创新动力和源泉。知识创新或科学研究创新迫切需要改进评价体系中的不合理部分，让评价推动和引导科研活动朝着更具创新力的方向发展。　人文社会科学评价中的若干问题及应对方法　目前，中国人文社会科学评价在理论上还不成熟，在实践中又遇到了极其复杂的现实环境，因此需要谨慎对待。中国人民大学教授刘大椿认为，中国人文社会科学评价中存在的错位问题，主要是把人文社会科学评价视为对象存在价值的绝对判断，忽略了它们实际上是对评价的评价，不可能完全客观，但又必须寻求共识性。他提出，目前亟待矫正的评价问题是对人文社会科学评价本土化的忽视问题。人文社会科学总是要受到所在文化情景的文化限定的，人文社会科学评价也是无法脱离本土化的文化土壤的。中国人文社会科学的本土化是将人文社会科学的一般理论、概念和方法与中国的文化传统、价值观念和具体实践相结合，描述、解释和说明中国的人文现象和社会问题，预测中国社会的未来发展，形成自己的理论特色。因此，我们不能照搬SSCI、AHCI及ISTP的标准，把它们作为我国人文社会科学论文评价的指标，而要建立并使用属于我们自己的引文索引和评价指标。人文社会科学的本土化是人文社会科学发展成熟的重要标志。中文人文社会科学引文索引的建立，标志着我国人文社会科学的评价正在走上一条符合自己需要的发展道路。所有这些，都是我国社会科学发展逐渐成熟的标志。然而，现在人文社会科学成果评价的有关本土化问题尚未引起人们足够多的关注。就这一观点，记者曾采访中国社会科学院《中国人文社会科学核心期刊要览》主编姜晓辉，他也谈及了相同意见，相对国外的统计方法、采集方法而言，我们的统计手段应该本土化一些，因为学术环境、实际情况都有所不同，比方说通过问卷，了解期刊在学者中的口碑如何。如果一味采用现成的量化统计手段，不做调研工作、不对指标进行调整、不做符合中国期刊实际的统计分析工作，那就不能客观反映中国学术期刊的情况，那么核心期刊、核心区也就都是不准确的。　来自中国台湾大学图书资讯学系的黄慕萱教授认为，人文社会科学的研究议题具有本土性及引用较旧的文献资料等特征，因此进行学术评价时应注意不能仅就英文期刊文章数及其被引用次数进行评价，同时必须考虑较长时间的出版品数量和品质。此外，为了能符合人文社会科学的特定性，必须结合同行评价与数目计量指标，以多元指标进行评价。　中山大学任剑涛教授认为，中国人文社会科学的发展存在结构性危机，需要一个多元的制度平台；清华大学王宁教授认为，在全球化时代，我国人文社会科学研究的国际化是非常重要的，并提出了一种多元评价标准除了重视在SSCI、AHCI来源期刊上发表论文外，人文学科的学者还应当在国际著名的出版社出版专著，同时注重自己文章的被引用率和实际影响力。此外，来自中国科学技术信息研究所、青岛大学等单位的自然科学研究者，也从定量分析的角度提供了论文评价指标的测算方法。　引文评价及同行评价　在目前普遍采用的人文社会科学评价方法中，将引文分析应用于评价学术成果及其影响力，无疑是最有代表性的一种方法。南京大学信息管理系、评价基地副主任叶继元教授提出，为了准确理解和利用引文的评价功能，利用概念分析法和社会学原理，可以通过分析引文、参考文献、文献注释概念的异同，考察引文的含义和类型的多样性，来论证在一定条件下引文的有序性和层次性，探讨引文的本质及其一定的评价功能。同时，他对目前片面利用引文的评价功能的现象，提出了对策性的建议。　来自中南大学的学者，就通过被引频次评价来进行成果评价的方式进行了深入探讨。他们认为，被引频次评价是指用学术论文发表以后被引用的次数来评价以学术论文形态表征的研究成果，是评价与学术论文有关的期刊、学科、国家、单位、个人的一种方法。被引频次评价是由美国科学信息研究所倡导的、以学术论文为载体的研究成果评价体系。目前，被引频次评价似乎已成为评价期刊学术论文质量和科学等学术水平的唯一方法，其实，它不是万能的。被引频次评价只适应于基础研究，不适于开发研究，在应用研究方面有很大的局限性。　在同行评议问题的讨论中，有学者认为，我国目前虽然也有一些高等教育评价中介机构，但主流的评估还是由政府职能部门组织的。从执行情况来看，缺陷不少。首先，为评估而评估，使高校不堪重负；其次，形式主义、弄虚作假现象比比皆是。现有的评估指标过多强调数量和规模，这种导向本身存在引导有误的问题。有鉴于此，重视中介机构的社会化评价，坚持同行评议原则，将有助于解决上述问题。同时，这也是政府职能转变的重要一步，使教育部门能集中精力加强宏观管理，而不必再担心中介机构的社会化评价不够准确和科学。只要坚持将定量指标和同行评价的专家定性分析相结合，将评价指标体系、评价方法、程序和结果对外公开，增强透明度，并接受大学和公众的质疑，大学评估甚至各种科学奖励，也可以交给经过批准委托的中介机构去做。当然，中介机构也有越轨、腐败行为，但克服起来，成本较低。　此外，来自浙江大学、上海交通大学等单位的学者，从定量分析的角度探讨了评价领域的一些前沿问题，如h指数、g指数等用于评价学术机构、学术期刊和学者等方面的问题。　学术期刊及论文评价　学术期刊评价作为人文社会科学评价的一个重要范畴，既取得了一定的科学性发展，同时也出现了一些问题，比如唯核心论、评价指标单一、小众化评价等等。在这个问题的探讨中，有的学者认为，学术期刊的一个重要使命是要引领中国社会科学研究实现两个根本性转变：一是从那种因西方化倾向所导致的中国之缺位中解放出来，重新找回或发现中国。当然，这里的中国不是意识形态视野中的中国，也不是中国传统知识视野下的中国，更不是西方知识视野下的中国，而是一个基于中国自己的文化身份与政治认同、具有后发发展经验并处于世界结构中的当下中国。二是从那种唯学科化倾向所导致的肢解化的中国中解脱出来，用问题导向的、综合性的交叉学科或无学科性研究去解释处于变革中的整体性中国。中国社会科学期刊只有引领中国社会科学实现了这样两个根本性转变，进而促进中国社会科学的知识转型，才能够用综合性研究成果使西方社会比较确切地认识整体的中国。　有学者指出中国社会科学期刊目前存在的一个主要问题是，中国社会科学期刊不仅在国际，而且在国内的学术影响力也很有限。比如研究者个人在学术论文或专著的撰写过程中，一般征引的都是其他论者的个人专著或论文集，而很少引用或不引用散见于各种学术刊物中的研究相同论题的论文。有相关统计数据可以证明：法学研究方面，中国法学研究者著作的他引率要比他们所发表的学术论文的他引率高得多；哲学研究也是如此，20002007年，各类哲学期刊的h指数相对较低（最低为1，最高仅为12），这说明，哲学学者特别注重著作引用，尤其是经典书籍，而论文引用相对较少。　针对核心期刊存在的问题，有学者提出治理建议：要调整评选机构，确保评选结果科学公正；明确核心期刊的使用方向，加强对核心期刊的监管力度；净化科研环境，使核心期刊健康生长。　从期刊及论文评价定量分析的角度出发，来自南京大学信息管理系的几位学者，以一段时期内的引文数据为基础，对不同学科领域的学术期刊h指数进行了计算，并从h指数排名、与期刊被引篇次、与影响因子的对比等方面对计算结果进行了深入地分析研究，以此揭示不同领域学术期刊的学术影响及分布规律。; 个人分类: 科研评价|3154 次阅读|0 个评论

三谈“量化”: 等离子体科学 2009-3-4 20:50; 写了两篇，评者各抒己见。自己也觉得意犹未尽，再写几个字。中国的 SCI 论文总数已经数一数二了。我们已经有了量的基础。看数据曲线，自 93 、 94 年开始， SCI 论文总数开始起飞，变线性增长为指数增长。一路超英赶美，高歌猛进。这不能不说是这些年量化评价体系的成果。但中国显然不是一个科研水平数一数二的科技强国。这就说明这个数字量并不反映实际的质。所以，现在到了考虑质的时候了。对科研工作来说，还有另外一层特殊性。笔者个人认为，对科研工作的量化其实是一种矮化：第一，矮化了管理者。就是管理者自己承认自己不行：看不出什么是高水平的科研工作，只能借助于量化的数字来区分（因为这比较容易，小学生都知道二大于一）；第二，矮化了评价者。也就是说，管理者们既觉得自己不是伯乐，也不相信评价专家们有伯乐的水平，而是假设这些专家们也只知道二大于一；第三，也矮化了科学工作者。因为这是把教授、科学家当成计件工来管理：极端的例子，如按你的业绩点来付酬。我们这几年一直在说：要以人为本。如果我们的管理体系、评价体系要以人为本，首先就应该尊重人才：尊重我们的教授、科学家们可以对自己、对同行有一个高水平的要求和评价。而不是只考虑管理上成本低、容易操作，见数不见人。而且，片面追求量化的结果，一是造成一些有创造性的研究人员没有足够的时间、精力、和良好的环境去做自己喜欢的、真正有创意的工作；二是造成一些人沉迷于数字上的成就而不向提高自己创造性能力的方向去努力。更糟糕的，就是制造连自己都不看第二眼的垃圾。量化评价体系所以存在，自有其合理性。但是这种统计性质的方法，更适用于较大的样本（比如高考，而且即使是高考，也不能就凭一次量化测量就决定一个孩子的终身）；或者在要解决有和无的阶段（比如 90 年代；比如刚开始科研 career 的研究生）。越是高层次的人才、高层次的工作，越不应该采用。; 个人分类: 燕园夜话|5974 次阅读|1 个评论

采用“代表作评审制”如何？: rqyang 2008-12-8 07:51; 12 月份是考核和填表的繁忙季节，论文、著作、奖项、经费等的数量是评价一个人一年工作好坏的主要标准。现在推而广之，一个人的水平甚至一个单位的水平也基本上采用了这类评价标准。我参加过多次学校人才引进面试会，其中有些应聘者的面试演讲也采用的这种纯量化标准和方法。面试讲得简单明了、有条有理，我听了其论文、奖项、课题等的数量也赞叹不已。但我总憋不住要提问：能否重点谈谈你具体的研究内容和主要贡献？用现在时髦的话来说：有什么具体的重大或比较重大的创新点？现在提职晋升的时候基本上也是以数量为主，特别到高层的评审，被评人员讲解就给那么一点时间，怎么办？几个主要量化指标一罗列，评委们基本上也就心里有数了。结果是，如果在 8 篇论文和 2 篇论文的人中选一个， 2 篇论文的人很难逃脱被淘汰的命运。越来越依靠这些量化指标来评价一个人的水平和贡献，其弊端已经很明显，因为只考虑量不考虑质的评价标准是不全面的，其指挥的方向是偏离航道的。但是目前的评价状态怪谁呢？被评审人员说，现行的领导关心的就是这些量，我不讲这个能行吗？评审人员说，评审时人员那么集中，参加评审人员的专业那么广泛，不看量怎么评？领导说，从上到下不都是强调量化评估吗？ 211 、 985 、学校排名不都是看这些指标吗？如果学校被排出前 10 名或落到 100 名以后，校领导是要负历史责任的！所以这样的评审标准还得继续，原因据说就是还没有更好的办法，就像高考一样，分数还是要的。我觉得也是个理。但是据说有些单位就不是这么干的，有胆子大，不跟潮流的。前几天我看过一篇文章，说中国社会科学院就没有这么做。他们考核和晋升采用的是代表作评审制。被评审人员主要讲你的代表作，评审人员主要根据代表作的质量来评估你。据说一位因经常发表文章而闻名的被评审人员，兴致勃勃的罗列出了累计几百万字的一堆文章，反复讲述外界有多好的反应，但评审人员说没有一篇像样的代表作，结果没有通过。而一些文章不是很多，但代表作很有水平的人却顺利被晋升。我们搞自然科学的这样做行不行，可以再深入考虑，但起码可以说其它路还是有的。以代表作为主的评审方法，至少让人们知道质的重要性，可以让人们静下来搞研究，搞教学，刻苦钻研，提高质量，使之成为有用的成果。它不容易会使人那么浮躁，那么想尽办法虚扩数量，这也有利于清除一些学术腐败和不正之风的源泉。以代表作为主的评审方法，对评审人员也是一个考验。你要是这方面的专家，不能滥竽充数，不能用篮球裁判去吹足球赛，也不能加加减减就解决问题。现在把量化指标搞到不适宜的地步，这很危险。大家可能都知道，中国人搞量的本事是很大的。想当年大跃进时，水稻亩产一万斤，全民炼钢铁，到处放卫星，我经历了那个时代，当时轰轰烈烈，最后国家遭难，人民受苦。仔细回想一下，以代表作为主的评审方法也不是一种新事物。在评职称时许多单位都要求送 3 篇代表作给外部专家评审，这实际上是学术评审的一个传统，可惜这种传统现在被忽视了、被淡化了甚至被遗忘了。当然以代表作为主的评审方法也不是万能的，它需要大环境的配合，也需要个人道德修养的支撑，也需要一些统筹兼顾的配套政策融合，反正它不是加加减减地那么简单，也得下功夫去研究。最后想起了陈景润，同样一个人，如果用代表作评审他，他就是一个合格的研究员，一个大有成绩的数学家；如果用现在的量化指标考核他，他就要下岗待业，科学家的队伍中就没有了他。鼓励大家认真写好每一篇论文，让它能代表你的水平！; 个人分类: 日记随想|7535 次阅读|14 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 评价体系

相关帖子

相关日志

关闭安全验证