王彦峰 袁汝兵 张素娟

探索科研水下冰山,弥补成果评价短板
2021-10-18 15:40
来源:中国科学报

 

国务院办公厅印发《关于完善科技成果评价机制的指导意见》提出,要建立全新的科技成果评价机制,开展多层次差别化评价,加快形成一流科技创新生态环境。科研数据是一种体量巨大的科研产出形式,是托举所有科研成果的水下冰山,但一直未被视为科研成果,被排除在科研评价体系之外。近年来,科研数据共享机制逐步建立,在科研活动中的重要性日益凸显。重新发现科研数据的科学价值,将其作为一种新的成果形式进行评价,恰逢其时。

数据是科研活动的第一成果形式

科研数据包括各类科研仪器产生的原始记录,以及在此基础上产生的各种分析计算结果,有数字、文本、图谱、音视频、生物序列等类型。科研数据是科研活动的第一产出形式,承载着全部的研究信息。科研数据是科研人员智慧和努力的结晶,因此也是科研活动的第一成果形式。

传统科研范式中,科研人员之间的信息交流通常以成果为主要内容,科研数据一般仅作为科研诚信的证据使用,不直接用于交流。这种研究范式和行为习惯在一定程度上制约了科研数据的流动,甚至导致大量科研数据资源的闲置和丢失。科研数据的成果属性被忽视,其科学价值未得到充分利用。

近年来,开放科学理念崛起,科研数据成为科学开放共享、广域协作的重要载体,对研究活动的重要性日趋凸显。有些学科领域中,数据成为所有研究活动的必要支撑条件。例如,1990年启动的人类基因组计划,在11年中完成了人体2.5万个基因、30亿个碱基对的测序工作,人类后基因组计划就是在这个数据集的基础上产生和发展起来的。

数据是科研活动产生的体量最大的成果形式。与论文等常规意义上的科研成果相比,科研数据具有体量巨大和显示度低两个特点,是名副其实的“水下冰山”。现代科研仪器飞速发展,科研数据的产生速度飞速增长,欧洲大型强子对撞机LHC每秒产生的数据量为1GB,我国2019年建成的FAST天文望远镜每小时产生的观测数据量达到2.8TB。科研数据生产已经逐步发展为一个专门的领域,数据生产者和使用者的分工已初见端倪,需要有适合的评价体系应对这一变化。确立数据资源在科研成果评价体系中的地位,势在必行。

科研数据共享是科学新范式的需求

依据吉姆·格雷(Jim Gray)的理论,人类科学历经了实验科学的第一范式、归纳总结的第二范式,正处于仿真模拟的第三范式,而基于大数据研究的第四范式已初露端倪,并显示出巨大的发展潜力。科学的第四范式以数据密集型研究为特征,对数据的需求量远超从前。小型科研团队自身产生的数据已无法满足研究需求,科研数据必须在全球领域高效流通,才能发挥最大的作用。以开放科学引导的科学范式变革,其根本目的是为了让科研信息沟通更高效,科研数据共享是促进科学范式变革的必要条件和迫切需求。

科研数据共享需要遵从FAIR原则,即可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable)。科研数据的开放度和共享度将成为成果评价的重要指标,评价的重心逐渐由研究成果向研究过程前移。以数据的共享范围、对后续研究的影响作为标准,评价数据生产者的科学共享,这种机制符合开放、共享的理念。

我国已试点设立数据共享与评价的相关管理政策。2018 年国务院办公厅发布《科学数据管理办法》,将数据共享作为政府资助研究的原则。但总体上还处于探索阶段。

制度与技术并重建立科学数据评价机制

正确评价各类科研数据的科学价值,建立相应的评价机制,是实现数据共享的先决条件,具有现实的重要性和时间上的紧迫性。建立更具针对性的数据成果评价机制是一个复杂的过程,需要多处发力,制度建设与技术手段研究并重。

在制度方面,需要在国家层面为科研数据正名,确认“开放共享的科研数据属于科研成果的一种形式”,这是所有后续工作的先决条件。要实现这一条件,一是要树立科研人员数据共享的意识,培养数据开放的习惯;二是要强化落实各级纵向科研项目结题过程中的数据交汇工作,将科研数据产出作为结题考核指标组成部分;三是要在职称评审、评奖等活动中,将科研数据共享数量和使用率纳入评审标准当中。此外,在政策管理上,还需要从法律层面,建立健全科研数据的权属制度,使数据分享过程中产生的所有权、收益权等问题的解决有法可依;从国家安全层面出发,划出红线,保证科研数据的流通能够在安全的范围内进行。

在技术方面,由于数据共享是新型科研信息传播形式,过去的计量方式难以对传播的效果进行量化,需要借助先进信息技术满足这一需求。一是要进一步推进科研数据交流共享平台的建设,在保障数据安全的前提下,方便科研人员分享和使用科研数据;二是将替代计量指标和网络影响力纳入成果评奖指标体系,使用开放科学监控器来对科学研究的质量、贡献和影响进行评估;三是引入区块链等新兴信息技术,以实现对数据重复使用的有效实时计量。区块链技术因其开放性、防篡改性、匿名性、去中心化以及可追溯性等特征,有可能成为数据共享评价机制中的一种有力工具。

综上,将共享数据纳入科技成果评价体系,符合科学发展趋势,是建立科研新范式的需要。面向科学研究新场景、新模式、新业态,以自由、开放、合作、共享的开放科学理念,建立科研数据评价机制,适应新的科研合作、知识共享和科学组织模式,将弥补现有科技评价体系的短板,有助于最终建立符合科技创新规律的科技成果评价新机制。这一改变必将对构建新发展格局和实现高质量发展产生重要的支撑作用,也为我国科技强国建设,向高水平科技自立自强迈进,拓展新的发展思路。

(作者单位:袁汝兵,北京市科学技术研究院科技智库中心;王彦峰、张素娟,北京市科学技术研究院科技情报研究所)

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。

分享到:

0
一周排行