张晴丹

论文突破200万篇后,arXiv却渐失人心?
2022-01-24 20:50

 

2022年伊始,预印本服务器arXiv收获了一份新年大礼,全球科学家通过其发布的论文突破了200万篇。

本该是庆贺时刻,但《科学美国人》(Scientific American)却发了一篇负面报道,分析了arXiv当下暴露出的诸多问题,引起科学界热议。

中国作为世界上论文数量产出最多的国家,arXiv的重要性不言而喻。在arXiv上,来自中国的论文数量也已经排名全球第二。

如今,许多中国科学家每天上班都看arXiv,这已经成为了习惯。因此,他们对于arXiv的痛点也颇多吐槽,特别是发到arXiv的论文被长时间审核,令发布时间延后。

arXiv带来的学术争鸣,又有趣又刺激

经过30多年的飞速发展,arXiv已经成为数学、物理、天文、计算机等多学科的重要学术交流平台。

因为在arXiv,科研人员在无须同行评审的情况下就可以自主张贴论文,尽早公布研究结果,抢占科学发现所有权;那些已发表的论文,同样可以在arXiv上张贴,让更多的研究同行了解、交流。

通常,在arXiv张贴预印本有三种方式:第一,在论文投稿的同时张贴到arXiv,期待更多的同行看到并且展开学术讨论和交流;第二,在论文即将接收或接收之后张贴到arXiv,考虑到出版平台的受众数量有限或需要购买数据库才能阅读,把已经定稿的论文贴到免费公共平台,无疑会增加阅读量;第三,纯粹为了表达自己的学术观点,这类稿子一般不太可能会被正式期刊接收,但arXiv提供了一个可以自由发声的平台。

无论是哪种方式,都弥补了科技文献出版的不足。这也是arXiv火起来的原因。

在传统期刊,论文的审稿周期和发表周期都特别长,平均在30天以上,有的甚至需要数年时间。如果在此期间,作者选择不公布论文结果,在此领域的研究进展就显得“落伍”了。显然arXiv预印本的方式,让学术交流更加顺畅,某些热点领域才能迅速发展起来。

中国科学院物理研究所副研究员罗会仟在接受《中国科学报》采访时,根据他的研究经历举例说道:“2008年铁基超导材料的研究,中国科学家在公布新超导材料并刷新临界温度纪录的周期是以天计的,传统期刊再快的评审和发表速度,也跟不上在arXiv上发预印本的速度。正因如此,在铁基超导研究的洪流中,中国科学家群体才迅速引领了世界最前沿。”

罗会仟指出,arXiv预印本的快速发表,是抢占credit的重要方式,如今许多重要的发现几乎都以预印本时间为准,已经成为科研圈的“潜规则”。

但在arXiv提前张贴预印本,也会给作者带来“烦恼”。

比如大量的质疑和讨论,可能会导致文章未能走到正式发表就被撤稿;过早公布论文结果,在竞争激烈的科技前沿领域,有人可能会利用不同期刊发表的时间差抢占先机,导致作者丧失成果所有权;预印本中往往存在许多科学错误,而经常发布不成熟预印本的科学家,在同行眼中的信任度下降,不好立足。

罗会仟讲了一个更具体的例子。2014年底,德国科学家A. P. Drozdov和M. I. Eremets等人在高压硫化氢下发现203 K超导电性的论文,最早张贴于arXiv,但科研圈对此质疑声不断,甚至在学术大会上,在场几乎所有人都默认这个结果“可能是错误的”。后来,这篇文章结果经反复审核并补充实验证据后才在Nature正式发表,历经半年后,该研究才受到极大关注。

高压金属氢化物的超导电性研究领域在近些年飞速发展,不断刷新超导临界温度的世界纪录。不少论文都是最先出现在arXiv上,但其中也有一些因为数据质量不过关或者结论过于夸张,而一直未能正式发表。

有趣的是,2020年,美国科学家Ranga P. Dias的研究组在类似的碳—氢—硫体系发现了近室温的超导电性(Tc=287.7 K),他们选择了直接向Nature投稿而不事先贴在arXiv,论文在8月31日投稿,9月8日就迅速被接收。

但因Dias等人论文里的数据“过于漂亮”而广受非议。其中反对最强烈的是J. E. Hirsch(他本人发明了H指数这个论文引用评价方法),他在arXiv先后张贴十余篇论文,讨论Dias乃至所有科学家(包括Eremets等)在氢化物超导方面的实验过程和数据分析问题,其中有的论文在Nature和Physical Review Letters上正式发表。

Dias和Eremets等人也在arXiv上给以回应,科研圈在数次学术会议上也有过激烈的争论。无疑,arXiv的存在,为这个氢化物超导“连续剧”提供了非常合适的场地,学术上的广泛持续争鸣,也保持了这个领域的高关注度。

“这样的现象在科研圈有很多,真是又有趣,又刺激。”中国科学院半导体研究所研究员姬扬在接受《中国科学报》采访时表示,“我认为arXiv存在的意义就是促进科学交流,让科学研究在争鸣中不断向前。”

但是,姬扬认为,arXiv现在的做法已经忘记了这个初心,也因此造成了很多问题。

“arXiv就不该做学术裁判”

目前反映最多的问题就是审核。有一位研究人员抱怨称,他在2017年向arXiv投了一篇很正常的论文,无论题目还是语言都无问题。而在此之前,他已在arXiv上张贴过100多篇论文,这次却很奇怪地被审核两周,最后在没有任何修改的情况下通过审核。

“速度快、效率高”,本是arXiv当初吸粉的筹码。但近年来,在审核员频繁干预下,论文发布的时间延后几天或几周,有些甚至被拒稿。据统计,arXiv上大约有6%的投稿会被搁置,约2%的投稿会直接被拒。

中国科研人员在arXiv上的论文数量已经排名全球第二,但审核员队伍里并没有中国人。作为全球顶级科研论文库,arXiv的审核员大部分都来自美国的研究机构,审核员国籍的失衡会给学术公平性带来很大挑战。

arXiv给出的审核规则,在很多研究人员看来也有失偏颇。“审核员现在成了掌权者,他们能直接决定论文的生死,但因他们所从事领域的局限性,论文在审核中会因个人偏爱而被误杀。”姬扬指出。

2021年8月,我国在量子研究领域作出杰出贡献的两位科学家潘建伟和陆朝阳,也遭遇被arXiv拒稿。这让科研圈非常震惊,意大利博洛尼亚大学理论物理学家Roberto Casadio评估了这篇论文,对拒稿原因百思不得其解。

“arXiv本就不该有审核制度存在,它本身就是一个预印本平台,就不该做学术裁判,他们没有这个能力。”姬扬强调。

他补充道,预印本服务器毕竟不是期刊,审核也不是同行评审。“如果要经历和期刊一样的审核周期,与其在预印本上折腾,还不如直接去核心期刊投稿,哪怕耗费半年一年,也比在arXiv更‘香’。”

但在罗会仟看来,arXiv拒稿和学术期刊拒稿是两个性质的事情,两者不能等同而论。就像在知乎等论坛上发文章,平台完全有权力删帖,而无须知会作者,并不是因为文章本身有科学问题。这些年,在海量的投稿里,arXiv拒绝了大量非常不专业的稿件,这些稿子没有学术交流的价值,拒稿是为了节省大家的时间和精力。

“当然不可否认,在如今稿件剧增情况下,这种审核机制也会造成误杀,但毕竟是个别偶然事件。”罗会仟说。

他个人认为,arXiv的审核机制运行良好,无须纠偏。但读者务必要清楚,arXiv上的预印本论文,不等于正式发表,虽然代表作者观点,却不能代表学术圈的承认。

你还会给arXiv投稿吗?

跟风是每个领域都存在的现象,随着arXiv影响力越来越大,也催生出了其他预印本服务器,比如viXra、bioRxiv和medRxiv等,这些平台以低门槛接受投稿,目的就是为了和arXiv竞争。

一个房间里已站着一头大象,哪还有更多的空间留给其他人。“那些后来者,为了发展自己所以没有什么限制,但是发展空间也不大。而且将来若能做出规模,也有可能和arXiv一样忘记初心。”姬扬说。

当问及将来是否还会给arXiv投稿时,罗会仟表示“肯定会”,在他看来,在arXiv上贴预印本,也不等于投稿给学术期刊,仅仅相当于“免费学术广告”。

他同时也提醒大家,由于arXiv平台并不承担同行评审或正式出版的责任,因此没有纠正科学性错误的义务。这意味着,作者在阅读arXiv论文时,需要有足够的甄别能力,对一些存在明显科学性错误的论文应该能够鉴别。

对于arXiv 科学总监Steinn Sigurdsson提出的“招不到人”“资金缺乏”“审核工作量巨大”等理由,在姬扬看来,这些纯属借口。“现在库里有200多万篇论文,只要把数据库做好,去掉裁判,根本不算事。”

姬扬希望arXiv不要忘了初心,它应该属于广大学者,属于整个科学界,为学术共鸣和科学进步作贡献。“如果arXiv一意孤行,终会渐失人心,将来肯定会被替代。”

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

分享到:

0
一周排行