一亩三分地分享 http://blog.sciencenet.cn/u/whocj Taylor & Francis集团 高级副总裁,向科学家致敬。

博文

反剽窃软件CrossCheck工作原理简介 精选

已有 30801 次阅读 2010-9-14 00:31 |个人分类:未分类|系统分类:论文交流|关键词:学者| 剽窃, CrossCheck, CrossRef

这几天浙大学报张月红老师发表于Nature的一篇通讯(特别是其标题Chinese journal finds 31% of submissions plagiarized)在业内引发了一些争议和讨论。从技术的角度,Nature的编辑将标题改得很成功,确实吸引人无数人的眼球,并成为一个热点话题。张老师文中提到了浙大学报英文版B辑在使用了CrossCheck之后所得到的一些统计数据。科学网上似乎还没有人介绍CrossCheck,这里我就开个扫盲贴吧,对此很熟的同仁就不必再往下看了。

在介绍CrossCheck之前,一定先得说一下CrossRef。CrossRef最初是由几家出版商于2000年创立的非赢利性组织,其宗旨是通过出版商之间的集体合作,让用户能够访问原始研究内容。简单的说,就是读者对A期刊某篇文章的参考文献中所列的B期刊的文章感兴趣,可以通过点击这条参考文献(如下图所示),就可直接链接到B期刊的相应文章(全文或摘要,视读者或其单位订阅情况而定)。当然前提是A、B两期刊的出版商都是CrossRef的会员。这种链接机制背后最核心的技术是DOI(Digital Object Identificator,数字对象标识符),就是给网上的每篇文分配一个唯一的身份识别代码。目前CrossRef已有3000多家会员单位(出版商、学协会等)。

 

CrossCheck是由CrossRef推出的一项服务,用于帮助检测论文是否存在剽窃行为。它的软件技术来自于iParadigms公司的iThenticate。CrossCheck的工作原理其实很简单,用户通过客户端将可疑论文上传,然后系统将该论文与CrossCheck数据库中的已发表文献进行比较,最后报告给用户可疑论文与数据库中已发表文献的相似度,以百分比表示,并将相似的文本标示出来。例如可疑论文与已发表文献A文有70%的相似度,与B文有20%的相似度等。但CrossCheck的报告结果毕竟只是经过执行一系列查询与比较算法后的生成的数字和提示而已,至于可疑论文是否真的是剽窃而来,一定需要由相关研究领域的专家(期刊主编、编委或审稿人等)对相似论文进行仔细比较,才能作出比较客观的结论。

Wiley-Blackwell目前正将CrossCheck免费提供给旗下期刊使用,虽并不要求必须使用,但许多期刊的主编还是十分感兴趣,纷纷要求马上开通。这也从一个侧面反映出期刊界对剽窃问题的重视程度。

在对论文的文字部分进行比较方面,CrossCheck确实比较好用,能够帮助期刊发现一些问题。比如,中国等非英语国家的一些作者可能会有意无意地直接套用其他论文的的Introduction或Method中的部分甚至几乎全部的文字,但实验数据、讨论等部分完全是原创性的。这种作法实际上是不妥当的,使用CrossCheck很容易检测出来。但如果期刊直接定性为剽窃并拒稿(Reject),似乎也有点太武断与"冷酷"了,因此有些期刊会将稿件退回(unsubmit),并委婉地请作者对可疑之处进行修改后再重新投稿。

我所管理的一本期刊还遇到过一种情况,某篇稿件的Introduction和Method与另外几篇已发表的论文几乎完全一样,连作者也是一样的。CrossCheck检测的结果自然是相似度很高,但经过期刊主编审查并与作者沟通之后,发现这位作者在相同的目标和背景下,采用相同的方法对不同的实验对象进行了一系列的研究,并且所采用的方法是原创的方法。因此主编在请作者添加了相应的说明和参考文献后,同意将稿件送审。

从另一方面说,在经过CrossCheck检测后,即使相似度为0,也并不能就此认为可疑论文一定就可以排除嫌疑了。因为CrossCheck数据库中的已发表论文只占全世界所有科技文献的一小部分,并且目前CrossCheck还只是最擅长比较英文论文,对其他语种似乎并不太支持。同样,一些手法比较“高级”的剽窃,也是很容易成为漏网之鱼的。

总之,CrossCheck只是一种辅助性的检测手段,只有配合以期刊主编、编辑、审稿人的专业判断能力,才能合理地发挥它的作用。



中国期刊投稿31%剽窃?
https://m.sciencenet.cn/blog-204729-362797.html

上一篇:所谓语不惊人死不休
下一篇:英文论文投稿讲座预告

21 刘伟锋 汤铃铃 梅卫平 王铮 章成志 朱志敏 曹聪 梁建华 刘全生 黄富强 刘钢 金小伟 吴宝俊 耿文叶 李学宽 齐霁 虞左俊 陈健 邝敏 侯振宇 nm

发表评论 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 18:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部