国际科学编辑isechina的官方博客分享 http://blog.sciencenet.cn/u/isechina

博文

论文重复率太高怎么办?哪个软件查重比较靠谱?

已有 22210 次阅读 2019-4-15 09:22 |个人分类:论文写作|系统分类:科研笔记|关键词:学者| 查重, 期刊, 论文

现在论文抄袭、学术打假已经成为学术界、媒体关注的话题。例如最近很火的翟天临和刘梦洁的学术不端事件。一篇优质的论文需要多方面的构成,选题、架构、论述、字数、排版等等,还有一个指标你不能忽视,也无法逃避。那就是 重复率。
投稿前进行论文查重几乎已经是投稿前的必备工作了,但第一次发表论文肯定是一脸懵逼,有什么查重工具推荐吗?重复率多少算危险?重复率过高该怎么办?今天ISE来为你答疑解惑。


查重与撤稿事件关联

这几年来,大量撤稿事件频传,一直是学术出版界热议的一个话题。2017年Springer的107篇医学论文因同行评议造假撤稿事件,美国哈佛医学院的Piero Anvers学术造假撤稿,南京大学青年长江学者梁莹涉嫌学术不端、百余篇之前发表的论文被撤,甚至像《科学》、《自然》这些知名期刊都撤过稿。这些撤稿事件大部分是因为学术不端、一稿多投、同行评审造假、重复率高等原因。

撤稿数上升的原因还可能是出版商自2005年开始使用软件来检查抄袭和重复发表,因此先前无法轻易发现的状况,现在能被找出。早年的论文查重技术还不普及,审稿专家无法保证阅尽相关学科、相关专业方向上的所有刊发论文,出现学术不端的情况难以避免。

如今出版商均表示,会对新收到的论文进行重复率检测,以鉴定是否存在抄袭等问题。

除了被动撤稿外,还有未发表文章主动撤稿,主动下撤文章一般是发现文章在重复率检测中不合格,或存在数据造假、一稿多投等问题。

查重的重要性

事实上,现在绝大部分的国际期刊尤其是一些比较热门的期刊对于论文一般都会在同行评议之前或论文接受之前进行格式审查,而其中最重要的一项就是重复率检查Similarity Check——简称查重。过多的与其他文章内容重复则有被认为抄袭的风险。对于一些相似率比较高的文章,通常会拒稿或让作者返修。

那如何应对期刊的这种审查呢?

正确方法:投稿之前自己先查重。

各查重系统,包含不同收录内容的网络文献数据库,对句子相似度的算法也各有千秋, 最有名的当然是CrossCheck,但它是收费的,并且很贵,官网的价格是每篇100美元!利用该空白,目前市场上假的查重系统泛滥,通过这些系统查重,论文心血被盗取风险巨大,每年都会有人因为在淘宝上检测论文重复率,最终被别人盗发,耽误毕业的事情。2018年 6 月央视曾经也报道过。

我们通常所说的SCI论文查重软件CrossCheck,是由国际上一家非营利性组织CrossRef推出的反剽窃检测服务。

CrossRef是一个基于DOI(Digital Object Identifier,数字对象标识符)实现文献引文跨出版社服务平台链接的参考链接服务系统,用来建立在不同出版商的网络平台上出版的期刊内容之间的链接,使这些文献内容能够更容易被搜索、链接和引用。

国际许多大型科学出版集团(如Elsevier,Springer,Wiley,Taylor&Francis,OUP等)和许多科学学会均是CrossCheck的正式会员。

目前CrossCheck已涵盖了大部分主流的SCI出版商和杂志社,投向这些杂志的稿件,都必须经过CrossCheck系统的查重(在CrossCheck查重不收录,而向Turnitin基础版进行提交后,文章将会被自动收录进数据库,第二次查,将获得重复率为100%)。

SCI杂志社收到的稿件,将会被系统自动送入CrossCheck系统并生成查重报告,查重报告结果会显示在编辑/编委操作界面。

图片来源:浙大学报英文版公众平台 zdxbywb

红圈部分:原稿件与修改稿的相似度变化

ISE也希望能够帮助大家解决这个问题,通过和国外机构合作,帮助大家花很少的钱,获得正宗的CrossCheck查重报告,只需要50欧元即可。ISE英文学术论文查重服务,通过iThenticate支持的Crossref相似度查询软件对论文进行查重。

怎么正确看待重复率(相似度)报告?

重复率报告是表明您的文章和一篇或多篇已发表文章重复的累积数值。请注意,相似度数值高,并不一定意味着抄袭。例如虽然文章有40%的相似度,它可以解读为文章和一篇文章有40%的重复,但是也可能是文章的1%部分和40篇不同的文章有重复。并且,反复出现但合理引用的句子和材料方法中出现的常见测试、仪器或供应商也可能会对相似度有影响。因此,对相似度报告的解读很重要。

下图是ISE出具的一个相似度报告截图:

为了更好的理解相似度,您可以将报告拉到最后一个部分。最后这部分展现了相似度的具体情况---即您的文章和某一具体的已发表文章中被认为重复的部分。按照重复度内容的由高到低排列。相似度最高的那些部分需要非常重视。

ISE还为大家整理了几个精选问答来解读查重和重复率。

Q:我想知道怎么看查重报告,能给我一些指引吗?我在不同的付费网站上为我的论文进行了查重检查,重复率都很低,但网站 的重复率却有 24%,这到底该不该担心?

A:期刊编辑不会完全依赖查重软件的结果。编辑也知道这些工具的限制性,大部分的时候也不会单纯因为查重软件给出的结果直接拒稿,除非比例真的太高,例如超过 30%。

大部分的情况下,编辑会咨询审稿人,酌情决定是否要因为抄袭拒稿。期刊编辑也知道有些内容很难改写,因此也会比较通融那部分的内容,特别是针对方法章节的部分,一般编辑对这个部分的内容重复率接受度比较高。

因此,与其看整体的重复率,重要的是论文里的哪个部分的重复内容最多。如果你仔细看报告,你可以看到重复的内容有进行标记,如果这些内容是在方法章节,那么没有什么好担心的,但如果重复的内容多在前言或讨论部分,就应该尽量再重新写过。如果重复的内容是在结果章节,那就比较麻烦,这个部分不该有重复内容。保险起见,还是尽量改写重复的内容比较好。

Q:杂志社用什么查重系统?

A:查重系统国外一般用两种,iThenticate和turnitin。两者查重结果基本差不多。Turnitin不对外出售,只能高校购买,iThenticate除了对高校开放外,也对外出售服务,单独查一篇是100美金。杂志社选用的一般是iThenticate。

Q:重复率高会影响审稿意见么?

A:一般不会因为重复率高被拒搞的,第一次被杂志社告知重复率偏高不用紧张,淡定一点,降低重复率即可。第二次被告知还是很高需要紧张一下。

Q:重复率要求是控制在多少?

A:大部分期刊是控制在30%内,极其少数的杂志要求在20%以内,注意看投稿须知,这些极少数要求20%重复率的多数会在投稿须知里标示。

Q:哪些部分算重复率?

A:参考文献算不算重复率?大部分的期刊是不会把参考文献加进去一起算重复率,但是也有杂志社非常懒,全文丢进去查重复率。而且很多同志参考文献是从几篇综述或几篇文献中集中参考的,因此,未加参考文献的重复率可能为30%,但是加上参考文献后就变成了40%。这时可以分为两种情况,正常来说,杂志社要求整改,再改参考文献;如果比较谨慎的话,建议包含参考文献降到30%以内。参考文献重复率高,就替换掉部分不关痛痒的参考文献。

Q:正文部分重复率很高如何处理?

A:强烈建议先修改材料方法学,因为大部分人是这里重复。再考虑降低其他部分,其他部分如何降?要么改写,要么重写。

Q:期刊可接受的方法部分重复率大概是多少?

A:期刊对重复率的接受度根据期刊的政策而定,这是由编辑部所进行的内部决议,通常不会透露给外部。一般来说,大部分的期刊都不会接受重复率超过 20% 的论文,但这也要看是哪个章节的重复率比较高,编辑通常比较能够接受方法章节有比较高的重复率,有时候甚至可以接受方法章节有超过 50% 以上的重复率。

所以,如果你的论文的方法章节重复率比较高,而其他章节的重复率较低,那么 25%到30%之间的重复率是可以接受的。你可以先使用在线的查重工具检查你的论文,根据查重报告的内容,检查哪一个章节有比较高的重复率,如果是方法章节,就不需要太担心,但如果是结果或讨论章节的重复率比较高,那么就一定要在投稿之前进行修改。

目前我们能想到的问题就这些,欢迎大家在评论区留言,我们来补充解答。下一期国际科学编辑会探讨SCI查重结果究竟不能超过多少和如何降低查重率。

参考文献:

http://blog.sciencenet.cn/home.php?mod=space&uid=769813&do=blog&id=1054128

http://www.medsci.cn/article/show_article.do?id=341ae311ea



https://m.sciencenet.cn/blog-3387871-1173349.html

上一篇:欧洲大部分大学未能监控开放获取的成本
下一篇:美国的第一份开放获取协议落地!学术界会重新洗牌吗?

2 王卫 王从彦

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 00:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部