氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

AI助力甄别论文工厂 精选

已有 4951 次阅读 2023-6-2 09:44 |系统分类:海外观察

论文工厂是正在严重威胁当今学术出版的毒瘤,ChatGPT能协助写论文,也当然能协助论文工厂作弊,且这种工厂的专业化技术越来越高,最近有一次会议专门讨论这个问题,提出如何解决这些问题的一些思路。不过在人工智能技术的协助下,识别过去来自论文工厂的论文会变得非常容易。先进技术可以打一场时间差战争,今天的技术可能难以识别,但未来技术一定很容易识别出来自论文工厂的论文,对购买者进行秋后算账或许让未来购买工厂论文的人收敛自己的行为。从而实现打击论文工厂的目的。

博主个人认为,论文撰写技术越来越人工智能化,未来的一种可能是论文变得越来越没有个性,越来越没有证明作者能力的价值。所谓发表杂志的等级也逐渐被预印本颠覆。论文作为学术信息的载体,将来也许会演变为原始信息的存储。所谓学术论文,也只有短短几百年历史,未来学术论文可能有逐渐消失的可能。

图片1.png

AI intensifies fight against ‘paper mills’ that churn out fake research (nature.com)

人工智能(AI)的进步使出版商解决论文工厂日益严重的问题的努力复杂化,论文工厂是按订单生产假科学论文的公司。生成式人工智能工具,包括ChatGPT等聊天机器人和图像生成软件,提供了制作论文工厂内容的新方法,这可能特别难以检测。这些是研究诚信专家在5月24日举行的峰会上讨论的挑战之一,该峰会的重点是论文工厂问题。

“随着人工智能的迅速提升,论文工厂生成越来越合理的原始数据的能力将快速提升,”新南威尔士州健康病理学和澳大利亚悉尼大学的分子生物学家和出版物完整性研究员Jennifer Byrne说。

“我见过人工智能刚刚生成的假显微镜图像,”德国海德堡欧洲生物学会出版社联合会的图像数据完整性分析师Jana Christopher说。但她说,能够毫无怀疑地证明图像是人工智能生成的仍然是一个挑战。

语言生成AI工具(如ChatGPT)也提出了类似的问题。“一旦你有一些东西可以证明某些东西是由 ChatGPT 生成的,就会有一些其他工具来打乱它,”克里斯托弗说。(但是,道高一尺魔高一丈!)

柏林自由大学(Free University of Berlin)的社会科学家、独立研究诚信分析师安娜·阿巴尔金娜(Anna Abalkina)怀疑,由于同行评审过程的冗长,这些人工智能工具在学术文献中变得更加明显可能会有所延迟。也许在接下来的几个月里,“我们将看到第一批论文”,她说。

Byrne,Christopher和Abalkina是上周UNITED2ACT峰会的参与者,该峰会由出版伦理委员会(COPE)召集,该委员会是一个专注于学术出版伦理的非营利组织,总部设在英国伊斯特利,以及国际科学,技术和医学出版商协会(STM),总部设在牛津。峰会汇集了国际研究人员,包括独立研究诚信分析师,以及来自资助机构和出版商的代表。

“这是我们第一次让一群人聚在一起,共同制定一系列行动,我们将采取这些行动来解决这个问题,”COPE的受托人兼研究诚信顾问Deborah Kahn说。该小组打算很快公布其联合行动计划。

在检测论文工厂作品时,“合成图像、合成文本等绝对会带来额外的挑战”,STM子公司STM Solutions的项目总监Joris van Rossum说。“人们普遍意识到,筛查有可能变得更加困难,”他说。

人工智能协助

卡恩说,尽管毫无疑问会积极使用人工智能来支持研究人员撰写论文,但仍然有必要区分用人工智能撰写的合法论文和完全捏造的论文。“我们必须真正研究我们如何识别这些东西,以及如何确保人们真正进行了研究。我们有多种方法可以做到这一点,“她说。

峰会期间讨论的一项策略是要求作者提供实验的原始数据,可能带有数字水印,使出版商能够确认这些数据是真实的。

Christopher说,目前,出版商对提交原始数据的要求差异很大。因此,考虑到研究领域之间的差异,为出版商提交原始数据制定一套统一的要求可能会有所帮助,她说。

总部位于英国阿宾登的出版商泰勒与弗朗西斯(Taylor & Francis)出版道德与诚信总监萨宾娜·阿拉姆(Sabina Alam)对此表示同意,但表示这些标准需要时间来实施。“我无法想象这是一夜之间的翻转,因为现实是许多机构实际上没有资源来提供数据管理基础设施,”她说。“我们不想惩罚实际研究。

峰会还讨论了更广泛地解决论文工厂问题的其他策略,包括为研究人员组织一个宣传日或一周,以及确定出版商在不违反数据保护规则的情况下分享可疑论文工厂相关信息的方法 - 例如当出版商同时收到提交时。

STM正在继续开发自己的论文工厂检测软件,同时还通过其完整性中心整理其他地方提供的类似工具的资源。论文工厂的明显增长增加了对此类技术的需求 - 无论是在提交时检测假纸还是识别已经发表的假纸。

泰勒和弗朗西斯是使用此类工具的出版商之一,阿拉姆说,越来越多的道德案件 - 潜在的不当行为被标记为进一步调查 - 正在升级到她的团队。根据阿拉姆的说法,这些案例中大约有一半是因为论文工厂。她的团队看到,从 2019 年到 2022 年,道德案件的数量增加了十倍以上——今年到目前为止,案件数量几乎与 2022 年全年一样多。它似乎已经商业化并扩大了规模,她说。



https://m.sciencenet.cn/blog-41174-1390261.html

上一篇:大脑信息处理神经场理论
下一篇:肝星状细胞:从名声不好到稳态调控枢纽

9 杨正瓴 晏成和 曾杰 王启云 崔锦华 郑永军 孙颉 蒋金和 谌群芳

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 14:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部