审查|《自然》:解放编辑双手,AI审查图像造假、学术不端( 二 )


一些学术团体和公司告诉《自然》杂志,期刊和政府机构正在试用他们的人工智能软件,但Proofig是第一个公开客户信息的公司。除了AACR,美国临床调查学会在7月份开始使用Proofig的软件在《临床调查》杂志(JCI)上审查手稿,美国临床调查学会期刊的执行编辑莎拉·杰克逊(Sarah Jackson)说。伦敦独立学术出版公司SAGE的转型负责人海伦·金(Helen King)称,今年10月SAGE Publishing杂志在其五份生命科学期刊中采用了该软件。
Proofig的软件从论文中提取图像,并将它们成对地进行比较,以找出共同特征。一般而言,论文的检查时间大概在一两分钟内,Proofig的创始人德罗·科洛德金·加尔(Dror Kolodkin-Gal)说,该软件还可以纠正棘手的问题,例如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。“计算机比人类视觉更有优势。”他说,“计算机不仅不会感到疲倦,运行速度也会更快,而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响。”
关于图片检查的成本,加尔拒绝详细讨论定价问题,但他表示与出版商签订的合同往往根据论文中的图像数量收费,同时也取决于手稿的数量。他说,这相当于每张纸的收费“接近几十美元而不是几百美元”。
杰克逊说,在《临床调查》杂志中,该软件发现的问题比以前工作人员手动审查的问题要多。虽然工作人员仍然需要检查Proofig的输出结果,但重要的是该期刊已经拥有处理各种图像问题的人工智能系统。“我们真的觉得严谨的数据是我们期刊的绝对标志。我们认为这值得花时间和金钱。”杰克逊说。同时,在美国癌症研究协会的期刊中,埃万科说许多作者很高兴在发表之前就发现了他们的图片重复错误。
三、AI+人工,多个出版商自研软件与此同时,位于瑞士洛桑的出版商Frontiers开发了自己的图像检查软件AIRA(人工智能审查助手),作为自动检查系统的一部分。一位发言人说,自2020年8月以来,一个研究图像完整性的团队一直在内部使用AIRA,用来对所有提交的手稿进行图像检查。但该软件标记的大多数论文实际上没有出现问题,仅有大约10%需要编辑团队跟进。Frontiers拒绝透露AIRA标记的论文数量。
包括比克和罗斯纳在内的图像完整性专家表示,他们自己还没有尝试过AIRA或Proofig,很难评估尚未使用标准化测试进行公开比较的软件产品。罗斯纳补充说,除了重复之外,检测是否通过PS删除或裁剪部分图像也很重要。“人工智能软件可能是视觉筛选的有用补充,但它可能无法替代当前形式。”
“不过,我相信这最终将成为稿件筛选的标准。”比克补充道。
尚未采用人工智能软件图像筛选的出版商提到了成本和可靠性问题。美国科学公共图书馆PLOS的一位发言人谈道,他正在“热切地”监控这项研究的进展情况,这些工具可以“可靠地识别常见的图像完整性问题并且可以大规模应用”。荷兰出版集团爱思唯尔(Elsevier)称,它们“仍在测试”软件,但它的一些期刊会在发表前筛选所有论文,并“使用软件工具和手动分析的组合”检查图像。
一位发言人说,2020年4月,学术出版商Wiley为临时接受的手稿推出了图像筛选服务,目前有120多家期刊使用,但目前这是由软件辅助的手动筛选。《自然》杂志的出版商Springer Nature称,它正在评估一些外部工具,同时整理数据以训练自己的软件,该软件将“结合互补的人工智能和人工来识别有问题的图像”。
四、蛋白质印迹都能伪造,推进跨出版商检测普尔韦尔说:“EMBO Press杂志仍然主要使用手动筛选,我不太相信商业产品的成本效益比。”而且普尔韦尔是定义软件标准的跨出版商工作组的成员,“我毫不怀疑,我们很快就会拥有高级工具。”
普尔韦尔担心欺诈者可能会了解该软件的工作原理,并使用人工智能软件生成人们和软件都无法检测到的虚假图像。尽管还没有人表明此类图像已经出现在研究论文中,但去年发布在提供分发服务的网站BioRxiv上的一份预印本表明,论文中有可能出现与真实数据无法区分的生物图像的伪造版本,例如蛋白质印迹。

审查|《自然》:解放编辑双手,AI审查图像造假、学术不端
文章插图
《细胞生物化学》杂志中论文内蛋白质印迹图片(图片来源为中国青年网)
但研究人员正在解决这个问题,印第安纳州西拉斐特普渡大学的计算机科学家爱德华·德尔普(Edward Delp)在美国国防高级研究计划局资助的一个项目中领导了一个团队,该团队正在研究检测人工智能伪造图像的软件,并专注于伪造的生物图像,例如显微镜图像和X射线,一篇描述该系统的论文正在审查中。