审查|《自然》：解放编辑双手，AI审查图像造假、学术不端( 二 )

一些学术团体和公司告诉《自然》杂志，期刊和政府机构正在试用他们的人工智能软件，但Proofig是第一个公开客户信息的公司。除了AACR，美国临床调查学会在7月份开始使用Proofig的软件在《临床调查》杂志（JCI）上审查手稿，美国临床调查学会期刊的执行编辑莎拉·杰克逊（Sarah Jackson）说。伦敦独立学术出版公司SAGE的转型负责人海伦·金（Helen King）称，今年10月SAGE Publishing杂志在其五份生命科学期刊中采用了该软件。
Proofig的软件从论文中提取图像，并将它们成对地进行比较，以找出共同特征。一般而言，论文的检查时间大概在一两分钟内，Proofig的创始人德罗·科洛德金·加尔（Dror Kolodkin-Gal）说，该软件还可以纠正棘手的问题，例如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。“计算机比人类视觉更有优势。”他说，“计算机不仅不会感到疲倦，运行速度也会更快，而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响。”
关于图片检查的成本，加尔拒绝详细讨论定价问题，但他表示与出版商签订的合同往往根据论文中的图像数量收费，同时也取决于手稿的数量。他说，这相当于每张纸的收费“接近几十美元而不是几百美元”。
杰克逊说，在《临床调查》杂志中，该软件发现的问题比以前工作人员手动审查的问题要多。虽然工作人员仍然需要检查Proofig的输出结果，但重要的是该期刊已经拥有处理各种图像问题的人工智能系统。“我们真的觉得严谨的数据是我们期刊的绝对标志。我们认为这值得花时间和金钱。”杰克逊说。同时，在美国癌症研究协会的期刊中，埃万科说许多作者很高兴在发表之前就发现了他们的图片重复错误。
三、AI+人工，多个出版商自研软件与此同时，位于瑞士洛桑的出版商Frontiers开发了自己的图像检查软件AIRA（人工智能审查助手），作为自动检查系统的一部分。一位发言人说，自2020年8月以来，一个研究图像完整性的团队一直在内部使用AIRA，用来对所有提交的手稿进行图像检查。但该软件标记的大多数论文实际上没有出现问题，仅有大约10%需要编辑团队跟进。Frontiers拒绝透露AIRA标记的论文数量。
包括比克和罗斯纳在内的图像完整性专家表示，他们自己还没有尝试过AIRA或Proofig，很难评估尚未使用标准化测试进行公开比较的软件产品。罗斯纳补充说，除了重复之外，检测是否通过PS删除或裁剪部分图像也很重要。“人工智能软件可能是视觉筛选的有用补充，但它可能无法替代当前形式。”
“不过，我相信这最终将成为稿件筛选的标准。”比克补充道。
尚未采用人工智能软件图像筛选的出版商提到了成本和可靠性问题。美国科学公共图书馆PLOS的一位发言人谈道，他正在“热切地”监控这项研究的进展情况，这些工具可以“可靠地识别常见的图像完整性问题并且可以大规模应用”。荷兰出版集团爱思唯尔（Elsevier）称，它们“仍在测试”软件，但它的一些期刊会在发表前筛选所有论文，并“使用软件工具和手动分析的组合”检查图像。
一位发言人说，2020年4月，学术出版商Wiley为临时接受的手稿推出了图像筛选服务，目前有120多家期刊使用，但目前这是由软件辅助的手动筛选。《自然》杂志的出版商Springer Nature称，它正在评估一些外部工具，同时整理数据以训练自己的软件，该软件将“结合互补的人工智能和人工来识别有问题的图像”。
四、蛋白质印迹都能伪造，推进跨出版商检测普尔韦尔说：“EMBO Press杂志仍然主要使用手动筛选，我不太相信商业产品的成本效益比。”而且普尔韦尔是定义软件标准的跨出版商工作组的成员，“我毫不怀疑，我们很快就会拥有高级工具。”
普尔韦尔担心欺诈者可能会了解该软件的工作原理，并使用人工智能软件生成人们和软件都无法检测到的虚假图像。尽管还没有人表明此类图像已经出现在研究论文中，但去年发布在提供分发服务的网站BioRxiv上的一份预印本表明，论文中有可能出现与真实数据无法区分的生物图像的伪造版本，例如蛋白质印迹。

文章插图
《细胞生物化学》杂志中论文内蛋白质印迹图片（图片来源为中国青年网）
但研究人员正在解决这个问题，印第安纳州西拉斐特普渡大学的计算机科学家爱德华·德尔普（Edward Delp）在美国国防高级研究计划局资助的一个项目中领导了一个团队，该团队正在研究检测人工智能伪造图像的软件，并专注于伪造的生物图像，例如显微镜图像和X射线，一篇描述该系统的论文正在审查中。