算法|危险算法“达利”,开启“图片造假”新高度( 二 )


这个图像输入Dalle的搜索文字是:“一辆未来汽车在雾中滑行”
不过 , 从Dalle2这个名字就能看出 , OpenAI曾在此前推出过向大众开放的第一代版本 , 然而我在试用后 , 严重怀疑第一代达利 , 可能仅仅装了一个印象派画风滤镜 。
譬如 , 当我输入“马斯克是个‘吹牛逼大王’” , 出来的都是脸部扭曲的马斯克大头照:
歪脸的马斯克
但短短2年 , 第二代达利就取得了惊人的进步 , 而这取决于算法模型的重新设计 , 因为初代版本或多或少是GPT-3的一种扩展 。
当然 , 新版本也有不少问题 。
譬如 , 输入“把艾菲尔铁塔送上月球”后 , 出现的图像仅仅是一张“夜晚下的埃菲尔铁塔” 。 所以 , OpenAI的科学家们还在输入更多数据改进它 。 另外 , 仔细观察这些生成的图像 , 你会发现一些“弱点”:
像很多刚“出生”的算法模型一样 , 达利在描绘“手脚”等细节上仍然非常吃力 。 很明显 , 宇航员的手脚 , 以及猫的爪子都有一点不自然 。
输入文字:骑着马的宇航员 。 很明显手脚细节有问题
但无论如何 , 达利都是个值得让我们赞一声“牛逼”的技术进步 。 甚至于 , 由于这波能力表现突出 , 它引发的恐慌 , 不亚于此前文字生成模型GPT3带来的文字造假争议 。
纽约时报援引亚利桑那州立大学计算机科学教授苏巴拉奥的话直言不讳:“你可以用它来做好事 , 但你肯定可以用它来做更加疯狂的事情 , 包括深度伪造的照片和视频 。 ”
没错 , 虽然工程师展示出的这些作品 , 看起来艺术创造水平非凡 , 但与所有人工智能系统的典型特征相同 , 它一定会从训练自己的大量数据属性中继承某种“偏见” 。
譬如 , 当你输入“律师” , 系统结果都是这样的:
所有律师都是男性 , 且大多看起来是白人
算法的性别与人种偏见问题 , 自诞生之日便在欧美地区争议多年 , 迄今都无法解决 , 甚至有愈演愈烈之势 。 这也是导致包括亚马逊、谷歌等公司无法大规模部署人脸识别系统的关键原因之一 。
另外 , 试想一下 , 当初在“换头”算法盛行 , 外网网友喜欢把特朗普等领导人的头像移植到某个搞笑电视剧里 , 引发捧腹大笑;而达利的出现 , 是否有能力让我们不费吹灰之力 , 便可以做到任意输出大量政治造假照片 。
甚至于 , 当输入“某某吸毒、打架斗殴”这类显然足以陷害他人 , 改变他人命运的关键词 , 如果都会出现毫无违和感的图像 , 那么会带来什么后果?
与工程师对技术的痴迷不同 , 纽约时报的读者们对达利算法的评价极为犀利 , 思考深度不可小觑 , 甚至可以说直击人类的灵魂:
人们将不得不对他们在网上看到的几乎所有东西持怀疑态度 。
这个系统的出现 , 会让“天平”向一个更加奇异与危险的世界倾斜 。
人类还没有在哲学上发展到能够负责任地使用技术的程度 。 就像加密货币一样 , 骗子似乎也总是被技术那“厌恶人类”的一面所吸引 。
我很高兴这个工具没有被公开 。 如果这件事公开了 , (我)最明智的做法是完全脱离网络和电视 , 避免与那些想告诉你自己在网络上看到什么东西的人有任何接触 。如果未来全息影像成为主流 , 那么我们将为子孙后代创造一个反乌托邦式的地狱 。
正如社交媒体与技术革命一样 , 硅谷的能力远远超过人们的批判性思维 。 我们现在生活在一个教育被忽视了几十年的世界里 , 人们分析事物的能力已经让位于“应用公式” 。 与此同时 , 硅谷技术的发展正在提供不可抗拒的便利 。 因为我们很多人都忙于生存 , 所以我们支持这种便利 , 甚至没有时间来反思它的影响 。 因此 , 我们现在不再是挥舞锤子的人 , 而是大多数的钉子 。
输入“空乘工作者” , 出现的都是女性乘务员形象
我认为 , 关于人工智能的普及已经足有七八年 , 而大众之如今仍然会心生恐惧 , 是因为体验过被监控和数据之网牢牢困住的感觉后 , 即便惊喜于达利系统的强大创造力 , 也早就超越了“事不关己、高高挂起”的心态:
不知道这些曾经的笑话 , 什么时候会落到自己头上 。
正是鉴于西方社会这种对达利又惊又恐的态度 , OpenAI已经反复公开强调 , 这绝对不是一个产品 , 自己仅仅是想了解算法的能力与局限性 。
他们保证会严格控制达利的使用权 , 只会向一小部分经过严格审查的测试人员开放;未来只会在艺术家工具层面做一些有限制的尝试 。