小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账

贾浩楠发自凹非寺量子位报道|公众号QbitAI
Deepfake模仿生成人脸效果出众 , 真假难辨 。
小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账
文章图片
由此引发的争议和担忧 , 使得各大平台先后封杀了Deepfake 。
但最近 , 外媒又报道了不法之徒用音频版Deepfake开始了新的诈骗活动 , “一血”就拿下24.3万美元(约182万人民币) 。
棘手的是 , 目前安全专家毫无破解之法 。
发生了什么?
今年6月 , 一家美国的科技公司员工收到了“自家”CEO发来的语音邮件 , 要求他“马上协助完成一笔紧急的生意” 。
但是 , 这次CEO的声音听起来却有一点怪:
音频Deepfake来自量子位00:0000:05
是boss的声音没错 , 但是感觉机械了点 , 尖锐了点 , 而且这种语音邮件的联系方式也很反常 。
这位员工还是比较机敏 , 把事情上报给了公司法务 , 终于证实这是一起合成人类语音的诈骗事件 。
随后 , 这家公司把相关资料提供给了美国安全咨询公司Nisos来调查 , 但结果却无法令人满意 。
【小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账】专家挠头 , 表示无解
Nisos使用Spectrum3d音频频谱图工具分析了Deepfake语音邮件的音频记录 。
技术人员注意到了音频频谱图中的峰值反复出现 。 Nisos怀疑是Deepfake创作者用多个轨道的声音合成后播放 , 以此来伪造某一目标人物的音色 。
小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账
文章图片
此外 , 音频频谱断断续续 , 与正常的人类录音不一致 。 以1.2倍速度播放时 , 这段音频听起来更像是文本转语音的软件合成结果 。
最重要的一点 , 研究人员没有在这段音频中检测到任何背景噪音 。
小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账
文章图片
比较Deepfake音频和正常人类录音 , 可以发现真实情况下 , 频谱的音高和音调更加平滑 , 而且背景中总能检测到噪音 。
但是 , Nisos的分析也只能到此为止了 , 因为缺乏更多的数据样本 , 研究人员无法知晓或推测生成音频的算法模型细节 。
Nisos找到了一个疑似诈骗犯使用的电话号码 , 但是没有任何注册身份信息 , 出于法律原因 , Nisos没有回拨号码去联系 。
小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账
文章图片
所以 , 目前来看 , 还没有识别和追踪诈骗者的技术手段 。
但研究人员总结了Deepfake音频的特点 。 Deepfake音频创作者为了创建更为逼真的音频 , 通常需要满足如下几个条件:
1、截获目标人物几乎没有背景噪音的高质量音频;
2、在对方不需要或无法回电、交谈的情况下发送音频;
3、以留言的形式避免与音频接收者实时交谈 。
以前发生过吗?
2019年9月 , 英国出现了第一起Deepfake音频诈骗事件 。
犯罪分子使用音频版Deepfake对英国一家能源公司高管的声音进行模仿 。
该公司的执行董事在接听诈骗电话后将超过24.3万美元汇入了一个匈牙利账户 。
第一笔进账后 , 骗子接着打了第二个要求转账的电话 , 这才引起了怀疑 。
目前 , 该罪犯仍未被抓获 , 但据外媒报道 , 这起案件中的Deepfake音频效果及其逼真 , 不仅模仿了音色 , 对于标点、语调的把握也十分到位 , 甚至还学会了公司boss的德国口音 。
小辉搞科技 靠「老板语音」骗走182万!音频版Deepfake让员工乖乖转账
文章图片
今年2月 , 互联网安全公司Symantec报告了三起Deepfake音频诈骗案例 , 犯罪分子通过电话会议、YouTube、社交媒体以及TED演讲获得了公司高管的音频 , 然后用Deepfake算法复制高管的声音 , 致电财务部门的高级成员要求紧急汇款 。