产业气象站|克隆一个自己的AI来上网课

场景描述:在全球都开启远程办公、远程上课之际 , 一位外国工程师受不了每天的视频会议 , 于是用AI技术「克隆」了一个自己 , 替他去开会 。 而这项技术如果被学生们所用 , 那么后果……
关键词:远程办公视频会议AI克隆
这场席卷全球的疫情 , 各个公司改为远程办公 , 各大高校也相继关闭校园 , 转为在线网课 。
改变了全球的工作方式 , 也改变了广大学生上课、答辩甚至毕业方式 。
但远程办公、网课的局限性 , 让一些人借机想出了五花八门的「开小差」手段 , 比如以下两位优秀的同学:
产业气象站|克隆一个自己的AI来上网课
文章图片
假装上课方案1:录制记笔记视频
产业气象站|克隆一个自己的AI来上网课
文章图片
假装上课方案2:照片代替本人出镜
不过 , 这些「小聪明」比起国外一位工程师的高阶翘班方式 , 还是显得稍微弱了一些 。
克隆一个自己的AI , 替我开会
视频会议并不是适合所有人 , Twitter上有人吐槽现在是活在Zoom的世界 。
微软Teams仅一周就新增1200万用户 , 从3200万增长到4400万(3月11日至3月18日) , 单日会议时长突破了27亿分钟 。
Zoom更是在短短两个多月 , 用户量翻了20倍 , 到达了2亿 。
不过 , 一位外国工程师MattReed近日也发表文章称 , 无法忍受开不完的Zoom会议 。
所以 , 他脑洞大开 , 建立了一个AI驱动的克隆项目Zoombot , 可以克隆一个自己的虚拟形象 , 参加视频会议 。
这个虚拟形象 , 使用最新的AI语音识别和文本语音转换 , 代替他参加Zoom会议 , 不仅可以显示自己的形象 , 还能回答问题 。
我们先看一下这位「克隆人」开会的现场实况:
这魔性的「哈哈哈哈」不是来搞笑的吧?
一开始 , 大家都很难发现出现在会议窗口的这位Reed是个「克隆人」 , 不过 , 后面他说话生硬的语气瞬间翻了车 。
如果技术再精进一点 , 恐怕真能蒙混过关 。
照片、语音识别库、虚拟摄像头 , 搞定!
据Reed介绍 , 这个看起来很高级的「替身项目」 , 具体实现起来并不难 。 他还贴心地给出了教程 , 发表在GitHub:
https://github.com/mcreed/zoombot
他写道 , 事实证明 , 克隆自己比《西部世界》里的克隆大脑简单多了 。
首先 , 他打开Quicktime并执行File-&gtNewMovieRecording , 在这里他截取了一些自己的视频图像;
产业气象站|克隆一个自己的AI来上网课
文章图片
Reed分别截取了自己微笑、讲话、思考的图像
接着 , 基于Artyom.js开源库(一个语音识别JavaScript库) , 构建了一个简单的Web应用程序 , 对其进行扩展开发 , 以便可以听懂并回复一些简单的对话 , 比如:
人类:「你好吗?」
AI:「我很好 , 谢谢你的问候 。 」
人类:「你明白了吗?」
AI:「我听不清你的声音 。 」
人类:「再见 。 」
AI:「以后再和大家聊 。 注意安全 。 」
设置好诸如此类简单的对话后 , 再使用一个叫做ManyCam的软件 , 以webapp为源 , 建立一个虚拟摄像头 , 将Zoom网络摄像头设置为虚拟摄像头 。
到此为止 , 万事俱备 , 只需打开扬声器 , 启动Zoombot , 然后就可以开心地去做自己喜(mo)欢(yu)的事情 。
产业气象站|克隆一个自己的AI来上网课
文章图片
据介绍 , Zoombot项目一共只花费了大约四个小时来构建 , 而Reed又花了大约四个小时进行Zoom会议并记录同事们的真实反应(在试用之前并未告知同事) 。
作者Reed提醒道:「用替身的诀窍是 , 在聊完之前就离开会议室 , 因为一旦进入『我听不清 , 可以重复一遍吗?』的死循环中 , 那可就麻烦了 。 」