文章图片
文章图片
《深度合成十大趋势报告(2022)》发布 , 其中谈到:“趋势四:深度合成领域开源项目数与讨论度持续攀升” 。
2017年 , 名为“Deepfakes”的用户利用深度合成技术制作的成人视频在Reddit社区中疯狂传播 , 迫于公众舆论压力 , Reddit网站将该用户封号 。
该用户随即在全球最大的代码开源平台GitHub上公开了实现该技术的源代码 , 瞬时引发了技术爱好者的广泛关注与讨论 。 此后 , 开发者们不断创造和丰富更多的深度合成相关技术的项目与代码 , 以“GAN”、“NeRF”、“TTS”等关键词进行检索后发现 , 2017年以来的深度合成领域的项目数量显著增长 。
在这些开源项目中 , 也涌现出了一些很有代表性的方法 , 这些方法受到越来越多的关注 , 也被应用在了不同的场景之中 。
如faceswap项目 , 可实现识别和交换视频中的人脸的功能 , 自2018年初开源 , 曾一度登上GitHub排行榜第二位 , 目前已获得超过4万的关注量 。
基于这些开源方法 , 更多的技术爱好者持续讨论并且做出补充和贡献 , 共同促进深度合成方法在合成质量、制作效率等方面不断升级和迭代 。
以图像方向、音频方向、文本方向中具有代表性的5个开源项目为例 , 其Star数量在2021年均已突破1万(GitHub中Star数超过1万的项目占总项目数的比例低于百万分之九) 。
其中 , DeepFaceLab、first-order-model、stylegan、Real-Time-Voice-Cloning、gpt-2项目可分别实现面部替换、动作或表情操纵、人脸等图像生成、声音复刻、文本生成的功能 。
四种深度合成形式在目前都存在一定局限 , 比如人脸替换需要对源图像和目标图像进行多角度的面部特征数据训 , 面部表情操控实现的前提是目标人物面部直对镜头 , 并且能保持一段时间 , 想要变换人脸角度就要更多的数据 , 更多的训练 。 而且 , 自然融入运行的视频之中的语音 , 用语音合成技术也较为困难 , 都需要很多技术和人力的投入 。
《深度合成十大趋势报告(2022)》由清华大学人工智能研究院、北京瑞莱智慧科技有限公司、清华大学智媒研究中心、国家工业信息安全发展研究中心、北京市大数据中心近日联合发布 。
(完)
出品人 , 亲爱的数据
【融资|清华大学人工智能研究院:人工智能换脸开源项目数量,持续攀升】
- 骨科|融资丨「德康医疗」完成5亿元B轮融资,杭州湾智慧医疗产业基金领投
- 客服|融资丨「易聊科技」完成亿元B轮融资,中青旅红奇基金领投
- 等离子体|谷歌人工智能团队的最新成果: 控制聚变反应堆
- 创投圈|创业者注意了!一种新的融资方式,正在创投圈流行
- 英诺赛科|钛信资本领投「英诺赛科」近30亿人民币D轮融资丨全球投融资周报
- 钛信资本领投「英诺赛科」完成近30亿人民币D轮融资;企业支出管理平台「分贝通」完成1.4亿美元C+轮融资|全球投融资周报 | 分贝通
- nmp筛查及鉴别诊断解决方案提供商步锐科技完成数千万元A轮融资,春华创投领投
- 箱体|专注温控相变技术产品研发,纯钧一年完成三轮融资
- 依图科技数亿元新一轮融资完成首次交割,香港博约国际投贷基金领投
- 大会|零点有数荣获2021世界人工智能大会优秀人气奖