清澈如初|5秒钟让python克隆别人的声音
AI越来越强大 , 不仅能模仿别人的表情 , 还能模仿别人说话的声音和语气 , 以后电话听到好友的声音也有可能不是本人哦 , 今天小编来讲讲一个实时声音克隆库Real-Time-Voice-Cloning
github地址为:
该库是使用谷歌的开源声音处理算法(SV2TTS)实现 。
SV2TTS是一个三阶段的深度学习框架 , 它允许从几秒钟的音频中创建语音的数字表示 , 并使用它来调节经过训练的文本到语音模型 , 以生成到新的语音 。
如果您只想克隆您的声音(而不是其他人的声音):我建议在Resemble.AI上使用免费计划 。
首先 , 因为您将获得更好的语音质量和更少的韵律错误 , 其次 , 因为它不需要像此回购协议那样的复杂设置 。
具体的步骤
一、安装要求
需要Python 3.6或3.7才能运行该工具箱 。
安装PyTorch(> = 1.0.1) 。
安装ffmpeg 。
运行pip install -r requirements.txt以安装其余必需的软件包 。
二、下载预训练的模型
下载地址:/wiki/Pretrained-models
三、(可选)测试配置
在下载任何数据集之前 , 您可以使用以下方法测试配置:
python demo_cli.py
如果所有测试都通过 , 那您就很好了 。
四、(可选)下载数据集
对于仅使用工具箱的情况 , 我只建议下载LibriSpeech/train-clean-100 。 下载地址: , 提取内容
五、启动工具箱
然后 , 您可以尝试使用工具箱:
python demo_toolbox.py -d
要么
python demo_toolbox.py
取决于您是否下载了任何数据集 。 如果您正在运行X服务器或出现错误Aborted (core dumped)
这个就是操作界面了 , 先录音然后输入文字就可以模仿别人的声音说话了
六、启用GPU支持
注意:启用GPU支持是很多工作 。 如果您要训练自己的模型 , 则需要进行设置 。 有人花时间为如何安装所有内容提供了更好的指南 。 我建议使用它 。
此命令将安装其他GPU依赖项和推荐的软件包: pip install -r requirements_gpu.txt
【清澈如初|5秒钟让python克隆别人的声音】此外 , 您需要确保正确安装了GPU驱动程序 , 并且您的CUDA版本与PyTorch和Tensorflow安装相匹配 。
- 静默如初|三天三夜舞蹈永不停歇-问问腕表可以7天7夜
- 清澈如初|不是微信好友如何转账?教你两种方法,家里老人都需要
- 曹曦月|终于知道她为啥和金瀚传绯闻,气质清纯如初恋,谁看了会不爱?
- 跳跳糖哪里跑|我长大,你依旧年轻:蒋依依杨颖如初,而他们从母子变姐弟
- 下饭视频|5秒钟就能get的懒人发型,不要再天天披头散发啦!
- 穿搭|33岁宋茜“扮嫩”成功,穿紫色毛衣温柔治愈,气质清纯如初恋
- 旗袍公馆|33岁宋茜“扮嫩”成功,紫色毛衣配半裙温柔治愈,气质清纯如初恋
- 鑫珊时尚|李冰冰扎拳击辫显活力满满 活泼比V眼神清澈动人
- 清澈如初|一个狂热的爱国者,说出了他是怎么爱国的,最后还送了一句话
- 静默如初|蓝盈莹真会穿,用抹胸配西装,下面还穿条一分裤,比例太优胜