AI翻唱——VITS
Linux
关键过程命令行
1 | scp -P 16140 -r outputsuxingjie root@sdly.blockelite.cn:/root/vits/so-vits-svc-4.1-Stable/dataset_raw |
Window
搭建GPU环境
配置独立显卡,安装NVIDIA Driver,安装CUDA。
搭建python环境
安装Anaconda。
1 | # 初始化 |
PackagesNotFoundError: The following packages are not available from current channels的解决办法
获取项目
1 | 到目标路径,git或download项目 |
处理干声
使用 Ultimate Vocal Remover,去除伴奏和和声。
- 去除伴奏利用 Demucs;Demucs,Vocals,1,v3 | UVR_Model_1,GPU Conversion。
- 利用 VR Architecture 去除和声,WINDOW SIZE:320,AGGRESSION SETTING:20,6_HP_Karaoke-UVR,GPU Conversion + VocalsOnly。
音频切片
使用 Audio Slicer,切片音频。把音频切成30s以内的片段,且去除没有人声的片段,只保留有人声的片段。
放置数据集
so-vits-svc-4.0/dataset_raw 目录下创建一个文件夹,放所有切片数据放进去,文件名就是人声名。
模型训练
将声音编码器模型放入pretrain
目录下;
预训练底模文件: G_0.pth
D_0.pth
,放在logs/44k
目录下;
扩散模型预训练底模文件: model_0.pt
,放在logs/44k/diffusion
目录下。
音色替换
执行推理,替换音色
人声伴奏合成
AU等工具合成
云训练平台
AutoDL云计算平台:https://www.autodl.com/console/instance/list
开源镜像平台:https://www.codewithgpu.com/image?search=RVC
JupyterLab:在AutoDL控制台点击快捷工具,直接到达。(管理终端,支持文件管理和命令行执行)
Gradio:在AutoDL控制台点击快捷工具,直接到达,或者命令行终端复制public URL到达。(可视化模型使用终端)
后台运行Python
1 | nohup python xxx > output.log 2>&1 & |