AI声音克隆软件:几分钟复制惊人相似声音,操作全解析
最近热度很高的AI声音克隆软件,只需花费几分钟的声音素材哟,短短几分钟便能够迅速复制克隆出相似度令人惊叹的声音呢。
该软件是由那位被称作RVC变声器创始人的“花儿不哭”大佬所开发,GPT - 的出现,将语音克隆被商业垄断的那段历史彻底终结,只要你拥有一张显卡,那么你也能够去玩曾经显得极为高大上的语音克隆了。
软件下载后,解压出来,建议解压到非中文目录下,切记!
于所有操作开展之前,备好那需要送去克隆的声音素材,此声音素材有着要求,比如不得有杂音传出,而且讲话时是吐齿清晰的,其时长大概在3分钟左右便可。
素材的质量,决定合成的效果。
将其所进行解压之后,去运行名为go-webui.bat的文件,如此这般便能够启动webUI界面,在后续的时期里,所有的相关操作,均是在整个页面之上开展进行的。
第一步,素材处理,按照下图演示,填写好路径,其他默认
业界当中最强有力的,AI相关的声音克隆软件GPT - ,能够一键进行包加,并且配有图文教程 。
用中文来进行批量离线的ASR工具,在这儿的ASR模型,要是你用的是中文,达摩与全都行得通,要是是英文,那最好选用它,通过测试之后,其综合效果是最为出色的 。
第二步,训练集格式化

除第一个参数,也就是“实验/模型名”,这个要自行去命名,除此之外,其他的都采用默认设置,之后呢,依照下图,闭着眼睛去点,就可以了。
【AI语音】业界最强的AI声音克隆软件GPT-,一键包加图文教程
最后记得点“开启一键三连”
第三步,微调训练
这个参数,是要依照自身显存开展选择用来针对每张显卡的,12G显存的话应设置在8左右,而其他的情况则需结合自身显存来进行调整 。
训练的总轮数方面,第一个建议所设定的是10,第二个建议所设定的是15,也能够依据自身的需求去进行调整,调整的时候不可设置得过高,因为声音素材是其中的关键所在,不然的话,即便训练再多的轮数也是没有任何意义的。
【AI语音】业界最强的AI声音克隆软件GPT-,一键包加图文教程
先是依照序号展开训练,右侧存在提示信息,结束之后再进行GPT训练,这两类训练速度都很快,显卡性能良好的话,分分钟就能完成 。
第四步,推理
依据下图的行径路途,首先去刷新模型的路径,接续挑选你所训练的模型的名称,此模型挑选乃是后面数字处于最大状态的那个,也就是最为新颖的模型,要将这两者都予以选定。

【AI语音】业界最强的AI声音克隆软件GPT-,一键包加图文教程
最后记得勾选“是否开启TTS推理WebUI”
稍等片刻,TTS推理启动后,会跳转到新的webUI推理页面
第五步,TTS语音合成
【AI语音】业界最强的AI声音克隆软件GPT-,一键包加图文教程
选你的模型,参照语音找一段你先前训练用的素材,3至10秒,别太长,也别太短,能下拉选,若下拉没显示,就在数字4的位置手动选,而后勾选数字5的“开启无参考文本模式 无参考文本时该选项无效” 。
在数字6的位置输入你要转换的文字,最后合成语音。
一键包下载:


欢迎 你 发表评论: