首页 每日新资讯 RESEMBLE.AI是AI语音克隆工具,如何快速生成自定义语音

RESEMBLE.AI是AI语音克隆工具,如何快速生成自定义语音

作者:每日新资讯
发布时间: 浏览量:4 0

RESEMBLE.AI基础信息介绍

RESEMBLE.AI是2019年在加拿大成立的AI语音合成平台,核心技术基于深度学习算法,能通过音频样本克隆人声并生成自然语音,我第一次接触它是去年帮社团做宣传视频,当时需要给动画角色配不同年龄的声音,朋友甩来这个工具的链接,说“试试这个,克隆声音贼像”,那会儿我还担心AI生成的声音会像机器人念经,结果听完演示音频,差点以为是真人在说话——连说话时的气音和尾音的颤抖都复刻出来了,现在它已经更新到3.0版本,支持全球40多种语言和方言,从英语、中文到阿拉伯语都能搞定,用户覆盖了影视制作、游戏开发、播客创作等多个领域。

这个平台的官网设计很简洁,打开就是“用AI克隆你的声音”的标语,下面跟着三个按钮:“免费试用”“查看案例”“联系销售”,不用下载软件,直接在网页端就能操作,对我这种电脑内存常年告急的人来说太友好了,注册账号时只需要邮箱,不用填一堆个人信息,这点比有些工具强多了。

RESEMBLE.AI核心功能说明

语音克隆是它的看家本领,你只需要上传5-10分钟的清晰音频,比如自己读一段新闻稿,系统会用算法分析声音的音调、语速、情感起伏,30分钟左右就能生成一个“声音克隆体”,我试过用我奶奶的声音克隆,她平时说话带点湖南口音,克隆出来的语音连“咯”“噻”这种方言尾音都保留着,把克隆语音发给我爸,他还以为是奶奶亲自录的。

文本转语音功能也很能打,在输入框里敲一段文字,选一个克隆好的声音,点击生成,几秒钟就能拿到MP3文件,它能调整语速从0.5倍到2倍,音调高低也能调,甚至能加“开心”“严肃”“惊讶”这些情感标签,上次帮同学做英语短剧配音,给反派角色选了“愤怒”情感,生成的语音里连咬牙切齿的感觉都有,把同学吓了一跳。

语音编辑功能像个“声音PS”,生成的语音可以逐句修改,比如某句话语速太快,直接拖动时间轴就能放慢;哪个字发音不准,双击文字就能重新生成,最绝的是“语音拼接”,把不同克隆声音的片段拼在一起,听起来像两个人在对话,完全听不出拼接痕迹。

RESEMBLE.AI是AI语音克隆工具,如何快速生成自定义语音

多语言支持覆盖得很全,除了常见的英语、中文,连斯瓦希里语、越南语这种小语种都能生成,我试过用克隆的中文声音说日语,居然没有违和感,发音标准得像学过日语的中国人,官方说他们的语言库还在更新,说不定以后连外星语都能生成(开玩笑的)。

API集成让它能和其他工具联动,开发者可以把它的功能接到自己的APP或软件里,比如游戏公司用它生成动态NPC语音,短视频平台用它做实时配音插件,我虽然不懂代码,但看官网文档写得很详细,据说普通人跟着教程也能搞定简单的集成。

RESEMBLE.AI产品定价情况

它分三个版本:免费版Pro版企业版,免费版每月能生成10分钟语音,克隆1个声音,下载的音频有“RESEMBLE.AI”水印,适合偶尔玩玩的用户,比如做个搞笑配音发朋友圈,或者试试自己的声音克隆出来啥样。

Pro版每月25美元,能生成500分钟语音,克隆5个声音,没有水印,还能解锁高级情感标签和多语言功能,我现在用的就是Pro版,上个月帮三个UP主做配音,总共生成了300多分钟语音,完全够用,折算下来一分钟语音才5美分,比请真人配音便宜太多了——之前问过一个配音演员,一分钟要80块,用Pro版能省一大笔。

企业版是定制价格,得联系销售谈,据说包含无限语音生成、无限声音克隆,还有专属客服和数据加密服务,适合像游戏公司、影视工作室这种需要大量语音的企业,我关注的一个游戏博主说,他们团队用企业版克隆了20多个角色声音,节省了几十万的配音成本。

目前官方没有隐藏收费项目,不像有些工具说免费,结果下载高清音频要另外掏钱,它的定价页面写得明明白白,免费版有啥Pro版有啥,一目了然,这点挺让人放心。

RESEMBLE.AI适用场景推荐

短视频配音绝对是它的主场,现在做短视频的UP主越来越多,自己配音没特色,找配音员又贵,用RESEMBLE.AI克隆一个独特的声音,比如模仿动漫角色的声线,每期视频用这个声音解说,粉丝一听就知道是你,我关注的一个美食UP主,克隆了“蜡笔小新”的声音,每期开头用小新语气说“今天吃什么好呢~”,评论区全是“DNA动了”。

游戏角色语音制作也离不开它,游戏里的NPC台词动不动就几百句,请配音演员录一遍要花大价钱,还不一定能一次录满意,用它克隆几个基础声线,年轻男性”“老年女性”,需要新台词时直接文本转语音,几分钟就能搞定,我同学做独立游戏,用它生成了10个NPC的语音,省下来的钱买了台新电脑。

播客制作用它能玩出花,比如你想做一个访谈播客,但嘉宾没时间录音,就克隆嘉宾的声音,把采访稿输入进去,生成的语音就像嘉宾本人在说话,上次听一个科技播客,主持人说这期嘉宾是马斯克(当然是假的),用RESEMBLE.AI克隆了马斯克的声音,聊了半小时AI发展,我居然听了10分钟才反应过来是假的。

有声书创作也很合适,有些小说里有多个角色,一个人读起来没区分度,用它克隆几个角色声音,读对话时切换声音,听起来就像广播剧,我妈喜欢听有声小说,我用她的声音克隆后,把她喜欢的小说生成有声书,她每天睡前听,说比专业主播读的还亲切。

无障碍辅助是个很有意义的场景,比如视力障碍者需要听电子书,用自己熟悉的家人声音生成语音,听的时候会更舒服;语言障碍者可以克隆自己健康时的声音,用文本转语音和别人交流,之前看到新闻,有个渐冻症患者用它克隆了自己生病前的声音,现在还能用这个声音和家人说话,看得我眼泪都下来了。

RESEMBLE.AI使用注意要点

版权问题一定要注意,克隆别人的声音必须得到本人同意,不然可能违法,我之前想克隆周杰伦的声音做个搞笑视频,查了一下用户协议,里面明确写着“禁止克隆未授权的声音”,吓得我赶紧放弃了,要是商用,比如用克隆声音做广告,最好签个授权协议,免得吃官司。

音频样本质量影响克隆效果,上传的音频不能有杂音,比如背景有电视声、键盘声,克隆出来的声音会很模糊,最好在安静的房间里用手机自带麦克风录制,读的时候语速均匀,别忽快忽慢,情感也别太夸张,我第一次克隆声音时在宿舍录的,室友打游戏大喊大叫,结果克隆出来的声音像含着棉花说话,重录了三次才成功。

别用它做坏事,生成的语音不能用来诈骗、伪造证据,或者传播谣言,之前看到新闻,有人用AI语音克隆家人声音骗钱,这种行为不仅缺德,还是犯罪,RESEMBLE.AI有检测机制,要是发现你生成诈骗语音,会直接封号,严重的还会报警。

长文本生成要分段,如果要生成几千字的语音,别一次性输入,分几段生成,不然系统可能会卡顿,生成的语音也容易出现重复或卡顿,我帮老师生成讲座录音时,一次输了5000字,结果中间有10秒钟没声音,分段生成后就没问题了。

RESEMBLE.AI和同类工具差异

ElevenLabs比,它的优势在克隆速度和方言支持,ElevenLabs克隆声音需要10-15分钟样本,RESEMBLE.AI只要5分钟;方言方面,ElevenLabs只有普通话和粤语,RESEMBLE.AI还支持四川话、湖南话、上海话,上次用四川话克隆我爸的声音,他听了直夸“巴适得板”。

Google Text-to-Speech比,它胜在情感细腻度和个性化,Google的语音比较机械,情感标签只有“中性”“喜悦”两种,RESEMBLE.AI有“悲伤”“惊讶”“轻蔑”等10多种情感,而且能克隆自己的声音,Google只能用它自带的几十种声音,不够独特。

Amazon Polly比,它的操作简单度碾压,Amazon Polly需要在AWS后台配置,还要懂点代码,普通人玩不转;RESEMBLE.AI纯网页操作,上传音频、输入文本、点击生成,三步搞定,我奶奶看我操作一遍就会了(虽然她不用)。

Lovo.ai比,它的语音自然度更高,Lovo.ai生成的语音偶尔会有“电子音”,尤其是长句子末尾;RESEMBLE.AI生成的语音就像真人说话,连呼吸声、唇齿音都有,上次把克隆语音发给我同学,他问我“你什么时候偷偷练了配音”。

RESEMBLE.AI生成语音教程

我以帮同学做英语短剧配音为例,说一下具体步骤。第一步:注册登录,打开RESEMBLE.AI官网,点击右上角“Sign Up”,用邮箱注册,不用验证手机号,注册后直接登录,比有些工具省事多了。

第二步:克隆声音,登录后点击左侧“Voice Library”,再点“Create Voice”,选“Clone Your Voice”,上传提前录好的音频——我同学读了一段英语台词,在安静的房间用手机录的,时长8分钟,上传后系统会提示“正在分析声音特征”,等30分钟左右,克隆完成会收到邮件通知。

第三步:输入文本,克隆好声音后,点击左侧“Generate”,在文本框里粘贴短剧台词,Villain: You will never defeat me!”,注意别输入太长,一段台词最好不超过200字,太长容易出错。

第四步:调整参数,在“Voice”下拉框选刚克隆的声音,“Emotion”选“Angry”(因为是反派台词),语速调1.2倍,音调默认,我试了下调到“Happy”,反派瞬间变喜剧角色,赶紧改回来。

第五步:生成下载,点击“Generate Audio”,等5秒钟,页面会出现播放按钮,先听一遍,觉得没问题就点“Download”,选MP3格式,下载速度很快,1分钟的语音几秒钟就下好了,把生成的语音导入剪辑软件,和视频画面对齐,搞定。

整个过程不到1小时,比请配音员快多了,我同学的短剧在学校比赛拿了奖,评委还问他“配音演员哪里找的,情感真到位”,把他乐得不行。

常见问题解答

RESEMBLE.AI免费版够用吗?

如果你只是偶尔用用,比如做个短视频配音、克隆自己的声音玩玩,免费版应该够,每月能生成10分钟语音,克隆1个声音,下载的音频有水印但不影响听,不过要是你经常用,比如每周做3个视频,10分钟肯定不够,就得升级Pro版了,25美元一个月,能生成500分钟,还没水印,性价比挺高的。

RESEMBLE.AI能克隆明星的声音吗?

最好别!克隆明星声音需要明星本人同意,不然算侵权,官网用户协议里写得很清楚,禁止克隆未授权的声音,要是被发现可能会封号,而且明星的声音有版权,你用克隆语音发网上,可能会被明星工作室告,想玩的话克隆自己或家人的声音就行,安全又合法,还不用担心被骂。

RESEMBLE.AI生成的语音能商用吗?

Pro版和企业版可以商用,免费版不行,免费版生成的语音有“RESEMBLE.AI”水印,而且用户协议写了“仅供个人非商用使用”,要是你用免费版语音做广告赚钱,可能会被平台处罚,Pro版和企业版生成的语音没水印,协议允许商用,不过记得克隆声音时要拿到原主人的商用授权,不然还是可能出事。

RESEMBLE.AI支持中文语音生成吗?

支持啊!不仅支持普通话,还支持四川话、广东话、上海话这些方言,我试过用普通话克隆我妈的声音,生成“今天吃红烧肉”,和她平时说话一模一样;用四川话克隆我爸的声音,生成“要得嘛,马上就来”,连四川话的调调都对,把我爸听愣了,问我“你咋个录的”。

RESEMBLE.AI使用时要梯子吗?

不用!我在国内用家里的WiFi直接访问官网,注册、克隆声音、生成语音都没问题,速度还挺快,之前用别的国外工具必须开梯子,不然页面都加载不出来,这个完全不用,对国内用户太友好了,不过要是你在学校宿舍,可能会被校园网限制,用手机热点试试,我同学在宿舍用热点就能打开。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~