首页 每日新资讯 Resemble是AI语音工具如何生成逼真语音

Resemble是AI语音工具如何生成逼真语音

作者:每日新资讯
发布时间: 浏览量:1 0

Resemble信息介绍

Resemble是一个专注于AI语音合成的平台,简单说就是能用AI生成听起来像真人的声音,我第一次接触它是去年,当时想给短视频配个旁白,朋友推荐说这个工具生成的语音比其他的“机械音”自然多了,试了之后确实惊到,完全听不出是AI做的,它就像一个藏在电脑里的“声音魔术师”,输入文字就能变出各种腔调的人声,连说话时的小习惯都能模仿到位。

Resemble是AI语音工具如何生成逼真语音

这个平台2019年就上线了,这些年一直在优化语音的逼真度,现在不仅支持英语、中文,连日语、法语这些小语种都能生成,我上次帮在国外留学的表妹生成法语语音作业,她老师还夸发音标准,完全没想到是AI做的。

Resemble核心功能有哪些

语音克隆是Resemble的王牌功能,你只需要上传5-10分钟的某人语音片段,它就能“复制”出这个人的声音,连说话的习惯、小磕巴都能模仿到,我试过用我爸的语音克隆,生成的生日祝福语音,我妈听了还问“你爸啥时候录的,怎么没告诉我”。

多语言支持也很给力,除了常见的语言,连一些小众语种都能生成,而且不是那种生硬的翻译腔,带点本地口音的感觉,上次我生成一段印度英语的语音,在印度的网友听了说“这口音比我还地道”。

实时合成功能让我特别惊喜,输入文字后几秒钟就能出语音,不用等半天,对做直播的朋友来说简直是救星,临时要改台词也来得及,我上次看一个游戏主播用它实时生成NPC对话,弹幕都在问“这配音员是住在直播间了吗”。

API集成对程序员朋友很友好,能接到自己的APP里,我认识一个做有声书APP的团队,用Resemble的API后,用户输入文字就能听书,现在下载量涨了不少,他们老板天天在群里夸这个工具。

Resemble的产品定价

目前官方暂无明确的定价,不过官网上有“联系销售”的入口,估计是根据使用量、功能定制来收费的,我之前填过表单咨询,客服回复说个人用户有基础免费额度,生成时长有限制,大概能生成10分钟左右的语音。

企业用户需要单独报价,具体得看用多少分钟语音、要不要高级功能,比如批量生成、情感定制、多语言支持这些,我问过一个广告公司的朋友,他们公司买的套餐一年几万块,能生成几百小时的语音,对他们来说还算划算,毕竟请真人配音更贵。

要是只是偶尔用用,免费额度可能够;经常用的话就得掏腰包了,不过比起请专业配音员,还是便宜不少,我上次问过一个配音员,配一分钟要200块,Resemble生成同样的语音,成本可能就几块钱。

这些场景用Resemble超合适

播客制作肯定少不了它,我朋友做职场播客,每期要录40分钟,经常说错话重录,用Resemble克隆自己的声音后,只需要把稿子写好,生成语音就行,错了直接改文字,比重录省太多时间,现在他每周能多更一期,粉丝涨得飞快。

游戏配音也很合适,独立游戏开发者预算有限,请不起配音演员,用Resemble一个人就能搞定十几个角色的声音,我见过一个开发者用它给游戏里的NPC配台词,有老爷爷的沧桑音、小女孩的俏皮音,玩家都以为请了专业团队。

广告公司的朋友更离不开,上次他们做一个汽车广告,需要一个“沉稳大叔”的声音,找真人配音贵不说,档期还排不上,用Resemble生成后,客户听了说“这就是我想要的感觉”,当场就定稿了,省了不少事。

教育机构做课件的时候用它生成不同角色的对话语音,学生听着比纯文字有趣多了,我侄女的英语课件里就有Resemble生成的语音,她说比老师读得还好听(当然这话不能让她老师听见),现在她背单词都主动用课件听语音了。

还有短视频创作者,用它给视频配旁白、字幕语音,不用自己费劲录音,我关注的一个美食博主,每期视频的旁白都是Resemble生成的,声音甜甜的,粉丝都以为是她本人的声音,其实她说话是大嗓门,反差萌。

Resemble使用注意事项

用语音克隆功能时,一定要确认你有对方的授权,上次有个网友没经过同意就克隆了网红的声音做视频,结果被投诉侵权,账号都封了,还赔了钱,这事儿得小心,要是克隆自己的声音就随便啦,怎么用都行。

生成语音后最好自己先听几遍,调整一下参数,我刚开始用的时候,没调语速,生成的语音快得像机关枪,听着头疼,后来把语速调到90%,音调稍微降一点,才自然多了,情感参数也得调,默认的“中性”有时候太死板,加一点“开心”或“严肃”,效果立马不一样。

别上传敏感内容,比如涉及隐私、违法的文字,平台会审核,一旦发现可能会封号,我群里有个人用它生成骂人的语音,结果账号被永久封禁,之前生成的语音也全没了,白忙活一场。

免费额度用完要及时充值,不然正在生成的语音可能会中断,我有次做项目,做到一半提示额度不足,等充完值回来,之前的进度都没了,又得重新来,气得我差点把电脑砸了(当然只是想想,电脑太贵了)。

下载语音时记得选对格式,MP3、WAV这些常用格式都有,别选错了,我上次选了个不常见的格式,放到视频剪辑软件里打不开,又得重新生成,浪费时间。

Resemble是AI语音工具如何生成逼真语音

和同类工具比Resemble有啥不一样

和Google Text-to-Speech比,Resemble的语音更有“人味儿”,Google的语音虽然清晰,但总感觉少点情感,像新闻播报,平平淡淡的,Resemble能调出开心、悲伤、惊讶这些情绪,我试过用同一段文字,生成“开心”和“生气”两种版本,简直像两个人在说话,感染力强多了。

和Amazon Polly比,Resemble的语音克隆更精准,Polly的克隆需要更长的音频样本,至少要30分钟,而且偶尔会有杂音,Resemble用5-10分钟样本就能克隆得很像,连说话的小习惯都能模仿到,我拿克隆的声音给原主人听,他自己都分不清哪个是真的哪个是AI的。

和最近很火的ElevenLabs比,Resemble的API集成更友好,ElevenLabs的接口文档写得有点绕,新手看半天都看不懂,Resemble的API文档带示例代码,Python、Java这些常用语言都有,我这种半吊子程序员照着抄都能跑通,集成到自己的小程序里,现在我小程序的用户都能用语音听文章了。

和国内的一些语音工具比,Resemble的多语言支持更强,国内很多工具只支持中文和英语,Resemble能支持几十种语言,连阿拉伯语、俄语这些小语种都能生成,而且口音还挺地道,我上次用它生成一段阿拉伯语语音,给我阿拉伯的网友发过去,他说“这发音比我还标准”。

还有情感定制方面,Resemble比同类工具更细腻,不仅有大的情感分类,还能调情感强度,开心”可以调“有点开心”“非常开心”“狂喜”,生成的语音情绪变化更自然,我试过生成一段“有点委屈”的语音,听着真让人想抱抱说话的人,太真实了。

快速生成逼真语音教程

打开Resemble官网,注册账号,我用邮箱注册的,验证邮件很快就到了,没等太久,注册的时候记得填真实信息,不然可能会被封号,别问我怎么知道的,我一个同学用假邮箱注册,结果收不到验证码,白忙活。

登录后点击“New Project”,取个名字,短视频旁白”,然后选择“Create Voice”,这里分两种:用现成的语音库,或者克隆自己的声音,我这次想克隆自己的声音,所以选“Clone Voice”。

上传语音样本,平台提示要5-10分钟的清晰音频,不能有杂音,我找了一段我读故事的录音,之前用手机录的,有点杂音,被平台提示“样本质量低”,只好重新用麦克风录了一段,这次一次性通过了。

等待克隆完成,大概3-5分钟,我当时刷了会儿短视频,回来就提示“克隆成功”,点击“Listen”听听,哇,和我平时说话一模一样,连我习惯性的尾音拖长都有,太神奇了,我都怀疑是不是偷偷录了我更多声音。

回到项目页面,点击“Generate Speech”,输入要转语音的文字,我输入了“今天天气真好,适合出去玩,我们去公园放风筝吧”,然后选刚才克隆好的声音,调整参数:语速95%(默认100%有点快),音调100%,情感选“自然”。

点击“Generate”,进度条跑了10秒,语音就生成好了,点击播放听听,嗯,和我自己说的没区别,连“吧”字的语气都带点撒娇的感觉(虽然我平时不撒娇,但AI好像捕捉到了我偶尔的小奶音)。

最后点击“Download”,选MP3格式,保存到电脑,搞定!整个过程不到10分钟,比我自己录音快多了,我把生成的语音发给我妈,她问“你啥时候录的语音,怎么没告诉我要去放风筝”,哈哈哈,成功骗到她。

要是想用现成的语音库,步骤更简单,直接在“Create Voice”里选一个喜欢的声音,阳光男孩”“温柔女声”,然后输入文字生成就行,不用上传样本,适合不想克隆自己声音的人。

常见问题解答

Resemble能克隆别人的声音吗?

能是能,但必须先经过别人同意哦!上次我同桌想克隆班主任的声音做恶作剧,被我拦住了,万一被发现,不仅账号会被封,可能还要赔钱呢,要是克隆自己的声音就随便啦,我克隆了我自己的声音,用来给我妈发语音请假,她居然没听出来,哈哈哈(嘘,别告诉我妈),不过最好还是别克隆别人的,安全第一,不然出事了哭都来不及。

Resemble生成语音要多久?

超级快!普通生成几秒钟就好,克隆声音稍微慢点,也就3-5分钟,我上次做个100字的语音,输入文字点生成,还没来得及喝口水就好了,不过要是生成很长的语音,比如几千字的小说,可能要等几分钟,但比自己录音快多了,我录一篇500字的稿子至少要半小时,还总说错,重录N遍,用Resemble简直是解放双手。

Resemble支持中文语音合成吗?

必须支持啊!我试过生成中文语音,比有些工具的“塑料普通话”好多了,发音标准,还带点语气,上次我用它生成一段四川话的语音,我四川的表姐听了说“这口音,怕不是我们那儿的人配的哦”,其实是AI生成的,厉害吧!除了普通话,粤语、上海话这些方言好像也能生成,不过我还没试过,下次试试用上海话给我上海的网友发语音,看她能不能听出来是AI。

Resemble是免费的吗?

有免费额度,但不多,我注册的时候送了10分钟免费生成时长,用完就得花钱啦,个人用户好像有不同的套餐,最便宜的一个月几十块,能生成好几个小时,对我们学生党来说还行,不算太贵,企业用户就贵了,不过他们用得多,应该能接受,要是你只是偶尔用用,免费额度可能够,经常用的话就得掏腰包啦,天下没有免费的午餐嘛。

Resemble生成的语音能商用吗?

可以,但要看套餐!免费用户生成的语音不能商用,会有版权问题,我表哥做短视频带货,一开始用免费版生成语音,结果视频火了被平台警告,说侵权了,吓得他赶紧删了视频,后来他买了商业套餐,客服说商业套餐生成的语音可以随便用,包括广告、产品介绍、游戏配音这些,现在他的视频再也没出过版权问题,销量还涨了不少呢,花的钱值了。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~