首页 每日新资讯 ElevenLabs是AI语音生成工具,如何制作自然语音

ElevenLabs是AI语音生成工具,如何制作自然语音

作者:每日新资讯
发布时间: 浏览量:1 0

ElevenLabs基础信息介绍

我第一次听说ElevenLabs是在一个AI工具分享群里,有人发了一段语音,说这是AI生成的,我愣是没听出来,后来才知道,这是2022年在伦敦成立的一家AI公司搞出来的东西,主打就是“让机器开口说话像真人一样自然”,官网首页写着“Voice AI for creators”,意思就是给内容创作者用的语音工具,不管你是做视频、播客还是有声书,都能用上,它背后用的是深度学习模型,据说分析了几十万小时的真人语音数据,才能让生成的声音听起来不僵硬,连呼吸、停顿这些小细节都有。

现在它支持的语言还挺多,英语、中文、西班牙语、法语都不在话下,甚至能混合几种语言生成语音,比如一段话里先说中文再说英语,过渡也不会别扭,我注册账号的时候,发现它界面设计挺简洁,没有乱七八糟的按钮,新手进去也能很快找到生成语音的入口,这点比有些工具强多了。

ElevenLabs核心功能有哪些

要说ElevenLabs最拿得出手的功能,**语音生成**肯定排第一,你随便输段文字,选个预设的声音,点一下生成,几秒钟就能出来一段语音,我试过输“今天天气真好,我们去公园散步吧”,选了个叫“Michael”的男声,出来的语音像邻居大哥在跟我聊天,连“吧”字的语气都带着点邀请的感觉。

然后是**语音克隆**,这个功能让我觉得有点神奇,你只需要上传3-5分钟的清晰录音,比如自己说话的音频,系统就能“复制”出你的声音,我上传了一段自己读故事的录音,第二天克隆完成,用克隆出的声音读新的故事,我妈听了都问“你什么时候录的这段,我怎么没印象”,语音像镜子里的自己,连呼吸的节奏都分毫不差。

还有**情感调节**,这个功能能让语音带上不同情绪,同一个文本,调“开心”参数,声音会轻快上扬;调“悲伤”参数,语速会变慢,音调也会低沉,我做视频旁白时,给不同场景配不同情绪的语音,观众说比以前用机械音的时候代入感强多了。

ElevenLabs是AI语音生成工具,如何制作自然语音

**语速和语调控制**也很实用,有时候生成的语音太快,听不清内容,把语速调到80%,就能慢慢说;想强调某个词,这个功能超好用”,把“超”字的语调拉高一点,效果立马不一样。

ElevenLabs产品定价情况

ElevenLabs分免费版和付费版,价格是按“生成语音时长”来算的,免费版每月能生成10分钟语音,生成的音频会带一个小水印,而且不能商用,只能自己私下用用,比如做个小作业或者给自己听的播客。

付费版分几种档次,我记得基础版是19美元/月,每月能生成10小时语音,去掉水印,支持商用,还能解锁更多预设声音,进阶版是79美元/月,生成时长提到40小时,多了批量生成和API调用功能,适合经常需要大量语音的用户,要是公司用,还能定制企业版,具体价格得联系他们销售谈,官网没写固定数。

我现在用的是基础版,每月10小时完全够我做视频旁白和播客了,折算下来每小时不到2美元,比请真人配音便宜多了,性价比挺高的。

ElevenLabs适用场景推荐

如果你是**视频创作者**,用它给短视频、教程视频配旁白再合适不过,我之前做美食教程,自己录音总紧张忘词,用ElevenLabs生成语音,稿子写好直接生成,一遍过,省了好多重录的时间。

**播客主播**也能用上,要是你不想露声,或者没时间录音,用它生成播客内容,选个符合节目风格的声音,听众根本听不出是AI,我朋友做情感播客,用“Emma”的女声,每期节目下面都有人问“主播声音好好听,是专业配音吗”。

**有声书制作**是个大场景,以前找真人录一本有声书得花几千块,还得等好几天,用ElevenLabs生成,输完文字几小时就能搞定,成本直接砍半,我帮我表妹把她写的童话小说生成有声书,她用免费版先试了几章,效果不错,现在准备升级付费版做完整版。

**客服语音**也能用,有些公司的自动客服电话声音太机械,客户听着就烦,用ElevenLabs生成的语音做IVR导航,客户可能会觉得“这家公司服务还挺贴心”。

甚至**游戏开发者**,给游戏角色配台词,不用找配音演员,用预设声音或者克隆特定声线,生成速度快,还能随时调整台词内容,方便得很。

ElevenLabs使用注意事项

用免费版的时候得记住,**生成的内容不能商用**,要是你用免费版生成的语音发在盈利的视频平台,或者拿去给公司做广告,可能会被ElevenLabs检测到,严重的话账号会被封。

**语音克隆别乱用别人的声音**,你只能克隆自己有权使用的声音,比如自己的声音,或者经过别人同意的声音,要是偷偷克隆明星、网红的声音去做内容,可能会涉及侵权,到时候吃官司就麻烦了。

**生成语音时尽量用短句**,虽然它支持长文本,但太长的句子容易出现语调不自然的情况,我试过输一段200字的长句子,生成的语音中间有点卡顿,后来拆成几个短句,效果就好多了。

**保存好自己的克隆声音**,克隆一次不容易,要是你换设备登录,记得在“我的声音”里把克隆好的声音设为“收藏”,不然不小心删了,又得重新上传录音克隆,费时费力。

ElevenLabs和同类工具区别

跟**Google Text-to-Speech**比,ElevenLabs胜在自然度,Google的语音虽然清晰,但听久了能感觉到“机器味”,尤其是长句子,停顿位置总有点怪,ElevenLabs的语音就像真人在即兴说话,停顿、重音都恰到好处,我做播客对比过,听众更喜欢ElevenLabs生成的版本。

ElevenLabs是AI语音生成工具,如何制作自然语音

和**Amazon Polly**比,情感调节更细腻,Amazon Polly的情感选项比较少,大概就“高兴”“中性”“悲伤”几种,ElevenLabs能调“情感强度”,从0到100,50%是中等开心,80%就是特别开心,细节拉满,我给故事配语音时,主角惊讶的语气,用ElevenLabs调80%强度,比Amazon Polly的“惊讶”模式更真实。

对比**百度AI语音**,多语言混合生成是优势,百度AI语音中文生成很强,但要是一段文字里有中文有英文,今天我们学英语单词‘happiness’”,生成的语音中英文切换会有点生硬,ElevenLabs能自动识别语言,切换时像双语使用者说话一样自然,我试过中英法三语混合,居然没翻车。

至于**国内的讯飞听见**,它更侧重语音转文字,语音生成只是附加功能,声音库没ElevenLabs丰富,预设声音才十几个,ElevenLabs光免费版就有30多种预设声音,付费版更多。

ElevenLabs制作自然语音教程

我来手把手教你怎么做自然语音,超简单,第一步,打开ElevenLabs官网,点右上角“Sign Up”注册账号,用邮箱注册就行,不用填太多信息,注册完登录,首页就能看到“Generate Voice”按钮,点进去。

第二步,选声音,页面左边有“Voice Library”,里面是预设声音,有男声、女声、儿童声,每个声音下面有示例,你点“Play”听听,选一个你喜欢的,我常用“Charlotte”的女声,温柔又清晰,要是你克隆过自己的声音,也能在“Your Voices”里选克隆声。

第三步,输入文本,中间的输入框里粘贴你要转语音的文字,别太长,一段控制在200字以内比较好,我输入“明天周末,我们计划去爬山,早上8点在小区门口集合,记得带水和零食”。

第四步,调参数,右边有“Settings”,可以调语速(Speed)、情感(Emotion)、语调(Intonation),语速默认100%,我一般设90%,听得更清楚;情感选“Happy”,强度拉到60%;语调保持默认。

第五步,生成语音,点“Generate”按钮,等3-5秒,下面就会出现播放条,点播放听听效果,要是觉得情感不够,返回调参数,再生成一次,我第一次生成时觉得“集合”两个字不够有力,把语调调到110%,再生成就好多了。

第六步,下载语音,满意后点播放条旁边的“Download”按钮,选MP3格式,就能保存到电脑或手机里了,我用这个方法做视频旁白,5分钟就能搞定一段,比自己录音快10倍。

常见问题解答

ElevenLabs免费版能用吗?

能用啊!免费版每月可以生成10分钟语音,普通听听或者做小作业够用了,就是不能商用,生成的语音后面会带个小水印,不过不影响自己听,要是你做的内容想发到B站、抖音这些平台赚钱,就得升级付费版,不然可能会被官方警告,我刚开始用的时候就是免费版,做了几个小红书视频旁白,效果还不错,后来不够用才升级的。

ElevenLabs能生成中文语音吗?

当然能!它支持中文生成,而且效果还挺好的,我试过用中文生成“床前明月光,疑是地上霜”,选了个叫“Xiaoyu”的女声,吐字清晰,语调还有点古诗的韵味,比我自己读得都有感觉,不过中文预设声音没英文多,免费版大概有5个左右,付费版会多一些,要是你想要更多中文声音,也可以自己克隆中文语音。

ElevenLabs语音能下载吗?

能下载!生成语音后,播放条旁边就有个下载按钮,点一下选MP3格式,就能保存到你手机或电脑里了,免费版下载的音频带水印,就是开头或结尾会有“Generated by ElevenLabs”的提示音,付费版下载的音频就没水印,干净得很,我每次生成完都会下载保存,万一后面想再用,不用重新生成,省时间。

ElevenLabs语音克隆要多久?

看你上传的录音时长,一般3-5分钟的录音,克隆要1-2小时,我上次上传了一段4分钟的自己说话录音,中午12点提交,下午2点就收到邮件说克隆完成了,要是录音质量不好,比如有杂音或者说话太快,可能会克隆失败,得重新录,建议找个安静的房间,用手机自带麦克风录,别对着麦克风太近,免得有呼吸杂音。

ElevenLabs和其他语音工具哪个好?

我觉得ElevenLabs在自然度上比其他工具好,比如Google Text-to-Speech生成的声音有点像新闻播报,太正式;Amazon Polly情感比较单一,开心就只有一种开心,ElevenLabs生成的声音像真人聊天,连说话时的小停顿、语气词都有,不过要是你只需要简单的语音提示,操作成功”,用Google那些免费工具就行,要是做内容创作,想让语音有感情,选ElevenLabs没错,我用过好几个,最后还是换回它了。

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~