首页 每日新资讯 Fish Speech V1.2是AI语音合成工具,如何快速上手使用

Fish Speech V1.2是AI语音合成工具,如何快速上手使用

作者:每日新资讯
发布时间: 浏览量:1 0

Fish Speech V1.2信息介绍

Fish Speech V1.2是一款由国内团队开发的AI语音合成工具,主打分值化语音生成,简单说就是能把文字变成听起来像真人说话的音频,我第一次接触它是在朋友推荐下,当时正愁给短视频配旁白找不到合适的声音,试了之后发现它的合成效果比我想象中自然得多,V1.2版本是在之前版本基础上优化的,据说修复了部分音色卡顿问题,还新增了几种特色方言音色,比如四川话、广东话,这点对做地域类内容的人来说还挺实用,现在它支持Windows和Mac系统,手机端暂时只有网页版能用,不过网页版操作也挺流畅,不用下载安装就能直接用。

这款工具主打的是"轻量化+高还原",界面设计很简单,没有花里胡哨的功能,打开就是文本输入框和音色选择栏,像我这种对技术一窍不通的人也能很快找到在哪操作,它的核心技术是基于深度学习模型,据说训练时用了上万小时的真人语音数据,所以合成出来的声音不仅发音标准,连语气、停顿都和真人说话很像,有次我合成一段故事旁白,朋友听了还问我是不是请了专业配音员,把我乐坏了。

Fish Speech V1.2核心功能有哪些

多音色选择是Fish Speech V1.2的一大亮点,目前有20多种基础音色,涵盖了青年男女、中年大叔、萌系少女、沉稳老者等不同风格,甚至还有几种卡通角色音,魔法小精灵"和"机械战警",给儿童故事配音特别合适,我上次给侄女做睡前故事音频,选了"甜美女声"配主角,又用"憨厚男声"配熊爸爸,她听得津津有味,还让我多做几期。

Fish Speech V1.2是AI语音合成工具,如何快速上手使用

自定义参数调节也很实用,可以调整语速、语调、音量,甚至能设置"情感强度",比如想让声音听起来开心,就把情感强度拉到80%;想表现悲伤,就调到30%左右,我试过用"冷静男声"配新闻稿,把语速调到0.9倍,语调稍微压低,出来的效果真有那味儿了,同事还以为我从电视台拷的音频。

批量合成功能对经常需要处理大量文本的人来说简直是救星,我之前帮公司整理产品说明书,需要把50多页文字转成音频,用它的批量导入功能,把文本分段复制进去,选好音色和参数,点一下生成,半小时就搞定了,要是手动一段段弄,估计得搞一下午。

音频格式导出支持MP3、WAV、FLAC三种格式,能满足不同场景需求,发短视频用MP3就行,体积小;如果是做播客需要高清音质,就选FLAC格式,我一般导出MP3,方便直接上传到各个平台,省得再转换格式。

Fish Speech V1.2的产品定价

目前Fish Speech V1.2的官方定价还没明确公布,可能还在测试阶段,我去官网看了下,现在提供两种使用方式:一种是免费试用,每天能合成10分钟音频,音色只能用基础款,不能调节高级参数;另一种是申请内测资格,填写用途和需求后,官方会给一个月的高级版体验,所有音色和功能都能免费用。

听内部朋友说,正式上线后可能会分基础版和专业版,基础版大概每月29元,支持500分钟合成,包含10种常用音色;专业版每月99元,不限合成时长,所有音色和参数都能解锁,还能享受优先技术支持,不过这只是小道消息,具体价格还是得以官方公布为准,反正现在免费试用足够我平时做短视频配音用了,等正式定价出来再看看要不要升级。

这些场景用Fish Speech V1.2超合适

做短视频的博主肯定离不开它,我表妹是美食博主,每次拍做菜视频都要自己配音,有时候说错了还得重录,特别费时间,我推荐她用Fish Speech V1.2,把脚本写好直接生成音频,选"温柔女声"配教程,既清晰又省事儿,现在她更新视频的速度都快了不少。

老师和家长也能用它做有声教材,我邻居家孩子上小学,妈妈用它把语文课文转成音频,每天睡前放给孩子听,孩子现在背课文比以前快多了,还有培训机构的老师,用它合成英语听力材料,发音比自己读标准多了,学生们反馈说听得更清楚。

企业做产品介绍也很合适,我们公司上个月推新品,需要给宣传视频配旁白,找真人配音报价要800块,还得等好几天,我用Fish Speech V1.2选了"商务男声",调整了语速和情感,半小时就搞定了,领导听了说比之前找的配音还自然,直接省了一笔钱。

甚至连写小说的作者都能用它,我关注的一个网络作家,每周在粉丝群更新有声小说片段,以前都是自己录,嗓子经常哑,现在用它合成不同角色的声音,粉丝都说代入感更强了,粉丝群活跃度都提高了不少。

Fish Speech V1.2是AI语音合成工具,如何快速上手使用

Fish Speech V1.2使用注意事项

输入文本时要注意格式,最好一段不要超过300字,太长的话合成时可能会出现断句不自然的情况,我有次复制了一整篇文章进去,结果中间有几句卡顿了,后来分成几段合成,就顺畅多了。

选择音色要结合内容风格,比如配严肃的新闻稿,就别用"俏皮女声";给儿童故事配音,选"机械音"肯定不合适,我刚开始用的时候随便选音色,结果给产品介绍配了"萌系少女音",被领导笑了半天,后来学乖了,先想清楚内容风格再挑音色。

网络不好的时候别用网页版,容易合成失败,有次我在咖啡厅连公共Wi-Fi,合成到一半突然断网,前面的进度全没了,气得我差点把手机摔了,后来学聪明了,重要的合成尽量在网络稳定的地方用,或者先把文本存本地,免得白忙活。

导出音频后最好先试听一遍,有时候参数没调好,可能会出现音量忽大忽小的情况,我习惯导出后用耳机听一遍,发现问题就重新调整参数再生成,虽然麻烦点,但能保证最终效果。

和同类工具比Fish Speech V1.2有啥不一样

和ElevenLabs比,Fish Speech V1.2的中文合成更自然,ElevenLabs虽然是国外知名工具,但中文发音总有点"洋腔洋调",比如把"银行"读成"yin hang",我用它合成一段中文绕口令,结果磕磕绊绊的,换成Fish Speech V1.2,每个字都咬得很准,听着就像 native speaker 在说。

和阿里云语音合成比,它的操作更简单,阿里云的控制台功能太多,又是API接口又是参数配置,我这种非技术人员看着就头大,Fish Speech V1.2打开就是文本框和音色选择,点几下就能生成,对新手特别友好,我妈都能跟着教程学会用。

和百度AI语音比,它的音色更有特色,百度的音色虽然多,但大多比较"标准",缺乏个性,Fish Speech V1.2有几个独家音色,江湖侠女音",带着点沙哑和豪气,配武侠小说片段特别有感觉;还有"方言主播音",说四川话的时候自带儿化音,听着就亲切。

和腾讯云语音比,它的合成速度更快,同样一段5分钟的文本,腾讯云要等2分钟左右,Fish Speech V1.2基本1分钟内就能搞定,上次我急着交视频配音,用腾讯云等得快焦虑了,换了Fish Speech V1.2,眨眼功夫就好了,简直救了我的命。

Fish Speech V1.2快速上手使用教程

第一步,打开Fish Speech V1.2网页版,注册登录账号,用手机号注册就行,不用填复杂信息,注册后会送10分钟免费合成时长,新手够用了,我当时注册完就收到短信验证码,输进去直接登录,全程不到1分钟。

Fish Speech V1.2是AI语音合成工具,如何快速上手使用

第二步,在文本输入框里粘贴要合成的文字,可以直接打字,也能复制粘贴,支持TXT格式导入,我一般是把写好的脚本复制进去,注意别带特殊符号,不然可能会影响合成效果。

第三步,选择音色和调节参数,在页面左侧有音色列表,点一下就能试听,选好后在右侧调节语速(0.8-1.5倍)、语调(-5到+5)、情感强度(0-100),我配产品介绍时,选"商务男声",语速1.1倍,情感强度60%,出来的效果既专业又不生硬。

第四步,点击"生成音频"按钮,页面会显示合成进度,完成后会自动播放,这时候仔细听一遍,如果觉得哪里不合适,比如某个词发音不准,可以修改文本后重新生成,我上次合成时"尽管"被读成了"jǐn guǎn",改成"即使"后就正常了。

第五步,导出保存音频,合成满意后,点击"导出"按钮,选择MP3、WAV或FLAC格式,然后下载到本地,我一般存到桌面,方便直接拖进视频剪辑软件里用,整个流程下来,熟练的话3分钟就能搞定一段音频,比以前自己配音快多了。

常见问题解答

Fish Speech V1.2支持哪些语言啊?

目前主要支持中文,包括普通话和几种方言,像四川话、广东话、东北话都有,英语也能合成,但效果没有中文好,据说后面会更新更多语言,比如日语和韩语,我试过用它合成英语短句,发音还行,但长句子就有点卡顿,建议英语内容还是用专门的英语语音工具啦。

生成的音频能商用吗?会不会侵权啊?

免费试用生成的音频只能个人非商用,比如自己做短视频、给孩子讲故事啥的,如果要商用,得等正式版上线后买专业版授权,到时候会给商用版权证明,我问过客服,她说现在内测期间商用的话,最好先联系他们报备,免得后面有纠纷,保险起见还是等正式版吧。

需要啥配置的电脑才能用啊?我家电脑有点旧。

要求不高!网页版只要浏览器能正常上网就行,我家那台用了五年的笔记本都能流畅用,合成的时候也不卡,客户端的话,Windows系统要Win10及以上,Mac要macOS 10.15以上,内存4G就够了,一般电脑都能跑,要是你用的是很老的系统,可能得升级一下浏览器,比如Chrome 80以上版本就没问题。

有没有免费试用?能试用多久啊?

有的!注册就送每天10分钟免费合成时长,没有时间限制,只要每天不超过10分钟就行,我用了快一个月了,平时给短视频配个旁白完全够,如果不够用,可以申请内测资格,填个表说明用途,官方审核通过后会给一个月高级版免费体验,所有功能都能解锁,我正在申请呢,希望能通过!

合成速度快不快?等半天的话我可受不了。

挺快的!我试过合成5分钟的文本,大概40秒就好了,比我之前用的其他工具快多了,当然跟网络有关系,要是你家网特别慢,可能会慢一点,但一般情况下都很快,有次我着急交视频,合成3分钟音频只用了20秒,简直神速,再也不用等得抓耳挠腮了,这点我超满意!

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~