基于Python与百度AI的语音合成技术应用及项目部署详解
[]
用户输入文字后,语音合成技术能把它转成非常流畅自然的语音输出,而且还能够支持对语速、音调以及音量进行设置,这种技术打破了传统文字式人机交互的方式,使得人机沟通变得更加自然 。
应用场景
在游戏场景里,把公告、还有任务或者派单所牵涉的信息,借助语音来进行播报,使得玩家在玩游戏之际,或者配送员在送货之时,同样能够接听新的任务。
文学小说类的软件呢,能够借助百度语音合成的技术哟,把文学小说的作品去进行高质量的朗读呀,朗读得流畅又清晰呢,还能解放大家的双眼呀,从而可以畅听整个世界哟。
项目架构
.7.2、.1.7、baidu-aip
案例
这里只展示部分代码,有兴趣的同学可以自行下载源码安装调试。
import os
import[id_20885443]
import codecs
from aip import AipSpeech
from django.[id_840966319]import render
from django.http import HttpResponse
'''
pip install --upgrade pip
pip install django
pip install baidu-aip
'''
def main(request):
return render(request, 'index.html')
def m_main(request):
return render(request, 'm_index.html')
def convert(request):
[id_236606600]= request.POST.get("message")
switch = request.POST.get("switch")
mp3 = du_say(message, switch)
return HttpResponse(mp3)
def du_say(message, switch):
write_txt(message)
app_id = '*****'
api_key = '*****'
[id_1553043412]= '*****'
client = AipSpeech(app_id, api_key, secret_key)
if switch == "true":
switch = 3
else:
switch = 4
result = client.synthesis(message, 'zh', 1, {
'vol': 5, 'per': switch,
})
t = time.time()
now_time = lambda: int(round(t * 1000))
path = os.getcwd() + os.path.sep + "static" + os.path.sep + "audio"+os.path.sep
audio = path+str(now_time())+'.mp3'
进行识别,若正确,返回语音二进制,若错误,返回dict,参照下面错误码 。
if not isinstance(result, dict):
with open(audio, 'wb') as f:
f.write(result)
return str(now_time())+'.mp3'
def write_txt(message):
t = time.time()
now_time = lambda: int(round(t * 1000))
path = os.getcwd() + os.path.sep + "static" + os.path.sep + "text"+os.path.sep
text = path+str(now_time())+'.txt'
with codecs.open(text, 'a', encoding='utf8')as f:
f.write(message)
本地部署
从码云拉取项目到本地:
https:这段内容并非是一个可改写的句子呀,它看起来像是一个代码仓库链接呢。请提供正确的句子以便我按照要求进行改写`。但基于这个链接形式。
配置百度语音API:
# 自行注册申请
https:我不太明确你对于所给内容具体的改写要求呀,你可以进一步明确一下改写方向,比如是要改写为描述性语句之类的🤔 仅从你提供的这个“//console.bce.
启动项目:

# 切换到项目根目录,执行
manage.py runserver
外网部署
这里以Linux为例,代理使用 。
安装
wget https:这是一个网址路径,它表示的是,在名为www.python.org的网站里,通过ftp协议访问时呈现出的特定位置,此位置指向python文件夹下的3.7.1版本,其中包含着Python - 3.
事先安装依赖,否则后期安装会报错:
yum -y install zlib*
yum -y install libffi-devel
下面开始正式安装:
# 解压
tar -xvf Python-3.7.1.tar.xz
# 切换大目录
cd Python-3.7.1
# 配置编译
./configure
# 编译安装
make && make install
安装
pip install Django
安装成功以后需要重新配置并编译安装 :
# 配置编译
./configure
# 编译安装
make && make install
安装服务器 uwsgi
pip3 install uwsgi
上传项目到服务器,并切换到 目录:
# 目录下新建文件夹
mkdir script

于下方增添 uwsgi.ini,此项目里已完成配置,自行去修改路径便可:
# uwsig使用配置文件启动
[uwsgi]
# 项目目录
chdir=/www/speech/
# 指定项目的application
module=speech.wsgi:application
# 指定sock的文件路径
socket=/www/speech/script/uwsgi.sock
# 进程个数
workers=5
pidfile=/www/speech/script/uwsgi.pid
# 指定IP端口
http=127.0.0.1:8001
# 指定静态文件
static-map=/static=/www/speech/static
# 启动uwsgi的用户名和用户组
uid=root
gid=root
# 启用主进程
master=true
在服务停止之际,会自动将unix Socket以及pid文件予以移除 。
vacuum=true
# 序列化接受的内容,如果可能的话
thunder-lock=true
# 启用线程
enable-threads=true
# 设置自中断时间
harakiri=30
# 设置缓冲
post-buffering=4096
# 设置日志目录
daemonize=/www/speech/script/uwsgi.log
然后使用以下命令启动:
uwsgi --ini uwsgi.ini
执行命令,查看是否启动成功:
[root@AY140216131049Z script]# ps -ef|grep uwsgi
root 3040 1 0 Nov21 ? 00:00:03 uwsgi --ini uwsgi.ini
root 3041 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 3042 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 3043 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 3044 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 3045 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 3046 3040 0 Nov21 ? 00:00:00 uwsgi --ini uwsgi.ini
root 6606 6580 0 18:13 pts/0 00:00:00 grep --color=auto uwsgi
重启:
uwsgi --reload uwsgi.pid
配置Nginx代理:
server {
listen 80;
server_name speech.52itstyle.vip;
charset utf-8;
location / {
include uwsgi_params; # 导入一个Nginx模块他是用来和uWSGI进行通讯的
uwsgi_connect_timeout 30; # 设置连接uWSGI超时时间
uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有动态请求就会直接丢给他
}
# 动静分离 Nginx 处理静态请求
location /static {
root /www/speech/;
}
}
如果启动HTTPS:
server {
listen 80;
listen 443 ssl;
server_name speech.52itstyle.vip;
#ssl on;
#证书路径
ssl_certificate /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.pem;
#私钥路径
ssl_certificate_key /usr/local/openresty/nginx/cert/1901523_speech.52itstyle.vip.key;
#缓存有效期
ssl_session_timeout 5m;
#可选的加密算法,顺序很重要,越靠前的优先级越高.
ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE:ECDH:AES:HIGH:!NULL:!aNULL:!MD5:!ADH:!RC4;
#安全链接可选的加密协议
ssl_protocols TLSv1 TLSv1.1 TLSv1.2;
ssl_prefer_server_ciphers on;
location / {
include uwsgi_params; # 导入一个Nginx模块他是用来和uWSGI进行通讯的
uwsgi_connect_timeout 30; # 设置连接uWSGI超时时间
uwsgi_pass unix:/www/speech/script/uwsgi.sock; # 指定uwsgi的sock文件所有动态请求就会直接丢给他
}
# 动静分离 Nginx 处理静态请求
location /static {
root /www/speech/;
}
}
项目源码
长按图片识别语音播报

欢迎 你 发表评论: