python腾讯语音合成实现过程解析


Posted in Python onAugust 01, 2019

一、腾讯语音合成介绍

腾讯云语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。 腾讯TTS技术可以应用到很多场景,比如,移动APP语音播报新闻;智能设备语音提醒;依靠网上现有节目或少量录音,快速合成明星语音,降低邀约成本;支持车载导航语音合成的个性化语音播报。(废话一大堆)。。。

二、腾讯语音合成python SDK文档

安装 Python SDK 前,先获取安全凭证。在第一次使用云 API 之前,用户首先需要在腾讯云控制台上申请安全凭证,安全凭证包括 SecretID 和 SecretKey, SecretID 是用于标识 API 调用者的身份,SecretKey 是用于加密签名字符串和服务器端验证签名字符串的密钥。SecretKey 必须严格保管,避免泄露。 

通过 pip 安装(推荐)

您可以通过 pip 安装方式将腾讯云 API Python SDK 安装到您的项目中,如果您的项目环境尚未安装 pip,请详细参见 pip官网 安装。

通过pip方式安装请在命令行中执行以下命令:

pip install tencentcloud-sdk-python

请注意,如果同时有 python2 和 python3 环境, python3 环境需要使用 pip3 命令安装。

三、腾讯语音合成

# !/usr/bin/env python 2 # -*- coding: utf-8 -*-
from base64 import b64decode
from uuid import uuid4
from tencentcloud.common import credential
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.aai.v20180522.models import TextToVoiceRequest
from tencentcloud.aai.v20180522.aai_client import AaiClient
try:
  # 实例化一个认证对象,入参需要传入腾讯云账户secretId,secretKey
  cred = credential.Credential("你的secretID", "你的secretKey")
  # 实例化要进行语音合成请求的client对象
  client = AaiClient(cred, 'ap-shanghai')
  # 实例化一个请求对象
  req = TextToVoiceRequest()
  # 请求对象属性封装
  req.Text = '先帝创业未半而中道崩殂' # type: str # 要合成语音的文本
  req.SessionId = uuid4() # type: int # 一次请求对应一个SessionId,会原样返回,建议传入类似于uuid的字符串防止重复
  req.ModelType = 1 # type: int # 模型类型,默认值为1
  req.Volume = 5.0 # type: float # 音量大小,范围:[0,10],分别对应10个等级的音量,默认为0
  req.Speed = 0.6 # type: float # 语速,范围:[-2,2],分别对应不同语速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默认为0
  req.ProjectId = 10086 # type: int # 项目id,用户自定义,默认为0
  req.VoiceType = 0 # type: int # 音色0:女声1,亲和风格(默认) 音色1:男声1,成熟风格 音色2:男声2,成熟风格
  req.PrimaryLanguage = 1 # type: int # 主语言类型1:中文,最大100个汉字(标点符号算一个汉字)语言类型2:英文,最大支持400个字母(标点符号算一个字母)
  req.SampleRate = 16000 # type: int # 音频采样率,16000:16k,8000:8k,默认16k
  # 通过client对象调用想要访问的接口,需要传入请求对象
  rep = client.TextToVoice(req)
  # rep为响应对象
  print(rep)
  """
    {
    "Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+////AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/////AAAAAAAA//8AAP///v/9//7//v///////v8AAP///////wAA/////wAA/////wAAAAAAAAAAAAAAAAAAAAAAAAAA",
    "RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a",
    "SessionId": "session-1234"
    }
    Audio对应的值为经过base64编码,
    RequestId为返回的唯一请求id,
    SessionId为发送请求时传入的id即uuid4()
  """
  # content为base64解码后的二进制流
  content = b64decode(rep.Audio)
  # I/O操作
  with open('voice.wav', 'wb') as f:
    f.write(content)
except TencentCloudSDKException as e:
  print(e)

四、腾讯语音合成使用后感受

首先,在代码层次上讲,官方压根没有合成示例文档啊(咆哮ing),全自己摸索的啊(咆哮ing),SDK都开发出来了,示例代码给一下能死啊(咆哮ing),怪不得没人用啊(咆哮ing)!

第二,还是在代码层次上讲,源码中TextToVoiceRequest()类,在__init__()方法中就不能直接封装属性啊(咆哮ing),有些没有自定制但都是默认的直接填上不就行了啊(咆哮ing),懒死你啊,非得一行一行自己加属性啊(咆哮ing),看到的同学务必要修改这个类的__init__()方法,要不然就像示例代码中那样麻烦。

第三,在合成效果上讲,声音难听爆了有木有,语音文件还得解码再I/O,吃饱了撑的了啊,还是那句话:怪不得没人用,百度语音合成效果比你强多了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3+PyQt5自定义视图详解
Apr 24 Python
Python线性拟合实现函数与用法示例
Dec 13 Python
python适合人工智能的理由和优势
Jun 28 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 Python
Django 拆分model和view的实现方法
Aug 16 Python
python对验证码降噪的实现示例代码
Nov 12 Python
Python如何计算语句执行时间
Nov 22 Python
python getopt模块使用实例解析
Dec 18 Python
python 给图像添加透明度(alpha通道)
Apr 09 Python
django admin 根据choice字段选择的不同来显示不同的页面方式
May 13 Python
Python+Opencv身份证号码区域提取及识别实现
Aug 25 Python
Numpy中np.random.rand()和np.random.randn() 用法和区别详解
Oct 23 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 #Python
Python生命游戏实现原理及过程解析(附源代码)
Aug 01 #Python
Python中list的交、并、差集获取方法示例
Aug 01 #Python
详解pandas使用drop_duplicates去除DataFrame重复项参数
Aug 01 #Python
Python使用Pandas对csv文件进行数据处理的方法
Aug 01 #Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
You might like
function.inc.php超越php
2006/12/09 PHP
destoon实现会员商铺中指定会员或会员组投放广告的方法
2014/08/21 PHP
PHP屏蔽过滤指定关键字的方法
2014/11/03 PHP
简单了解PHP编程中数组的指针的使用
2015/11/30 PHP
win10 apache配置虚拟主机后localhost无法使用的解决方法
2018/01/27 PHP
php微信公众号开发之答题连闯三关
2018/10/20 PHP
对象无length属性时IE6/IE7中无法将其转换成伪数组(ArrayLike)
2011/07/31 Javascript
jquery实现手风琴效果实例代码
2013/11/15 Javascript
控制input输入框中提示信息的显示和隐藏的方法
2014/02/12 Javascript
jquery清空表单数据示例分享
2014/02/13 Javascript
Jquery图片延迟加载插件jquery.lazyload.js的使用方法
2014/05/21 Javascript
jQuery基础知识点总结(DOM操作)
2016/06/01 Javascript
jQuery.uploadify文件上传组件实例讲解
2016/09/23 Javascript
Bootstrap源码解读模态弹出框(11)
2016/12/28 Javascript
Angular.Js中ng-include指令的使用与实现
2017/05/07 Javascript
js中let和var定义变量的区别
2018/02/08 Javascript
JavaScript中的"=、==、==="区别讲解
2019/01/22 Javascript
如何通过javaScript去除字符串两端的空白字符
2020/02/06 Javascript
如何利用 JS 脚本实现网页全自动秒杀抢购功能
2020/10/12 Javascript
python中引用与复制用法实例分析
2015/06/04 Python
Python操作MySQL模拟银行转账
2018/03/12 Python
Python使用matplotlib绘制余弦的散点图示例
2018/03/14 Python
python发送邮件脚本
2018/05/22 Python
python pyheatmap包绘制热力图
2018/11/09 Python
Python实现字符型图片验证码识别完整过程详解
2019/05/10 Python
Python3+selenium配置常见报错解决方案
2020/08/28 Python
纯CSS3实现3D旋转书本效果
2016/03/21 HTML / CSS
HTML5的Geolocation地理位置定位API使用教程
2016/05/12 HTML / CSS
联想新西兰官方网站:Lenovo New Zealand
2018/10/30 全球购物
美国在线鞋类零售商:LifeStride
2019/06/09 全球购物
2014年小学教师工作总结
2014/11/10 职场文书
幼师辞职信范文大全
2015/05/12 职场文书
幽默导游词开场白
2015/05/29 职场文书
网络研修随笔感言
2015/11/18 职场文书
Redis字典实现、Hash键冲突及渐进式rehash详解
2021/09/04 Redis
详解python的异常捕获
2022/03/03 Python