python调用百度语音REST API


Posted in Python onAugust 30, 2018

本文实例为大家分享了python调用百度语音REST API的具体代码,供大家参考,具体内容如下

(百度的rest接口的部分网址发生了一定的变化,相关代码已更新)

百度通过 REST API 的方式给开发者提供一个通用的 HTTP 接口,基于该接口,开发者可以轻松的获得语音合成与语音识别能力。SDK中只提供了PHP、C和JAVA的相关样例,使用python也可以灵活的对端口进行调用,本文描述了简单使用Python调用百度语音识别服务 REST API 的简单样例。

1、语音识别与语音合成的调用

注册开发者帐号和创建应用的过程就不再赘述,百度的REST API在调用过程基本分为三步:

  • 获取token
  • 向Rest接口提交数据
  • 处理返回数据

具体代码如下所示:

#!/usr/bin/python3

import urllib.request
import urllib
import json
import base64
class BaiduRest:
  def __init__(self, cu_id, api_key, api_secert):
    # token认证的url
    self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
    # 语音合成的resturl
    self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
    # 语音识别的resturl
    self.upvoice_url = 'http://vop.baidu.com/server_api'

    self.cu_id = cu_id
    self.getToken(api_key, api_secert)
    return

  def getToken(self, api_key, api_secert):
    # 1.获取token
    token_url = self.token_url % (api_key,api_secert)

    r_str = urllib.request.urlopen(token_url).read()
    token_data = json.loads(r_str)
    self.token_str = token_data['access_token']
    pass

  def getVoice(self, text, filename):
    # 2. 向Rest接口提交数据
    get_url = self.getvoice_url % (urllib.parse.quote(text), self.cu_id, self.token_str)

    voice_data = urllib.request.urlopen(get_url).read()
    # 3.处理返回数据
    voice_fp = open(filename,'wb+')
    voice_fp.write(voice_data)
    voice_fp.close()
    pass

  def getText(self, filename):
    # 2. 向Rest接口提交数据
    data = {}
    # 语音的一些参数
    data['format'] = 'wav'
    data['rate'] = 8000
    data['channel'] = 1
    data['cuid'] = self.cu_id
    data['token'] = self.token_str
    wav_fp = open(filename,'rb')
    voice_data = wav_fp.read()
    data['len'] = len(voice_data)
    data['speech'] = base64.b64encode(voice_data).decode('utf-8')
    post_data = json.dumps(data)
    r_data = urllib.request.urlopen(self.upvoice_url,data=bytes(post_data,encoding="utf-8")).read()
    # 3.处理返回数据
    return json.loads(r_data)['result']

if __name__ == "__main__":
  # 我的api_key,供大家测试用,在实际工程中请换成自己申请的应用的key和secert
  api_key = "SrhYKqzl3SE1URnAEuZ0FKdT" 
  api_secert = "hGqeCkaMPb0ELMqtRGc2VjWdmjo7T89d"
  # 初始化
  bdr = BaiduRest("test_python", api_key, api_secert)
  # 将字符串语音合成并保存为out.mp3
  bdr.getVoice("你好北京邮电大学!", "out.mp3")
  # 识别test.wav语音内容并显示
  print(bdr.getText("out.wav"))

2、调用pyaudio使用麦克风录制声音

python中的pyaudio库可以直接通过麦克风录制声音,可使用pip进行安装。我们可以通过调用该库,获取到wav测试语音。
具体代码如下所示:

#!/usr/bin/python3
# -*- coding: utf-8 -*-

from pyaudio import PyAudio, paInt16 
import numpy as np 
from datetime import datetime 
import wave

class recoder:
  NUM_SAMPLES = 2000   #pyaudio内置缓冲大小
  SAMPLING_RATE = 8000  #取样频率
  LEVEL = 500     #声音保存的阈值
  COUNT_NUM = 20   #NUM_SAMPLES个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音
  SAVE_LENGTH = 8     #声音记录的最小长度:SAVE_LENGTH * NUM_SAMPLES 个取样
  TIME_COUNT = 60   #录音时间,单位s

  Voice_String = []

  def savewav(self,filename):
    wf = wave.open(filename, 'wb') 
    wf.setnchannels(1) 
    wf.setsampwidth(2) 
    wf.setframerate(self.SAMPLING_RATE) 
    wf.writeframes(np.array(self.Voice_String).tostring()) 
    # wf.writeframes(self.Voice_String.decode())
    wf.close() 

  def recoder(self):
    pa = PyAudio() 
    stream = pa.open(format=paInt16, channels=1, rate=self.SAMPLING_RATE, input=True, 
      frames_per_buffer=self.NUM_SAMPLES) 
    save_count = 0 
    save_buffer = [] 
    time_count = self.TIME_COUNT

    while True:
      time_count -= 1
      # print time_count
      # 读入NUM_SAMPLES个取样
      string_audio_data = stream.read(self.NUM_SAMPLES) 
      # 将读入的数据转换为数组
      audio_data = np.fromstring(string_audio_data, dtype=np.short)
      # 计算大于LEVEL的取样的个数
      large_sample_count = np.sum( audio_data > self.LEVEL )
      print(np.max(audio_data))
      # 如果个数大于COUNT_NUM,则至少保存SAVE_LENGTH个块
      if large_sample_count > self.COUNT_NUM:
        save_count = self.SAVE_LENGTH 
      else: 
        save_count -= 1

      if save_count < 0:
        save_count = 0 

      if save_count > 0 : 
      # 将要保存的数据存放到save_buffer中
        #print save_count > 0 and time_count >0
        save_buffer.append( string_audio_data ) 
      else: 
      #print save_buffer
      # 将save_buffer中的数据写入WAV文件,WAV文件的文件名是保存的时刻
        #print "debug"
        if len(save_buffer) > 0 : 
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
      if time_count==0: 
        if len(save_buffer)>0:
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
        else:
          return False

if __name__ == "__main__":
  r = recoder()
  r.recoder()
  r.savewav("test.wav")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中用函数作为返回值和实现闭包的教程
Apr 27 Python
详解Python中映射类型的内建函数和工厂函数
Aug 19 Python
Python缩进和冒号详解
Jun 01 Python
Python实现基本线性数据结构
Aug 22 Python
Django URL传递参数的方法总结
Aug 28 Python
Python 如何访问外围作用域中的变量
Sep 11 Python
详解Python中的相对导入和绝对导入
Jan 06 Python
pandas每次多Sheet写入文件的方法
Dec 10 Python
利用arcgis的python读取要素的X,Y方法
Dec 22 Python
在keras中对单一输入图像进行预测并返回预测结果操作
Jul 09 Python
Django实现文章详情页面跳转代码实例
Sep 16 Python
Python Spyder 调出缩进对齐线的操作
Feb 26 Python
python调用百度语音识别api
Aug 30 #Python
python实现ID3决策树算法
Aug 29 #Python
python实现C4.5决策树算法
Aug 29 #Python
python机器学习之KNN分类算法
Aug 29 #Python
深入理解python中sort()与sorted()的区别
Aug 29 #Python
Python实现拷贝/删除文件夹的方法详解
Aug 29 #Python
Python读写zip压缩文件的方法
Aug 29 #Python
You might like
用PHP连接Oracle数据库
2006/10/09 PHP
[原创]站长必须要知道的javascript广告代码
2007/05/30 Javascript
添加JavaScript重载函数的辅助方法2
2010/07/04 Javascript
Java 正则表达式学习总结和一些小例子
2012/09/13 Javascript
JavaScript File API文件上传预览
2016/02/02 Javascript
最全面的JS倒计时代码
2016/09/17 Javascript
vue.js的安装方法
2017/05/12 Javascript
iscroll实现下拉刷新功能
2017/07/18 Javascript
浅谈Vue-cli 命令行工具分析
2017/11/22 Javascript
vue组件开发之用户无限添加自定义填写表单的方法
2018/08/28 Javascript
vue 中滚动条始终定位在底部的方法
2018/09/03 Javascript
nodejs中函数的调用实例详解
2018/10/31 NodeJs
详解基于iview-ui的导航栏路径(面包屑)配置
2019/02/22 Javascript
javascript实现导航栏分页效果
2019/06/27 Javascript
Vue CLI项目 axios模块前后端交互的使用(类似ajax提交)
2019/09/01 Javascript
微信头像地址失效踩坑记附带解决方案
2019/09/23 Javascript
vue大型项目之分模块运行/打包的实现
2020/09/21 Javascript
[04:28]DOTA2亚洲邀请赛小组赛第五日 TOP10精彩集锦
2015/02/03 DOTA
Python中input与raw_input 之间的比较
2017/08/20 Python
Python实现简单的HttpServer服务器示例
2017/09/25 Python
python开发游戏的前期准备
2019/05/05 Python
Django框架自定义session处理操作示例
2019/05/27 Python
Python requests获取网页常用方法解析
2020/02/20 Python
Pycharm2020.1安装中文语言插件的详细教程(不需要汉化)
2020/08/07 Python
python 实现全球IP归属地查询工具
2020/12/18 Python
python画图时设置分辨率和画布大小的实现(plt.figure())
2021/01/08 Python
HTML5中的nav标签学习笔记
2016/06/24 HTML / CSS
英国女装网上商店:I Saw It First
2018/10/18 全球购物
联想新西兰官方网站:Lenovo New Zealand
2018/10/30 全球购物
给朋友的道歉信
2014/01/09 职场文书
公司门卫管理制度
2014/02/01 职场文书
模特大赛策划方案
2014/05/28 职场文书
写景作文评语集锦
2014/12/25 职场文书
2015年学校心理健康教育工作总结
2015/05/11 职场文书
七年级之家长会发言稿范文
2019/09/04 职场文书
vue 自定义组件添加原生事件
2022/04/21 Vue.js