编程 Python

python调用百度语音REST API

Posted in Python onAugust 30, 2018

本文实例为大家分享了python调用百度语音REST API的具体代码，供大家参考，具体内容如下

（百度的rest接口的部分网址发生了一定的变化，相关代码已更新）

百度通过 REST API 的方式给开发者提供一个通用的 HTTP 接口，基于该接口，开发者可以轻松的获得语音合成与语音识别能力。SDK中只提供了PHP、C和JAVA的相关样例，使用python也可以灵活的对端口进行调用，本文描述了简单使用Python调用百度语音识别服务 REST API 的简单样例。

1、语音识别与语音合成的调用

注册开发者帐号和创建应用的过程就不再赘述，百度的REST API在调用过程基本分为三步：

获取token
向Rest接口提交数据
处理返回数据

具体代码如下所示：

#!/usr/bin/python3

import urllib.request
import urllib
import json
import base64
class BaiduRest:
  def __init__(self, cu_id, api_key, api_secert):
    # token认证的url
    self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
    # 语音合成的resturl
    self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
    # 语音识别的resturl
    self.upvoice_url = 'http://vop.baidu.com/server_api'

    self.cu_id = cu_id
    self.getToken(api_key, api_secert)
    return

  def getToken(self, api_key, api_secert):
    # 1.获取token
    token_url = self.token_url % (api_key,api_secert)

    r_str = urllib.request.urlopen(token_url).read()
    token_data = json.loads(r_str)
    self.token_str = token_data['access_token']
    pass

  def getVoice(self, text, filename):
    # 2. 向Rest接口提交数据
    get_url = self.getvoice_url % (urllib.parse.quote(text), self.cu_id, self.token_str)

    voice_data = urllib.request.urlopen(get_url).read()
    # 3.处理返回数据
    voice_fp = open(filename,'wb+')
    voice_fp.write(voice_data)
    voice_fp.close()
    pass

  def getText(self, filename):
    # 2. 向Rest接口提交数据
    data = {}
    # 语音的一些参数
    data['format'] = 'wav'
    data['rate'] = 8000
    data['channel'] = 1
    data['cuid'] = self.cu_id
    data['token'] = self.token_str
    wav_fp = open(filename,'rb')
    voice_data = wav_fp.read()
    data['len'] = len(voice_data)
    data['speech'] = base64.b64encode(voice_data).decode('utf-8')
    post_data = json.dumps(data)
    r_data = urllib.request.urlopen(self.upvoice_url,data=bytes(post_data,encoding="utf-8")).read()
    # 3.处理返回数据
    return json.loads(r_data)['result']

if __name__ == "__main__":
  # 我的api_key,供大家测试用，在实际工程中请换成自己申请的应用的key和secert
  api_key = "SrhYKqzl3SE1URnAEuZ0FKdT" 
  api_secert = "hGqeCkaMPb0ELMqtRGc2VjWdmjo7T89d"
  # 初始化
  bdr = BaiduRest("test_python", api_key, api_secert)
  # 将字符串语音合成并保存为out.mp3
  bdr.getVoice("你好北京邮电大学!", "out.mp3")
  # 识别test.wav语音内容并显示
  print(bdr.getText("out.wav"))

2、调用pyaudio使用麦克风录制声音

python中的pyaudio库可以直接通过麦克风录制声音，可使用pip进行安装。我们可以通过调用该库，获取到wav测试语音。
具体代码如下所示：

#!/usr/bin/python3
# -*- coding: utf-8 -*-

from pyaudio import PyAudio, paInt16 
import numpy as np 
from datetime import datetime 
import wave

class recoder:
  NUM_SAMPLES = 2000   #pyaudio内置缓冲大小
  SAMPLING_RATE = 8000  #取样频率
  LEVEL = 500     #声音保存的阈值
  COUNT_NUM = 20   #NUM_SAMPLES个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音
  SAVE_LENGTH = 8     #声音记录的最小长度：SAVE_LENGTH * NUM_SAMPLES 个取样
  TIME_COUNT = 60   #录音时间，单位s

  Voice_String = []

  def savewav(self,filename):
    wf = wave.open(filename, 'wb') 
    wf.setnchannels(1) 
    wf.setsampwidth(2) 
    wf.setframerate(self.SAMPLING_RATE) 
    wf.writeframes(np.array(self.Voice_String).tostring()) 
    # wf.writeframes(self.Voice_String.decode())
    wf.close() 

  def recoder(self):
    pa = PyAudio() 
    stream = pa.open(format=paInt16, channels=1, rate=self.SAMPLING_RATE, input=True, 
      frames_per_buffer=self.NUM_SAMPLES) 
    save_count = 0 
    save_buffer = [] 
    time_count = self.TIME_COUNT

    while True:
      time_count -= 1
      # print time_count
      # 读入NUM_SAMPLES个取样
      string_audio_data = stream.read(self.NUM_SAMPLES) 
      # 将读入的数据转换为数组
      audio_data = np.fromstring(string_audio_data, dtype=np.short)
      # 计算大于LEVEL的取样的个数
      large_sample_count = np.sum( audio_data > self.LEVEL )
      print(np.max(audio_data))
      # 如果个数大于COUNT_NUM，则至少保存SAVE_LENGTH个块
      if large_sample_count > self.COUNT_NUM:
        save_count = self.SAVE_LENGTH 
      else: 
        save_count -= 1

      if save_count < 0:
        save_count = 0 

      if save_count > 0 : 
      # 将要保存的数据存放到save_buffer中
        #print save_count > 0 and time_count >0
        save_buffer.append( string_audio_data ) 
      else: 
      #print save_buffer
      # 将save_buffer中的数据写入WAV文件，WAV文件的文件名是保存的时刻
        #print "debug"
        if len(save_buffer) > 0 : 
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
      if time_count==0: 
        if len(save_buffer)>0:
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
        else:
          return False

if __name__ == "__main__":
  r = recoder()
  r.recoder()
  r.savewav("test.wav")

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python调用百度语音REST API

- Author -

狼血wolfblood

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

使用SAE部署Python运行环境的教程

May 05 Python

python模块之sys模块和序列化模块(实例讲解)

Sep 13 Python

Python爬虫框架Scrapy常用命令总结

Jul 26 Python

Django REST framework视图的用法

Jan 16 Python

Django使用redis缓存服务器的实现代码示例

Apr 28 Python

python实现日志按天分割

Jul 22 Python

Python使用type关键字创建类步骤详解

Jul 23 Python

Python编程快速上手——Excel表格创建乘法表案例分析

Feb 28 Python

自定义Django Form中choicefield下拉菜单选取数据库内容实例

Mar 13 Python

python的pip有什么用

Jun 17 Python

Python pip install之SSL异常处理操作

Sep 03 Python

python游戏开发Pygame框架

Apr 22 Python

python调用百度语音识别api

Aug 30 #Python

python实现ID3决策树算法

Aug 29 #Python

python实现C4.5决策树算法

Aug 29 #Python

python机器学习之KNN分类算法

Aug 29 #Python

深入理解python中sort()与sorted()的区别

Aug 29 #Python

Python实现拷贝/删除文件夹的方法详解

Aug 29 #Python

Python读写zip压缩文件的方法

Aug 29 #Python

You might like

ThinkPHP实现事务回滚示例代码

2014/06/23 PHP

php短网址和数字之间相互转换的方法

2015/03/13 PHP

深入理解PHP中的Streams工具

2015/07/03 PHP

php中文字符串截取多种方法汇总

2016/10/06 PHP

ZendFramework2连接数据库操作实例

2017/04/18 PHP

php利用ZipArchive类操作文件的实例

2020/01/21 PHP

ext checkboxgroup 回填数据解决

2009/08/21 Javascript

js压缩工具 yuicompressor 使用教程

2010/03/31 Javascript

制作高质量的JQuery Plugin 插件的方法

2010/04/20 Javascript

让jQuery Mobile不显示讨厌loading界面的方法

2014/02/19 Javascript

js简单的点击返回顶部效果实现方法

2015/04/10 Javascript

js实现Select头像选择实时预览代码

2015/08/17 Javascript

基于jQuery实现Tabs选项卡自定义插件

2016/11/21 Javascript

JS基于面向对象实现的拖拽功能示例

2016/12/20 Javascript

node.js发送邮件email的方法详解

2017/01/06 Javascript

原生js实现打字动画游戏

2017/02/04 Javascript

使用Bootstrap + Vue.js实现表格的动态展示、新增和删除功能

2017/11/27 Javascript

基于javascript 显式转换与隐式转换(详解)

2017/12/15 Javascript

vue 解决form表单提交但不跳转页面的问题

2019/10/30 Javascript

nuxt 服务器渲染动态设置 title和seo关键字的操作

2020/11/05 Javascript

python3使用tkinter实现ui界面简单实例

2014/01/10 Python

python中安装Scrapy模块依赖包汇总

2017/07/02 Python

Python机器学习logistic回归代码解析

2018/01/17 Python

python3调用百度翻译API实现实时翻译

2018/08/16 Python

Python 处理图片像素点的实例

2019/01/08 Python

使用python的turtle绘画滑稽脸实例

2019/11/21 Python

Python解释器以及PyCharm的安装教程图文详解

2020/02/26 Python

CSS3 分类菜单效果

2019/05/27 HTML / CSS

HTML5 语音搜索只需一句代码

2013/01/03 HTML / CSS

ALDO英国官网：加拿大女鞋品牌

2018/02/19 全球购物

德国高品质男装及配饰商城：Cultizm（Raw Denim原色牛仔裤）

2018/04/16 全球购物

DJI大疆德国官方商城：大疆无人机

2018/09/01 全球购物

公务员职务工作的自我评价

2013/11/01 职场文书

社区重阳节活动总结

2015/03/24 职场文书

师德师风培训感言

2015/08/03 职场文书

MySQL数据库查询进阶之多表查询详解

2022/04/08 MySQL