编程 Python

基于python实现百度语音识别和图灵对话

Posted in Python onNovember 02, 2020

图例如下

https://github.com/Dongvdong/python_Smartvoice

上电后，只要周围声音超过 2000，开始录音5S
录音上传百度识别，并返回结果文字输出
继续等待，周围声音是否超过2000，没有就等待。
点用电脑API语音交互

代码如下

# -*- coding: utf-8 -*-
# 树莓派
from pyaudio import PyAudio, paInt16
import numpy as np
from datetime import datetime
import wave
import time
import requests#导入requests库
import urllib, urllib.request, pycurl
import base64
import json
import os
import sys
from imp import reload
 
# 调用电脑API生成语音交互
import speech
import win32api
import os
import sys
import time
import win32con
 
 
reload(sys)
 
#sys.setdefaultencoding( "utf-8" )
#一些全局变量
save_count = 0
save_buffer = []
t = 0
sum = 0
time_flag = 0
flag_num = 0
filename = ''
duihua = '1'
def getHtml(url):
  html= requests.get(url)
  # html.encoding = 'utf-8'#防止中文乱码
  
  return html.text
def get_token():
  apiKey = "AxXDYEN27Ks9XHocsGmCEdPm"
  secretKey = "61cd52759f4d704d91c155a22ff7183d"
  auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey;
  res = requests.get(auth_url)
  #res.encoding = 'utf-8'#防止中文乱码
  #print (res.text)
  return json.loads(res.text)['access_token']
def dump_res(buf):#输出百度语音识别的结果
  global duihua
  #print ("字符串类型")
  #print (buf)
  a = eval(buf)
  #print (type(a))
  if a['err_msg']=='success.':
    #print (a['result'][0]）#终于搞定了，在这里可以输出，返回的语句
    duihua = a['result'][0]
    print ("我："+duihua)
def use_cloud(token):#进行合成
  fp = wave.open(filename, 'rb')
  nf = fp.getnframes()
  f_len = nf * 2
  audio_data = fp.readframes(nf)
  cuid = "9120612" #产品id
  srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token
  http_header = [
    'Content-Type: audio/pcm; rate=8000',
    'Content-Length: %d' % f_len
  ]
  c = pycurl.Curl()
  c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode
  #c.setopt(c.RETURNTRANSFER, 1)
  c.setopt(c.HTTPHEADER, http_header)  #must be list, not dict
  c.setopt(c.POST, 1)
  c.setopt(c.CONNECTTIMEOUT, 30)
  c.setopt(c.TIMEOUT, 30)
  c.setopt(c.WRITEFUNCTION, dump_res)
  c.setopt(c.POSTFIELDS, audio_data)
  c.setopt(c.POSTFIELDSIZE, f_len)
  c.perform() #pycurl.perform() has no return val
# 将data中的数据保存到名为filename的WAV文件中
def save_wave_file(filename, data):
  wf = wave.open(filename, 'wb')
  wf.setnchannels(1)
  wf.setsampwidth(2)
  wf.setframerate(SAMPLING_RATE)
  wf.writeframes(b"".join(data))
  wf.close()
NUM_SAMPLES = 2000    # pyAudio内部缓存的块的大小
SAMPLING_RATE = 8000  # 取样频率
LEVEL = 1500      # 声音保存的阈值
COUNT_NUM = 20     # NUM_SAMPLES个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音
SAVE_LENGTH = 8     # 声音记录的最小长度：SAVE_LENGTH * NUM_SAMPLES 个取样
exception_on_overflow=False
# 开启声音输入ｐｙａｕｄｉｏ对象
pa = PyAudio()
stream = pa.open(format=paInt16, channels=1, rate=SAMPLING_RATE, input=True,
        frames_per_buffer=NUM_SAMPLES)
token = get_token()#获取ｔｏｋｅｎ
key = '35ff2856b55e4a7f9eeb86e3437e23fe'
api = 'http://www.tuling123.com/openapi/api?key=' + key + '&info='
while(True):
  # 读入NUM_SAMPLES个取样
  string_audio_data = stream.read(NUM_SAMPLES,False);
  # 将读入的数据转换为数组
  audio_data = np.fromstring(string_audio_data, dtype=np.short)
  # 计算大于LEVEL的取样的个数
  large_sample_count = np.sum( audio_data > LEVEL )
  temp = np.max(audio_data)
  if temp > 2000 and t == 0:
    t = 1#开启录音
    print ("---------主人我在听你说！（5S）----------")
    begin = time.time()
    # print (temp)
  if t:
    #print (np.max(audio_data))
    if np.max(audio_data)<1000:
      sum += 1
      # print (sum)
    end = time.time()
    if end-begin>5:
      time_flag = 1
      # print ("五秒到了，准备结束")
    # 如果个数大于COUNT_NUM，则至少保存SAVE_LENGTH个块
    if large_sample_count > COUNT_NUM:
      save_count = SAVE_LENGTH
    else:
      save_count -= 1
    if save_count < 0:
      save_count = 0
    if save_count > 0:
      # 将要保存的数据存放到save_buffer中
      save_buffer.append(string_audio_data )
    else:
      # 将save_buffer中的数据写入WAV文件，WAV文件的文件名是保存的时刻
      #if time_flag:
      if len(save_buffer) > 0 or time_flag:
        #filename = datetime.now().strftime("%Y-%m-%d_%H_%M_%S") + ".wav"#原本是用时间做名字
        filename = str(flag_num)+".wav"
        flag_num += 1
        save_wave_file(filename, save_buffer)
        save_buffer = []
        t = 0
        sum =0
        time_flag = 0
       # print (filename, "保存成功正在进行语音识别")
        use_cloud(token)
       #  print (duihua)
        info = duihua
        duihua = ""
        
        request = api + str(info)
        response = getHtml(request)
       # print ( "-----1-----")
        dic_json = json.loads(response)
       
        a = dic_json['text']
       
        unicodestring = a
        # 将Unicode转化为普通Python字符串："encode"
        utf8string = unicodestring.encode("utf-8")
       
        print ("科塔娜："+str(a))
         
        # 电脑说话
        speech.say(str(a))
         
        url = "http://tsn.baidu.com/text2audio?tex="+dic_json['text']+"&lan=zh&per=0&pit=1&spd=7&cuid=7519663&ctp=1&tok=25.41bf315625c68b3e947c49b90788532d.315360000.1798261651.282335-9120612"
        os.system('mpg123 "%s"'%(url))

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

基于python实现百度语音识别和图灵对话

- Author -

小蜗牛叽咕往前

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

零基础写python爬虫之抓取百度贴吧代码分享

Nov 06 Python

python通过函数属性实现全局变量的方法

May 16 Python

详解K-means算法在Python中的实现

Dec 05 Python

python读文件保存到字典,修改字典并写入新文件的实例

Apr 23 Python

Python实现按当前日期（年、月、日）创建多级目录的方法

Apr 26 Python

python 将json数据提取转化为txt的方法

Oct 26 Python

浅谈python的深浅拷贝以及fromkeys的用法

Mar 08 Python

对Django 中request.get和request.post的区别详解

Aug 12 Python

python中class的定义及使用教程

Sep 18 Python

使用Fabric自动化部署Django项目的实现

Sep 27 Python

python实现打砖块游戏

Feb 25 Python

Keras:Unet网络实现多类语义分割方式

Jun 11 Python

用python进行视频剪辑

Nov 02 #Python

如何通过python实现IOU计算代码实例

Nov 02 #Python

Opencv常见图像格式Data Type及代码实例

Nov 02 #Python

Jupyter安装链接aconda实现过程图解

Nov 02 #Python

详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程

Nov 02 #Python

python定时截屏实现

Nov 02 #Python

PyQT5速成教程之Qt Designer介绍与入门

Nov 02 #Python

You might like

ecshop 订单确认中显示省市地址信息的方法

2010/03/15 PHP

thinkPHP实现将excel导入到数据库中的方法

2016/04/22 PHP

PHP设计模式之原型模式定义与用法详解

2018/04/03 PHP

javascript document.referrer 用法

2009/04/30 Javascript

JS判断数组中是否有重复值得三种实用方法

2013/08/16 Javascript

Jquery 实现表格颜色交替变化鼠标移过颜色变化实例

2013/08/28 Javascript

js动态添加事件并可传参数示例代码

2013/10/21 Javascript

javascript获取浏览器类型和版本的方法(js获取浏览器版本)

2014/03/13 Javascript

JavaScript数据类型检测代码分享

2015/01/26 Javascript

JS实现自定义简单网页软键盘效果代码

2015/11/05 Javascript

浅谈Javascript中的12种DOM节点类型

2016/08/19 Javascript

JS实现touch 点击滑动轮播实例代码

2017/01/19 Javascript

移动端网页开发调试神器Eruda的介绍与使用技巧

2017/10/30 Javascript

Node.JS循环删除非空文件夹及子目录下的所有文件

2018/03/12 Javascript

在layui tab控件中载入外部html页面的方法

2019/09/04 Javascript

JS如何实现网站中PC端和手机端自动识别并跳转对应的代码

2020/01/08 Javascript

JS内置对象和Math对象知识点详解

2020/04/03 Javascript

vue中watch的用法汇总

2020/12/28 Vue.js

重命名批处理python脚本

2013/04/05 Python

Python实现在matplotlib中两个坐标轴之间画一条直线光标的方法

2015/05/20 Python

Python实现图片转字符画的示例

2017/08/22 Python

Python数据结构与算法之图的广度优先与深度优先搜索算法示例

2017/12/14 Python

利用python将xml文件解析成html文件的实现方法

2017/12/22 Python

Python针对给定字符串求解所有子序列是否为回文序列的方法

2018/04/21 Python

解决Python 爬虫URL中存在中文或特殊符号无法请求的问题

2018/05/11 Python

python判断列表的连续数字范围并分块的方法

2018/11/16 Python

浅析Windows 嵌入python解释器的过程

2019/07/26 Python

Python定时任务随机时间执行的实现方法

2019/08/14 Python

python pyqtgraph 保存图片到本地的实例

2020/03/14 Python

Pyinstaller打包Scrapy项目的实现步骤

2020/09/22 Python

CSS3中:nth-child和:nth-of-type的区别深入理解

2014/03/10 HTML / CSS

金蝶的一道SQL笔试题

2012/12/18 面试题

房地产项目合作意向书

2015/05/08 职场文书

2015年统计员个人工作总结

2015/07/23 职场文书

Python制作一个随机抽奖小工具的实现

2021/07/07 Python

Python使用mitmproxy工具监控手机下载手机小视频

2022/04/18 Python