编程 Python

python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题

Posted in Python onJanuary 17, 2018

最近的答题赢钱很火爆，我也参与了几次，有些题目确实很难答，但是10秒钟的时间根本不够百度的，所以写了个辅助挂，这样可以出现题目时自动百度，这个时间也就花掉2秒钟，剩下的7、8秒钟可以进行分析和作答，提升了赢钱概率。

源码可以见我的github：点击链接

原理分析下：使用adb命令，抓取手机视频播放的界面，然后通过python的截取和ocr，获得到题目和答案, 然后百度得到结果。这个环境怎么搭建，有需要的童鞋可以联系我，因为使用本地的ocr所以解析不花钱，也没有使用的限制。

github上的代码中

ocr_bw.py，这个是自动根据题目去百度，然后打开浏览器，展示检索结果

# -*- coding: utf-8 -*-

import pytesseract
import time
import webbrowser
import subprocess
from PIL import Image



def main():
 """
 主函数
 """
 op = yes_or_no('请确保手机打开了 ADB 并连接了电脑，'
     '然后打开西瓜视频后再用本程序，确定开始？')
 if not op:
  print('bye')
  return
 #核心递归
 ocr_subject_parent()

 # for root, sub_dirs, files in os.walk('E:/临时接收的文件/知乎答题/百万/'):
 #  for file in files:
 #   print('发现图片:' + file)
 #   img = Image.open('E:/临时接收的文件/知乎答题/百万/'+file)
 #   ocr_subject(img)


def yes_or_no(prompt, true_value='y', false_value='n', default=True):
 """
 检查是否已经为启动程序做好了准备
 """
 default_value = true_value if default else false_value
 prompt = '{} {}/{} [{}]: '.format(prompt, true_value,
          false_value, default_value)
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  elif i == false_value:
   return False
  prompt = 'Please input {} or {}: '.format(true_value, false_value)
  i = input(prompt)


def screenImg(true_value='', default=True):
 prompt = '当出现题目时，请按下回车进行识别 '
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  else:
   return False
  i = input(prompt)


def ocr_subject(p):
 # 截取 距离上530开始 940结束
 # 截取 距离上260 570结束
 p = cut_img(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 subject = pytesseract.image_to_string(p, lang='chi_sim')
 subject = "".join(subject.split())
 subject = subject.split('.')[1]
 print(subject)
 openPage(subject)
 ocr_subject_parent()


def ocr_subject_parent():
 result = screenImg()
 if result:
  start = time.time()
  # screenshot.check_screenshot()
  process = subprocess.Popen(
   'adb shell screencap -p',
   shell=True, stdout=subprocess.PIPE)
  binary_screenshot = process.stdout.read()
  binary_screenshot = binary_screenshot.replace(b'\r\n', b'\n')
  f = open('autojump.png', 'wb')
  f.write(binary_screenshot)
  f.close()
  # screenshot.pull_screenshot()
  img = Image.open('autojump.png')
  print("耗时:" + str(time.time() - start))
  ocr_subject(img)


def openPage(subject):
 url = 'https://www.baidu.com/s?wd={}'.format(
  subject)
 webbrowser.open(url)
 webbrowser.get()



def cut_img(img):
 region = img.crop((70, 260, 1025, 570))
 #region.save("temp/cut_first.png")
 return region


if __name__ == '__main__':
 main()

ocr_bw2.py,这个是根据题目+答案，去百度检索，通过爬虫抓取百度的收录数，然后在控制台打印结果

__author__ = 'zjy'
# -*- coding:utf-8 -*-

import pytesseract
import time
import webbrowser
import subprocess
from PIL import Image
import urllib
import urllib.request
import threading
from urllib.parse import quote


def main():
 """
 主函数
 """
 op = yes_or_no('请确保手机打开了 ADB 并连接了电脑，'
     '然后打开西瓜视频后再用本程序，确定开始？')
 if not op:
  print('bye')
  return
 # 核心递归
 ocr_subject_parent()

 # for root, sub_dirs, files in os.walk('E:/临时接收的文件/知乎答题/百万/'):
 #  for file in files:
 #   print('发现图片:' + file)
 #   img = Image.open('E:/临时接收的文件/知乎答题/百万/'+file)
 #   ocr_subject(img)


def yes_or_no(prompt, true_value='y', false_value='n', default=True):
 """
 检查是否已经为启动程序做好了准备
 """
 default_value = true_value if default else false_value
 prompt = '{} {}/{} [{}]: '.format(prompt, true_value,
          false_value, default_value)
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  elif i == false_value:
   return False
  prompt = 'Please input {} or {}: '.format(true_value, false_value)
  i = input(prompt)


def screenImg(true_value='', default=True):
 prompt = '当出现题目时，请按下回车进行识别 \n'
 i = input(prompt)
 if not i:
  return default
 while True:
  if i == true_value:
   return True
  else:
   return False
  i = input(prompt)


def ocr_subject(p):
 # 截取 距离上530开始 940结束
 # 截取 距离上260 570结束
 subImg = cut_img(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 subject = pytesseract.image_to_string(subImg, lang='chi_sim')
 subject = "".join(subject.split())
 subject = subject.split('.')[1].replace("\"", "")
 print(subject)
 ocr_answer(p, subject)
 # openPage(subject)
 # print("结束:" + str(time.time()))
 ocr_subject_parent()


def getSearchNum(key):
 key = quote(key)
 # print(key)
 url = 'http://www.baidu.com/s?wd={}'.format(key)
 # print(url)
 response = urllib.request.urlopen(url)
 page = response.read().decode("utf-8")
 i = int(page.index('百度为您找到相关结果约'))
 start = i + 10
 end = i + 25
 page = page[start: end]
 return page


def ocr_answer(p, subject):
 list = cut_question(p)
 pytesseract.pytesseract.tesseract_cmd = 'E:/Program Files (x86)/Tesseract-OCR/tesseract'
 for p in list:
  t = threading.Thread(target=ocr_answer_thread, args=(p, subject))
  t.start()


def ocr_answer_thread(p, subject):
 answer = pytesseract.image_to_string(p, lang='chi_sim')
 answer = "".join(answer.split())
 v = getSearchNum(subject + ' ' + answer)
 print(answer + ' ' + v)
 # print(time.time())


def ocr_subject_parent():
 result = screenImg()
 if result:
  start = time.time()
  # print("开始:" + str(start))
  # screenshot.check_screenshot()
  process = subprocess.Popen(
   'adb shell screencap -p',
   shell=True, stdout=subprocess.PIPE)
  binary_screenshot = process.stdout.read()
  binary_screenshot = binary_screenshot.replace(b'\r\n', b'\n')
  f = open('autojump.png', 'wb')
  f.write(binary_screenshot)
  f.close()
  # screenshot.pull_screenshot()
  img = Image.open('autojump.png')
  ocr_subject(img)


def openPage(subject):
 url = 'https://www.baidu.com/s?wd={}'.format(
  subject)
 webbrowser.open(url)
 webbrowser.get()


def cut_img(img):
 region = img.crop((70, 260, 1025, 570))
 # region.save("temp/cut_first.png")
 return region


def cut_question(img):
 list = []
 question1 = img.crop((70, 590, 1025, 768))
 question2 = img.crop((70, 769, 1025, 947))
 question3 = img.crop((70, 948, 1025, 1130))
 list.append(question1)
 list.append(question2)
 list.append(question3)
 # question1.save("temp/cut_1.png")
 # question2.save("temp/cut_2.png")
 # question3.save("temp/cut_3.png")
 return list


if __name__ == '__main__':
 main()

由于很多题目是下列哪个不是，所以我更喜欢用第一个方式，基本上识别时间在0.5-0.6秒之间。

python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题

最后里面的ocr_zh.py是可以用来抓取头脑王者的辅助。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python3.5+tesseract+adb实现西瓜视频或头脑王者辅助答题

- Author -

zjy105

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python 判断一个进程是否存在

Apr 09 Python

简单谈谈python的反射机制

Jun 28 Python

python取代netcat过程分析

Feb 10 Python

python3学习之Splash的安装与实例教程

Jul 09 Python

详解django中使用定时任务的方法

Sep 27 Python

Python中创建二维数组

Oct 17 Python

python字典值排序并取出前n个key值的方法

Oct 17 Python

python使用参数对嵌套字典进行取值的方法

Apr 26 Python

Python 实现数据结构-堆栈和队列的操作方法

Jul 17 Python

Django后端接收嵌套Json数据及解析详解

Jul 17 Python

python3.7 的新特性详解

Jul 25 Python

wxPython色环电阻计算器

Nov 18 Python

python+matplotlib绘制3D条形图实例代码

Jan 17 #Python

《Python学习手册》学习总结

Jan 17 #Python

浅谈Python对内存的使用（深浅拷贝）

Jan 17 #Python

Python分支结构（switch）操作简介

Jan 17 #Python

python2 与python3的print区别小结

Jan 16 #Python

python正则中最短匹配实现代码

Jan 16 #Python

Python程序员面试题你必须提前准备!

Jan 16 #Python

You might like

php session 错误

2009/05/21 PHP

php 自定义错误日志实例详解

2016/11/12 PHP

PHP实现二叉树深度优先遍历(前序、中序、后序)和广度优先遍历(层次)实例详解

2018/04/20 PHP

laravel 事件/监听器实例代码

2019/04/12 PHP

web前端开发也需要日志

2010/12/09 Javascript

用显卡加速，轻松把笔记本打造成取暖器的办法！

2013/04/17 Javascript

js兼容的placeholder属性详解

2013/08/18 Javascript

JQuery性能优化的几点建议

2014/05/14 Javascript

JavaScript代码复用模式详解

2014/11/07 Javascript

JQuery中extend的用法实例分析

2015/02/08 Javascript

关于事件mouseover ,mouseout ,mouseenter,mouseleave的区别

2015/10/12 Javascript

图片旋转、鼠标滚轮缩放、镜像、切换图片js代码

2020/12/13 Javascript

jQuery操作iframe中js函数的方法小结

2016/07/06 Javascript

js实现非常棒的弹出div

2016/10/06 Javascript

three.js中文文档学习之如何本地运行详解

2017/11/20 Javascript

在vue里使用codemirror遇到的问题

2018/11/01 Javascript

js实现多张图片每隔一秒切换一张图片

2019/07/29 Javascript

100行代码实现vue表单校验功能(小白自编)

2019/11/19 Javascript

jQuery实现的移动端图片缩放功能组件示例

2020/05/01 jQuery

[36:33]完美世界DOTA2联赛循环赛 Matador vs Forest 第一场 11.06

2020/11/06 DOTA

python的dict,set,list,tuple应用详解

2014/07/24 Python

利用Python画ROC曲线和AUC值计算

2016/09/19 Python

Python常见异常分类与处理方法

2017/06/04 Python

python通过微信发送邮件实现电脑关机

2018/06/20 Python

Python 3 实现定义跨模块的全局变量和使用教程

2019/07/07 Python

python实现超市商品销售管理系统

2019/10/25 Python

在Django中预防CSRF攻击的操作

2020/03/13 Python

Everything But Water官网：美国泳装品牌

2019/03/17 全球购物

3.15国际消费者权益日主题活动活动总结

2014/03/16 职场文书

2014年社区重阳节活动策划方案

2014/09/16 职场文书

2014超市双十一活动策划方案

2014/09/29 职场文书

工作作风整顿个人剖析材料

2014/10/11 职场文书

幼儿园感谢信

2015/01/21 职场文书

八月一日观后感

2015/06/10 职场文书

HR必备：超全面的薪酬待遇管理方案！

2019/07/12 职场文书

Nginx流量拷贝ngx_http_mirror_module模块使用方法详解

2022/04/07 Servers