Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中如何使用正则表达式的非贪婪模式示例
Oct 09 Python
python 处理telnet返回的More,以及get想要的那个参数方法
Feb 14 Python
python实现文件的备份流程详解
Jun 18 Python
python实现可变变量名方法详解
Jul 01 Python
Python Pandas数据结构简单介绍
Jul 03 Python
python中调试或排错的五种方法示例
Sep 12 Python
django框架forms组件用法实例详解
Dec 10 Python
解决python ThreadPoolExecutor 线程池中的异常捕获问题
Apr 08 Python
python函数调用,循环,列表复制实例
May 03 Python
python输入一个水仙花数(三位数) 输出百位十位个位实例
May 03 Python
python绘图模块之利用turtle画图
Feb 12 Python
Python破解极验滑动验证码详细步骤
May 21 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
CURL状态码列表(详细)
2013/06/27 PHP
php操作MongoDB基础教程(连接、新增、修改、删除、查询)
2014/03/25 PHP
php实现读取和写入tab分割的文件
2015/06/01 PHP
Symfony查询方法实例小结
2017/06/28 PHP
laravel在中间件内生成参数并且传递到控制器中的2种姿势
2019/10/15 PHP
浅谈JavaScript中面向对象技术的模拟
2006/09/25 Javascript
二级域名或跨域共享Cookies的实现方法
2008/08/07 Javascript
Javascript 中文字符串处理额外注意事项
2009/11/15 Javascript
firefox下frameset取不到值的解决方法
2010/09/06 Javascript
基于jQuery的input输入框下拉提示层(自动邮箱后缀名)
2012/06/14 Javascript
JQuery简单实现锚点链接的平滑滚动
2015/05/03 Javascript
js简单工厂模式用法实例
2015/06/30 Javascript
巧用jQuery选择器提高写表单效率的方法
2016/08/19 Javascript
Angular页面间切换及传值的4种方法
2016/11/04 Javascript
面试常见的js算法题
2017/03/23 Javascript
Javascript中八种遍历方法的执行速度深度对比
2017/04/25 Javascript
jQuery实现radio第一次点击选中第二次点击取消功能
2017/05/15 jQuery
jQuery导航条固定定位效果实例代码
2017/05/26 jQuery
javascript中的隐式调用
2018/02/10 Javascript
基于vue实现可搜索下拉框定制组件
2020/03/26 Javascript
angular5 子组件监听父组件传入值的变化方法
2018/09/30 Javascript
浅谈ng-zorro使用心得
2018/12/03 Javascript
JavaScript模板引擎原理与用法详解
2018/12/24 Javascript
elementUI table表格动态合并的示例代码
2019/05/15 Javascript
遍历python字典几种方法总结(推荐)
2016/09/11 Python
Python 40行代码实现人脸识别功能
2017/04/02 Python
python opencv旋转图像(保持图像不被裁减)
2018/07/26 Python
用python的turtle模块实现给女票画个小心心
2019/11/23 Python
HTML5实现多张图片上传功能
2016/03/11 HTML / CSS
加拿大鞋网:Globo Shoes
2019/12/26 全球购物
explicit和implicit的含义
2012/11/15 面试题
优秀学生干部推荐材料
2014/02/03 职场文书
学生会部长竞聘书
2014/03/31 职场文书
小学校园之星事迹材料
2014/05/16 职场文书
个人收入证明模板
2014/09/18 职场文书
代收款委托书范本
2014/10/01 职场文书