Python pytesseract验证码识别库用法解析


Posted in Python onJune 29, 2020

环境 centos7 python3

pytesseract只是tesseract-ocr的一种实现接口。所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎)。

依赖安装

yum install-y automake autoconf libtool gcc gcc-c++
yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel

安装依赖的leptonica库

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz
tar -xzvf leptonica-1.72.tar.gz
cd leptonica-1.72
./configure
make && make install

安装tesseract-ocr

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
mv 3.04.00 Tesseract3.04.00.tar.gz
tar -xvf Tesseract3.04.00.tar.gz
cd tesseract-3.04.00/
./configure
make && make install

安装语言包:

wget https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata #英文默认包
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata #中文繁体
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata #中文简体

cp/mv *.traineddata /usr/local/share/tessdata/ #移动下载的包到/usr/local/share/tessdata/ 这个路径下,也可以手动移动

安装pytesseract:

pip install Pillow
pip install pytesseract

至此安装完成,附上使用方法:

import pytesseract 
from PIL import Imag

image = Image.open("port_img.jpg")
text = pytesseract.image_to_string(image)
print(text)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3利用smtplib通过qq邮箱发送邮件方法示例
Dec 03 Python
Python机器学习之决策树算法
Dec 22 Python
对numpy的array和python中自带的list之间相互转化详解
Apr 13 Python
python自动化报告的输出用例详解
May 30 Python
Django网络框架之创建虚拟开发环境操作示例
Jun 06 Python
python下的opencv画矩形和文字注释的实现方法
Jul 09 Python
Python调用Windows命令打印文件
Feb 07 Python
基于python的docx模块处理word和WPS的docx格式文件方式
Feb 13 Python
python之pygame模块实现飞机大战完整代码
Nov 29 Python
解决pycharm修改代码后第一次运行不生效的问题
Feb 06 Python
一劳永逸彻底解决pip install慢的办法
May 24 Python
python中pymysql包操作数据库方法
Apr 19 Python
用Python开发app后端有优势吗
Jun 29 #Python
在keras里实现自定义上采样层
Jun 28 #Python
Python如何对XML 解析
Jun 28 #Python
keras 自定义loss层+接受输入实例
Jun 28 #Python
python批量处理多DNS多域名的nslookup解析实现
Jun 28 #Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 #Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 #Python
You might like
php 使用file_get_contents读取大文件的方法
2014/11/13 PHP
ThinkPHP的SAE开发相关注意事项详解
2016/10/09 PHP
微信公众平台开发-微信服务器IP接口实例(含源码)
2017/03/05 PHP
ThinkPHP实现转换数据库查询结果数据到对应类型的方法
2017/11/16 PHP
PHP基于ip2long实现IP转换整形
2020/12/11 PHP
鼠标经过的文本框textbox变色
2009/05/21 Javascript
javascript 原型链维护和继承详解
2014/11/26 Javascript
jQuery插件imgPreviewQs实现上传图片预览
2016/01/15 Javascript
一款简单的jQuery图片标注效果附源码下载
2016/03/22 Javascript
[原创]Javascript 实现广告后加载 可加载百度谷歌联盟广告
2016/05/11 Javascript
JavaScript之cookie技术详解
2016/11/18 Javascript
原生js实现简单的链式操作
2017/07/04 Javascript
jQuery实现广告条滚动效果
2017/08/22 jQuery
去掉vue 中的代码规范检测两种方法(Eslint验证)
2018/03/21 Javascript
node基于puppeteer模拟登录抓取页面的实现
2018/05/09 Javascript
vue项目中使用Svg的方法
2018/10/24 Javascript
vue-cli3+ts+webpack实现多入口多出口功能
2019/05/30 Javascript
微信小程序实现图片压缩
2019/12/03 Javascript
es6中Promise 对象基本功能与用法实例分析
2020/02/23 Javascript
[50:20]DOTA2上海特级锦标赛主赛事日 - 5 总决赛Liquid VS Secret第四局
2016/03/06 DOTA
Python爬虫之模拟知乎登录的方法教程
2017/05/25 Python
python搭建服务器实现两个Android客户端间收发消息
2018/04/12 Python
python一行sql太长折成多行并且有多个参数的方法
2018/07/19 Python
详解python中eval函数的作用
2019/10/22 Python
python抓取多种类型的页面方法实例
2019/11/20 Python
Ralph Lauren意大利官方网站:时尚界最负盛名的品牌之一
2018/10/18 全球购物
大学校庆邀请函
2014/01/11 职场文书
孝老爱亲模范事迹
2014/01/24 职场文书
工程售后服务方案
2014/06/08 职场文书
中国梦团日活动总结
2014/07/07 职场文书
环境保护建议书
2014/08/26 职场文书
入党积极分子学习党的纲领思想汇报
2014/09/13 职场文书
审计局2014法制宣传日活动总结
2014/11/01 职场文书
刑事辩护词范文
2015/05/21 职场文书
防震减灾主题班会
2015/08/14 职场文书
pytorch锁死在dataloader(训练时卡死)
2021/05/28 Python