Python2实现的图片文本识别功能详解


Posted in Python onJuly 11, 2018

本文实例讲述了Python2实现的图片文本识别功能。分享给大家供大家参考,具体如下:

这里需要用到python的几个库,分别是pytesser,以及pytesser的依赖库PIL。python的版本建议用2.7或者2.7一下的都行,不建议用python3以上的,因为python3不向下兼容,所以有很多python2的东西它不支持

pytesser下载的话,我直接在pycharm里面下全是失败,用DOS的命令行下也是失败,所以还是自己直接去google下吧
地址:http://code.google.com/p/pytesser/downloads/list

如果打不开上面的网址的话可以从我的资源里面下载,点击此处本站下载

下载好了之后安装,步骤:

1.  解压pytesser ,将解压后的文件复制到Python安装目录的Lib\site-packages下,直接使用,比如我的安装目录是:C:\Python27\Lib\site-packages

2. 这里我建立好的pytesser目录为C:\Python27\Lib\site-packages\pytesser\

3. 接下来打开pytesser文件夹,将pytesser.py修改成__init__.py,然后打开py文件进行修改:
①. import Image 改为: from PIL import Image
②. tesseract_exe_name = 'tesseract' —> tesseract_exe_name = 'C:\\Python27\\Lib\\site-packges\\pytesser\\tesseract,注意双斜杠,否则可能因为转义字符报错

接下来就是下载PIL了。这个我在pycharm里面也是下载失败,提示没有找到适合python版本的PIL。
可以在DOS命令行下用命令下:pip install Pillow 这里要注意的是如果要直接在DOS下用pip命令的话要先把pip的路径加到环境变量path里面去,例如我的pip路径:“D:\python2.7.13\Scripts\

注:小编尝试后发现PIL安装很麻烦,推荐下载exe直接安装

具体可至PIL官网查找对应安装版本:http://pythonware.com/products/pil/

全部下载完之后就可以开始拿图片测试了。这里我们先拿上面下载的pytesser压缩包里面给的测试图片来测试
代码如下:

from pytesser import *
img=Image.open("D:\\fnord.tif") 
#我这里是直接把图片复制在d盘下。可以随意更改。如果是d盘下的XX文件夹,路径就是:d:\XX\\fnord.tif
#一些对python不熟悉的小伙伴要注意的是这个路径只有最后一个斜杠要改成双斜杠,前面的都是单斜杠,如果不是这样的话在pycharm里面就会报一些看不懂的错误,百度到死都不知道怎么解决。
print image_to_string(img)

或者可以写成:

print image_file_to_string("D:\\fnord.tif")

这里需要注意一下,直接运行上面的代码的话可能会报一个找不到Image类的错误,具体我也不是很清楚,可能是因为pytesser只支持PIL的Image类吧,因此我们还要改一个东西,就是上面步骤3中pytesser包里面__init__.py 文件的第一行:import Image改成from PIL import Image。如图:

 Python2实现的图片文本识别功能详解

这时候就可以看到输出结果:

 Python2实现的图片文本识别功能详解

大功告成。

最后说一下这个方法的一些缺点,就是识别率不高,要图片里面的文字很清晰才可以识别出来,要想提高识别率的话还要对图片进行一些操作,这里就不详细说啦,请大家自行百度。

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python获取糗百图片代码实例
Dec 18 Python
Python Socket编程详细介绍
Mar 23 Python
Python基于回溯法子集树模板解决选排问题示例
Sep 07 Python
python线程池(threadpool)模块使用笔记详解
Nov 17 Python
用Python PIL实现几个简单的图片特效
Jan 18 Python
Python变量类型知识点总结
Feb 18 Python
Python Flask框架模板操作实例分析
May 03 Python
Django之创建引擎索引报错及解决详解
Jul 17 Python
python读取大文件越来越慢的原因与解决
Aug 08 Python
python3.6连接mysql数据库及增删改查操作详解
Feb 10 Python
Python键鼠操作自动化库PyAutoGUI简介(小结)
May 17 Python
python中用ctypes模拟点击的实例讲解
Nov 26 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 #Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
You might like
php一句话cmdshell新型 (非一句话木马)
2009/04/18 PHP
php异常:Parse error: syntax error, unexpected T_ENCAPSED_AND_WHITESPACE  eval()'d code error
2011/05/19 PHP
php 中文字符串首字母的获取函数分享
2013/11/04 PHP
php获取一个变量的名字的方法
2014/09/05 PHP
PHP pear安装配置教程
2016/05/14 PHP
PHP 计算两个特别大的整数实例代码
2018/05/07 PHP
js实现addClass,removeClass,hasClass的函数代码
2011/07/13 Javascript
node.js中的fs.unlink方法使用说明
2014/12/15 Javascript
jQuery实现获取form表单内容及绑定数据到form表单操作分析
2018/07/03 jQuery
微信小程序实现发红包功能
2018/07/11 Javascript
JS常见构造模式实例对比分析
2018/08/27 Javascript
微信小程序实现登录注册tab切换效果
2020/12/29 Javascript
记一次用vue做的活动页的方法步骤
2019/04/11 Javascript
Vuex 模块化使用详解
2019/07/31 Javascript
js找出5个数中最大的一个数和倒数第二大的数实现方法示例小结
2020/03/04 Javascript
vue 获取url参数、get参数返回数组的操作
2020/11/12 Javascript
python使用mysql数据库示例代码
2017/05/21 Python
Python贪心算法实例小结
2018/04/22 Python
python os用法总结
2018/06/08 Python
django框架之cookie/session的使用示例(小结)
2018/10/15 Python
python为QT程序添加图标的方法详解
2020/03/09 Python
Pandas之read_csv()读取文件跳过报错行的解决
2020/04/21 Python
美国户外生活方式品牌:Eddie Bauer
2016/12/28 全球购物
摩托车和ATV零件、配件和服装的首选在线零售商:MotoSport
2017/12/22 全球购物
理肤泉加拿大官网:La Roche-Posay加拿大
2018/07/06 全球购物
俄罗斯儿童和青少年服装、鞋子及配件的在线商店:Orby
2020/02/20 全球购物
会计电算化个人自我评价
2013/11/17 职场文书
大学生关于奋斗的演讲稿
2014/01/09 职场文书
工作决心书
2014/03/11 职场文书
开工仪式主持词
2014/03/20 职场文书
毕业生就业协议书
2014/04/11 职场文书
会计电算化专业求职信
2014/06/10 职场文书
pandas中DataFrame检测重复值的实现
2021/05/26 Python
MYSQL(电话号码,身份证)数据脱敏的实现
2021/05/28 MySQL
Redis高并发防止秒杀超卖实战源码解决方案
2021/11/01 Redis
python数字图像处理数据类型及颜色空间转换
2022/06/28 Python