Python实现识别图片内容的方法分析


Posted in Python onJuly 11, 2018

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考,具体如下:

python识别图片内容。

这里我的环境为windows64位,python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理,安装方法可参考附录windows下安装python包管理器pip

安装PIL模块:

pip install Pillow

tesseract模块安装:

pip install pytesseract

安装识别引擎和中文语言包,点击此处本站下载

下载完成解压:

1.双击tesseract-ocr-setup-3.02.02.exe安装,安装完成后,需要指定tesseract模块识别引擎的程序路径,打开python安装路径的模块路径,我的路径为:E:\wamp\python\Lib\site-packages\,进入pytesseract,编辑pytesseract.py文件,修改 tesseract_cmd = 'tesseract' 的内容:

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包,复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下,我的路径:E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码:

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附:windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址:https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压,这里我解压到D:\python\pip-9.0.1,命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成,输入pip list查看是否成功

pip list

显示下面信息代表安装成功:

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令:

pip install xxx

更多关于Python相关内容可查看本站专题:《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python模块学习 filecmp 文件比较
Aug 27 Python
python使用mailbox打印电子邮件的方法
Apr 30 Python
深入理解Django的自定义过滤器
Oct 17 Python
使用Python抓取豆瓣影评数据的方法
Oct 17 Python
Python中的支持向量机SVM的使用(附实例代码)
Jun 26 Python
利用Pandas和Numpy按时间戳将数据以Groupby方式分组
Jul 22 Python
python打包成so文件过程解析
Sep 28 Python
python图像处理模块Pillow的学习详解
Oct 09 Python
pytorch中图像的数据格式实例
Feb 11 Python
Pytorch对Himmelblau函数的优化详解
Feb 29 Python
python 写一个水果忍者游戏
Jan 13 Python
python中对列表的删除和添加方法详解
Feb 24 Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
Python基于多线程操作数据库相关问题分析
Jul 11 #Python
pandas 按照特定顺序输出的实现代码
Jul 10 #Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 #Python
Python中 map()函数的用法详解
Jul 10 #Python
python 读取视频,处理后,实时计算帧数fps的方法
Jul 10 #Python
You might like
PHP网站提速三大“软”招
2006/10/09 PHP
php生成数组的使用示例 php全组合算法
2014/01/16 PHP
PHP实现的堆排序算法详解
2017/08/17 PHP
PHP的new static和new self的区别与使用
2019/11/27 PHP
IE6下js通过css隐藏select的一个bug
2010/08/16 Javascript
用jquery写的菜单从左往右滑动出现
2014/04/11 Javascript
javascript显式类型转换实例分析
2015/04/25 Javascript
js贪吃蛇网页版游戏特效代码分享(挑战十关)
2015/08/24 Javascript
封装获取dom元素的简单实例
2016/07/08 Javascript
轮播图组件js代码
2016/08/08 Javascript
AngularJS中$http服务常用的应用及参数
2016/08/22 Javascript
微信小程序上滑加载下拉刷新(onscrollLower)分批加载数据(二)
2017/05/11 Javascript
angularjs实现天气预报功能
2020/06/16 Javascript
解决Idea、WebStorm下使用Vue cli脚手架项目无法使用Webpack别名的问题
2019/10/11 Javascript
JS前端面试必备——基本排序算法原理与实现方法详解【插入/选择/归并/冒泡/快速排序】
2020/02/24 Javascript
jQuery实现鼠标放置名字上显示详细内容气泡提示框效果的方法分析
2020/04/04 jQuery
[01:33]一分钟玩转DOTA2第三弹:DOTA2&DotA快捷操作大对比
2014/06/04 DOTA
[01:27:43]VGJ.S vs TNC Supermajor 败者组 BO3 第三场 6.6
2018/06/07 DOTA
深入理解Python中命名空间的查找规则LEGB
2015/08/06 Python
python中的格式化输出用法总结
2016/07/28 Python
python爬虫实现教程转换成 PDF 电子书
2017/02/19 Python
Django处理文件上传File Uploads的实例
2018/05/28 Python
python基于递归解决背包问题详解
2019/07/03 Python
Django Docker容器化部署之Django-Docker本地部署
2019/10/09 Python
python3连接kafka模块pykafka生产者简单封装代码
2019/12/23 Python
如何利用python之wxpy模块玩转微信
2020/08/17 Python
英国乐购杂货:Tesco Groceries
2018/11/29 全球购物
Farfetch美国:奢侈品牌时尚购物平台
2019/05/02 全球购物
荷兰家电销售网站:Welhof
2020/12/08 全球购物
澳大利亚在线批发商:Simply Wholesale
2021/02/24 全球购物
linux面试题参考答案(9)
2015/01/07 面试题
财务方面个人工作的自我评价
2013/12/28 职场文书
大学生军训感想
2014/02/16 职场文书
房产公证委托书范本
2014/09/20 职场文书
教师党的群众路线教育实践活动个人整改方案
2014/10/31 职场文书
整改通知书格式
2015/04/22 职场文书