Python实现识别手写数字大纲


Posted in Python onJanuary 29, 2018

写在前面

其实我之前写过一个简单的识别手写数字的程序,但是因为逻辑比较简单,而且要求比较严苛,是在50x50大小像素的白底图上手写黑色数字,并且给的训练材料也不够多,导致准确率只能五五开。所以这一次准备写一个加强升级版的,借此来提升我对Python处理文件与图片的能力。

这次准备加强难度:

  • 被识别图片可以是任意大小;
  • 不一定是白底图,只要数字颜色是黑色,周围环境是浅色就行;
  • 加强识别手写数字的逻辑,提升准确率。

因为我还没开始正式写,并且最近专业课程学习也比较紧迫,所以可能更新的比较慢。不过放心,代码质量肯定是不会下降的,我会尽我所能写的逻辑明确、通俗易懂点。

所以这次面向的人群是拥有一定Python基础,对数学算发有一点了解(识别图像的算法嘛)的人。

但毕竟我不是专业的,也没有看那么多论文,所以我这里运用的算法仅仅是我一个粗浅的想法,只是为了练手而已。如果和实际应用脱节,还望莫怪。

当然,如果诸位有什么比较好的想法,可以在下方评论或者私信我,我们可以探讨一下,相互进步。

整体思路

大纲

对图片的预处理

在最开始的时候,我们假设只拥有一个训练库,里面是从0到9的手写数字图案若干组。

所以我们首先应该将这些图案读入程序中,然后运用某种方式保存好,用来后面识别图片。

这里的图案我们假设是大小不一的,里面手写的数字也是有大有小。所以我们可以将包住手写数字图案的最小矩形给裁剪出来,然后将裁剪出来的图案统一给拉伸成相同大小的图案。

以上操作得出一个矩阵,这个矩阵的值是图案的灰度值。对于训练用的图片和被检测的图片我们都是这样处理。

图像识别的算法处理

我这里想用两个方法来让数字识别准确点:

  • 识别所写数字的“洞数”;
  • 将图片转为1xn的向量,然后根据根据训练图片分出的类对被识别图片图片进行分类。

洞数就是某个数字是否有闭合的曲线,比如说7没有洞,6有一个洞,8有两个洞。所以我们根据洞数可以分成以下三类

0洞:1, 2, 3, 4, 5, 7
1洞:6, 9, 0
2洞:8

但是因为各种手写差异,比如说6, 9, 8之类的没有闭合,4上面闭合,所以会导致下面这种可能情况

0洞:1, 2, 3, 4, 5, 6, 7, 9
1洞:6, 8, 9, 0
2洞:8

虽然说这样分类0洞占大多数,但是聊胜于无。

对于将图片转为向量的意思就是将图片原本的二维矩阵展开称为一维向量。这个用numpy的函数可以可以很简单的实现。

对于这个分类,下面我就简单的讲一下原理。

假设我们在二维平面上有两个点A=(1,1)和B=(5,5),我现在再放一个点C=(2,2),那么请问,C点离哪一个更近?

学过初中数学的都会知道肯定是离A点更近。所以我们换一种说法,我们现在有两个类A和B,A类中包括了点(1,1),B类中包括了点(5,5),所以对于点(2,2),它可能属于哪一类?

因为这个点离A类的点更近一点,所以它可能属于A类。这就是结论。那么对于3维空间,A类是点(1,1,1)和B类是(5,5,5),那么对于点(2,2,2)肯定也是属于A类。

可以看出,我们这里是将两个点的距离来作为判断属于哪一类的标准。那么对于我们将图片拉成的1xn维向量,他实际上投影到n维空间上就是一个点,所以我们将训练向量分成10类,分别代表十个数字,那么被识别数字靠近哪一个类,那说明它有可能属于这一个类。

那么我们这里可以假设对于被识别向量,列出距离他最近的前十个向量分别属于哪一类别,然后根据名次加上一个权重,并计算出一个值。该值代表了可能是属于哪一个类,因此这就是我们得出的最终的一个结果——被识别手写数字图片的值。

难点

保存已训练图片的向量。这一条我想就直接保存在csv文件中,每一次运算时先判断是否有新的训练图片加入,如果有,则把新的图片向量也存入csv文件中。若没有,则直接读取所有向量保存在一个大矩阵中用于计算。

将手写数字从背景中分离。因为我这里令手写数字为黑色(灰度值为0),其他背景色尽量为,所以就令灰度值大于某个界限(如50)的点全部为255(白色),其余不变。这样子只要非255,那就是手写数字的点。

识别手写数字的洞。这个有算法,搞过程序设计竞赛的应该会了解。具体我就不细讲了,大概就是利用递归之类的去寻找。

求向量距离。这个更简单了,求解每一个训练向量与识别向量的距离就行,只不过当训练向量比较大的时候可能比较慢。

总结

以上就是全部思路,如果诸位有更好的想法,欢迎评论/私信我,让我们一起相互学习进步,谢谢。

Python 相关文章推荐
python学习笔记之调用eval函数出现invalid syntax错误问题
Oct 18 Python
实例讲解Python中函数的调用与定义
Mar 14 Python
Python实现的人工神经网络算法示例【基于反向传播算法】
Nov 11 Python
解决Python 使用h5py加载文件,看不到keys()的问题
Feb 08 Python
在tensorflow中设置使用某一块GPU、多GPU、CPU的操作
Feb 07 Python
Python打包工具PyInstaller的安装与pycharm配置支持PyInstaller详细方法
Feb 27 Python
Django模板标签中url使用详解(url跳转到指定页面)
Mar 19 Python
pycharm 实现本地写代码,服务器运行的操作
Jun 08 Python
详解Open Folder as PyCharm Project怎么添加的方法
Dec 29 Python
django上传文件的三种方式
Apr 29 Python
端午节将至,用Python爬取粽子数据并可视化,看看网友喜欢哪种粽子吧!
Jun 11 Python
Python将CSV文件转化为HTML文件的操作方法
Jun 30 Python
django文档学习之applications使用详解
Jan 29 #Python
Python实现PS滤镜Fish lens图像扭曲效果示例
Jan 29 #Python
python实现识别手写数字 python图像识别算法
Mar 23 #Python
Python实现简易版的Web服务器(推荐)
Jan 29 #Python
python实现图像识别功能
Jan 29 #Python
Python使用正则表达式获取网页中所需要的信息
Jan 29 #Python
python实现K最近邻算法
Jan 29 #Python
You might like
高性能PHP框架Symfony2经典入门教程
2014/07/08 PHP
PHP统计数值数组中出现频率最多的10个数字的方法
2015/04/20 PHP
Session 失效的原因汇总及解决丢失办法
2015/09/30 PHP
thinkphp3.x中display方法及show方法的用法实例
2016/05/19 PHP
浅谈php中urlencode与rawurlencode的区别
2016/09/05 PHP
jQuery使用手册之三 CSS操作
2007/03/24 Javascript
最简单的jQuery程序 入门者学习
2009/07/09 Javascript
Prototype 学习 工具函数学习($A方法)
2009/07/12 Javascript
用于节点操作的API,颠覆原生操作HTML DOM节点的API
2010/12/11 Javascript
js获取dom的高度和宽度(可见区域及部分等等)
2013/06/13 Javascript
JS格式化数字金额用逗号隔开保留两位小数
2013/10/18 Javascript
javascript实现当前页导航激活的方法
2015/02/27 Javascript
JavaScript实现把rgb颜色转换成16进制颜色的方法
2015/06/01 Javascript
jQuery实现的数值范围range2dslider选取插件特效多款代码分享
2015/08/27 Javascript
JS+CSS实现仿msn风格选项卡效果代码
2015/10/22 Javascript
Jquery操作cookie记住用户名
2016/03/29 Javascript
JavaScript学习笔记整理_关于表达式和语句
2016/09/19 Javascript
JavaScript实现解析INI文件内容的方法
2016/11/17 Javascript
AngularJS中指令的四种基本形式实例分析
2016/11/22 Javascript
gulp解决跨域的配置文件问题
2017/06/08 Javascript
关于Webpack dev server热加载失败的解决方法
2018/02/22 Javascript
Vue使用localStorage存储数据的方法
2019/05/27 Javascript
Flutter实现仿微信底部菜单栏功能
2019/09/18 Javascript
Vue 实现拨打电话操作
2020/11/16 Javascript
python自定义类并使用的方法
2015/05/07 Python
Python sorted对list和dict排序
2020/06/09 Python
分享全球十款超强HTML5开发工具
2014/05/14 HTML / CSS
写给女朋友的道歉信
2014/01/08 职场文书
食品安全处置方案
2014/06/14 职场文书
公司领导班子四风对照检查材料
2014/09/27 职场文书
长江七号观后感
2015/06/11 职场文书
中国文明网2015年“向国旗敬礼”活动网上签名寄语
2015/09/24 职场文书
文明医院的标语集锦!
2019/07/24 职场文书
《正面管教》读后有感:和善而坚定的旅程
2019/12/19 职场文书
Node-Red实现MySQL数据库连接的方法
2021/08/07 MySQL
Nginx如何配置多个服务域名解析共用80端口详解
2022/09/23 Servers