python实现人脸识别经典算法(一) 特征脸法


Posted in Python onMarch 13, 2018

近来想要做一做人脸识别相关的内容,主要是想集成一个系统,看到opencv已经集成了三种性能较好的算法,但是还是想自己动手试一下,毕竟算法都比较初级。

操作环境:python2.7

第三方库:opencv for python、numpy

第一种比较经典的算法就是特征脸法,本质上其实就是PCA降维,这种算法的基本思路是,把二维的图像先灰度化,转化为一通道的图像,之后再把它首尾相接转化为一个列向量,假设图像大小是20*20的,那么这个向量就是400维,理论上讲组织成一个向量,就可以应用任何机器学习算法了,但是维度太高算法复杂度也会随之升高,所以需要使用PCA算法降维,然后使用简单排序或者KNN都可以。

只当搬运工,送上链接。

PCA ,这篇博客讲得非常好了,从原理到实现基本看这个就能搞出来了:PCA的数学原理

特征脸法:PCA应用在人脸识别当中:人脸识别经典算法一:特征脸方法(Eigenface) ,这里与PCA有不同的操作就是特征值分解的时候,由于图像组成的列向量维度太高,直接按照PCA算法求解会很慢,所以这里有一种特殊的处理方法。

数据组织形式为若干样本图片分类放入对应文件夹中,然后在统一存放入face文件夹下,测试图像单独一张图像即可。

另外,由于PCA中维度是一个很麻烦的事情,所以在程序中,我打印了很多维度信息,有助于我们理解PCA的工作过程和调试。

代码如下:

#encoding=utf-8 
import numpy as np 
import cv2 
import os 
 
class EigenFace(object): 
 def __init__(self,threshold,dimNum,dsize): 
 self.threshold = threshold # 阈值暂未使用 
 self.dimNum = dimNum 
 self.dsize = dsize 
 
 def loadImg(self,fileName,dsize): 
 ''''' 
 载入图像,灰度化处理,统一尺寸,直方图均衡化 
 :param fileName: 图像文件名 
 :param dsize: 统一尺寸大小。元组形式 
 :return: 图像矩阵 
 ''' 
 img = cv2.imread(fileName) 
 retImg = cv2.resize(img,dsize) 
 retImg = cv2.cvtColor(retImg,cv2.COLOR_RGB2GRAY) 
 retImg = cv2.equalizeHist(retImg) 
 # cv2.imshow('img',retImg) 
 # cv2.waitKey() 
 return retImg 
 
 
 def createImgMat(self,dirName): 
 ''''' 
 生成图像样本矩阵,组织形式为行为属性,列为样本 
 :param dirName: 包含训练数据集的图像文件夹路径 
 :return: 样本矩阵,标签矩阵 
 ''' 
 dataMat = np.zeros((10,1)) 
 label = [] 
 for parent,dirnames,filenames in os.walk(dirName): 
  # print parent 
  # print dirnames 
  # print filenames 
  index = 0 
  for dirname in dirnames: 
  for subParent,subDirName,subFilenames in os.walk(parent+'/'+dirname): 
   for filename in subFilenames: 
   img = self.loadImg(subParent+'/'+filename,self.dsize) 
   tempImg = np.reshape(img,(-1,1)) 
   if index == 0 : 
    dataMat = tempImg 
   else: 
    dataMat = np.column_stack((dataMat,tempImg)) 
   label.append(subParent+'/'+filename) 
   index += 1 
 return dataMat,label 
 
 
 def PCA(self,dataMat,dimNum): 
 ''''' 
 PCA函数,用于数据降维 
 :param dataMat: 样本矩阵 
 :param dimNum: 降维后的目标维度 
 :return: 降维后的样本矩阵和变换矩阵 
 ''' 
 # 均值化矩阵 
 meanMat = np.mat(np.mean(dataMat,1)).T 
 print '平均值矩阵维度',meanMat.shape 
 diffMat = dataMat-meanMat 
 # 求协方差矩阵,由于样本维度远远大于样本数目,所以不直接求协方差矩阵,采用下面的方法 
 covMat = (diffMat.T*diffMat)/float(diffMat.shape[1]) # 归一化 
 #covMat2 = np.cov(dataMat,bias=True) 
 #print '基本方法计算协方差矩阵为',covMat2 
 print '协方差矩阵维度',covMat.shape 
 eigVals, eigVects = np.linalg.eig(np.mat(covMat)) 
 print '特征向量维度',eigVects.shape 
 print '特征值',eigVals 
 eigVects = diffMat*eigVects 
 eigValInd = np.argsort(eigVals) 
 eigValInd = eigValInd[::-1] 
 eigValInd = eigValInd[:dimNum] # 取出指定个数的前n大的特征值 
 print '选取的特征值',eigValInd 
 eigVects = eigVects/np.linalg.norm(eigVects,axis=0) #归一化特征向量 
 redEigVects = eigVects[:,eigValInd] 
 print '选取的特征向量',redEigVects.shape 
 print '均值矩阵维度',diffMat.shape 
 lowMat = redEigVects.T*diffMat 
 print '低维矩阵维度',lowMat.shape 
 return lowMat,redEigVects 
 
 def compare(self,dataMat,testImg,label): 
 ''''' 
 比较函数,这里只是用了最简单的欧氏距离比较,还可以使用KNN等方法,如需修改修改此处即可 
 :param dataMat: 样本矩阵 
 :param testImg: 测试图像矩阵,最原始形式 
 :param label: 标签矩阵 
 :return: 与测试图片最相近的图像文件名 
 ''' 
 testImg = cv2.resize(testImg,self.dsize) 
 testImg = cv2.cvtColor(testImg,cv2.COLOR_RGB2GRAY) 
 testImg = np.reshape(testImg,(-1,1)) 
 lowMat,redVects = self.PCA(dataMat,self.dimNum) 
 testImg = redVects.T*testImg 
 print '检测样本变换后的维度',testImg.shape 
 disList = [] 
 testVec = np.reshape(testImg,(1,-1)) 
 for sample in lowMat.T: 
  disList.append(np.linalg.norm(testVec-sample)) 
 print disList 
 sortIndex = np.argsort(disList) 
 return label[sortIndex[0]] 
 
 
 def predict(self,dirName,testFileName): 
 ''''' 
 预测函数 
 :param dirName: 包含训练数据集的文件夹路径 
 :param testFileName: 测试图像文件名 
 :return: 预测结果 
 ''' 
 testImg = cv2.imread(testFileName) 
 dataMat,label = self.createImgMat(dirName) 
 print '加载图片标签',label 
 ans = self.compare(dataMat,testImg,label) 
 return ans 
 
 
if __name__ == '__main__': 
 eigenface = EigenFace(20,50,(50,50)) 
 print eigenface.predict('d:/face','D:/face_test/1.bmp')

 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python发送arp欺骗攻击代码分析
Jan 16 Python
python实现文件快照加密保护的方法
Jun 30 Python
python函数局部变量用法实例分析
Aug 04 Python
Python程序中用csv模块来操作csv文件的基本使用教程
Mar 03 Python
python 读取竖线分隔符的文本方法
Dec 20 Python
python gdal安装与简单使用
Aug 01 Python
Pytorch反向求导更新网络参数的方法
Aug 17 Python
python 两个数据库postgresql对比
Oct 21 Python
Python3运算符常见用法分析
Feb 14 Python
带你学习Python如何实现回归树模型
Jul 16 Python
python爬虫数据保存到mongoDB的实例方法
Jul 28 Python
python对文档中元素删除,替换操作
Apr 02 Python
tensorflow实现softma识别MNIST
Mar 12 #Python
wxpython实现图书管理系统
Mar 12 #Python
人生苦短我用python python如何快速入门?
Mar 12 #Python
tensorflow实现KNN识别MNIST
Mar 12 #Python
Python操作MySQL模拟银行转账
Mar 12 #Python
python3 图片referer防盗链的实现方法
Mar 12 #Python
tensorflow构建BP神经网络的方法
Mar 12 #Python
You might like
全国FM电台频率大全 - 27 陕西省
2020/03/11 无线电
PHP开发过程中常用函数收藏
2009/12/14 PHP
PHP防CC攻击实现代码
2011/12/29 PHP
PHP关于IE下的iframe跨域导致session丢失问题解决方法
2013/10/10 PHP
ThinkPHP3.1新特性之对页面压缩输出的支持
2014/06/19 PHP
PHP实现服务器状态监控的方法
2014/12/09 PHP
PHP array_shift()用法实例分析
2019/01/07 PHP
微信JSSDK分享功能图文实例详解
2019/04/08 PHP
PHP大文件切割上传并带进度条功能示例
2019/07/01 PHP
用Jquery实现可编辑表格并用AJAX提交到服务器修改数据
2009/12/27 Javascript
基于jquery的仿百度搜索框效果代码
2011/04/11 Javascript
JS中使用Array函数shift和pop创建可忽略参数的例子
2014/05/28 Javascript
把文本中的URL地址转换为可点击链接的JavaScript、PHP自定义函数
2014/07/29 Javascript
jQuery中eq()方法用法实例
2015/01/05 Javascript
jquery实现左右滑动菜单效果代码
2015/08/27 Javascript
JS判断iframe是否加载完成的方法
2016/08/03 Javascript
利用jQuery插件imgAreaSelect实现图片上传裁剪(放大缩小)
2016/12/02 Javascript
微信小程序如何像vue一样在动态绑定类名
2018/04/17 Javascript
小程序实现选择题选择效果
2018/11/04 Javascript
JavaScript中引用vs复制示例详析
2018/12/06 Javascript
Python中map和列表推导效率比较实例分析
2015/06/17 Python
利用python实现命令行有道词典的方法示例
2017/01/31 Python
Python使用numpy模块创建数组操作示例
2018/06/20 Python
在IPython中进行Python程序执行时间的测量方法
2018/11/01 Python
python二分法查找算法实现方法【递归与非递归】
2019/12/06 Python
Python实现手机号自动判断男女性别(实例解析)
2019/12/22 Python
Python如何使用字符打印照片
2020/01/03 Python
Python小白垃圾回收机制入门
2020/06/09 Python
泰国第一的化妆品网站:Konvy
2018/02/25 全球购物
Surfdome西班牙:世界上最受欢迎的生活方式品牌
2019/02/13 全球购物
建筑行业的大学生自我评价
2013/12/08 职场文书
安全教育第一课观后感
2015/06/17 职场文书
2015年音乐教研组工作总结
2015/07/22 职场文书
为了顺利买到演唱会的票用Python制作了自动抢票的脚本
2021/10/16 Python
PHP正则表达式之RCEService回溯
2022/04/11 PHP
浅谈Redis缓冲区机制
2022/06/05 Redis