python实现几种归一化方法(Normalization Method)


Posted in Python onJuly 31, 2019

数据归一化问题是数据挖掘中特征向量表达时的重要问题,当不同的特征成列在一起的时候,由于特征本身表达方式的原因而导致在绝对数值上的小数据被大数据“吃掉”的情况,这个时候我们需要做的就是对抽取出来的features vector进行归一化处理,以保证每个特征被分类器平等对待。下面我描述几种常见的Normalization Method,并提供相应的python实现(其实很简单):

1、(0,1)标准化:

这是最简单也是最容易想到的方法,通过遍历feature vector里的每一个数据,将Max和Min的记录下来,并通过Max-Min作为基数(即Min=0,Max=1)进行数据的归一化处理:

python实现几种归一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{x-Min}{Max-Min}

Python实现:

def MaxMinNormalization(x,Max,Min):
	x = (x - Min) / (Max - Min);
	return x;

找大小的方法直接用np.max()和np.min()就行了,尽量不要用python内建的max()和min(),除非你喜欢用List管理数字。

2、Z-score标准化:

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,这里的关键在于复合标准正态分布,个人认为在一定程度上改变了特征的分布,关于使用经验上欢迎讨论,我对这种标准化不是非常地熟悉,转化函数为:

python实现几种归一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{x-\mu }{\sigma }

Python实现:

def Z_ScoreNormalization(x,mu,sigma):
	x = (x - mu) / sigma;
	return x;

这里一样,mu(即均值)用np.average(),sigma(即标准差)用np.std()即可。

3、Sigmoid函数

Sigmoid函数是一个具有S形曲线的函数,是良好的阈值函数,在(0, 0.5)处中心对称,在(0, 0.5)附近有比较大的斜率,而当数据趋向于正无穷和负无穷的时候,映射出来的值就会无限趋向于1和0,是个人非常喜欢的“归一化方法”,之所以打引号是因为我觉得Sigmoid函数在阈值分割上也有很不错的表现,根据公式的改变,就可以改变分割阈值,这里作为归一化方法,我们只考虑(0, 0.5)作为分割阈值的点的情况:

python实现几种归一化方法(Normalization Method)

python实现几种归一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{1}{1+{e}^{-x}}

Python实现:

def sigmoid(X,useStatus):
	if useStatus:
		return 1.0 / (1 + np.exp(-float(X)));
	else:
		return float(X);

这里useStatus管理是否使用sigmoid的状态,方便调试使用。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中关于字符串对象的一些基础知识
Apr 08 Python
收藏整理的一些Python常用方法和技巧
May 18 Python
python实现随机漫步算法
Aug 27 Python
Python第三方库face_recognition在windows上的安装过程
May 03 Python
python psutil模块使用方法解析
Aug 01 Python
Python实现图片识别加翻译功能
Dec 26 Python
python encrypt 实现AES加密的实例详解
Feb 20 Python
PyQt5高级界面控件之QTableWidget的具体使用方法
Feb 23 Python
解决Jupyter Notebook使用parser.parse_args出现错误问题
Apr 20 Python
python爬虫之爬取笔趣阁小说
Apr 22 Python
python 实现图与图之间的间距调整subplots_adjust
May 21 Python
python脚本框架webpy的url映射详解
Nov 20 Python
python Django编写接口并用Jmeter测试的方法
Jul 31 #Python
python实现windows倒计时锁屏功能
Jul 30 #Python
python创建属于自己的单词词库 便于背单词
Jul 30 #Python
python中append实例用法总结
Jul 30 #Python
简单了解django orm中介模型
Jul 30 #Python
Python爬虫学习之翻译小程序
Jul 30 #Python
安装docker-compose的两种最简方法
Jul 30 #Python
You might like
PHP实现字符串翻转功能的方法【递归与循环算法】
2017/11/03 PHP
laravel框架中视图的基本使用方法分析
2019/11/23 PHP
PHP数据源架构模式之表入口模式实例分析
2020/01/23 PHP
js定时器怎么写?就是在特定时间执行某段程序
2013/10/11 Javascript
AngularJS入门知识之MVW类框架的编程思想探讨
2014/12/08 Javascript
jQuery插件scroll实现无缝滚动效果
2015/04/27 Javascript
jquery插件jquery.nicescroll实现图片无滚动条左右拖拽的方法
2015/08/10 Javascript
javascript日期格式化方法小结
2015/12/17 Javascript
javascript断点调试心得分享
2016/04/23 Javascript
使用do...while的方法输入一个月中所有的周日(实例代码)
2016/07/22 Javascript
js css3实现图片拖拽效果
2017/03/04 Javascript
jQuery实现验证码功能
2017/03/17 Javascript
Js实现中国公民身份证号码有效性验证实例代码
2017/05/03 Javascript
JavaScript全屏和退出全屏事件总结(附代码)
2017/08/17 Javascript
轻松理解vue的双向数据绑定问题
2017/10/30 Javascript
使用jQuery给Table动态增加行、清空table的方法
2018/09/05 jQuery
ng-repeat指令在迭代对象时的去重方法
2018/10/02 Javascript
详解create-react-app 2.0版本如何启用装饰器语法
2018/10/23 Javascript
vue将单页面改造成多页面应用的方法
2018/11/25 Javascript
javascript实现自由编辑图片代码详解
2019/06/21 Javascript
微信小程序实现收货地址左滑删除
2020/11/18 Javascript
jQuery实现每日秒杀商品倒计时功能
2019/09/06 jQuery
JavaScript实现秒杀时钟倒计时
2019/09/29 Javascript
python操作MongoDB基础知识
2013/11/01 Python
python脚本设置超时机制系统时间的方法
2016/02/21 Python
使用Python读写及压缩和解压缩文件的示例
2016/07/08 Python
详细解读tornado协程(coroutine)原理
2018/01/15 Python
python 调用API接口 获取和解析 Json数据
2020/09/28 Python
意大利制造的男鞋和女鞋:SCAROSSO
2018/03/07 全球购物
Manuka Doctor英国官网:真正的麦卢卡蜂蜜和护肤品
2018/10/26 全球购物
以思科路由器为例你写下单臂路由的配置命令
2013/08/03 面试题
大学生毕业的自我评价分享
2014/01/02 职场文书
2014年企业党建工作总结
2014/12/18 职场文书
长江七号观后感
2015/06/11 职场文书
创业计划书详解
2019/07/19 职场文书
Pytorch中的学习率衰减及其用法详解
2021/06/05 Python