Python数据预处理之数据规范化(归一化)示例


Posted in Python onJanuary 08, 2019

本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下:

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有:

- 最小-最大规范化
- 零-均值规范化

数据示例

Python数据预处理之数据规范化(归一化)示例

代码实现

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
(data - data.min())/(data.max() - data.min()) #最小-最大规范化
(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(
          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

上述代码改为使用print语句打印,如下:

#-*- coding: utf-8 -*-
#数据规范化
import pandas as pd
import numpy as np
datafile = 'normalization_data.xls' #参数初始化
data = pd.read_excel(datafile, header = None) #读取数据
print((data - data.min())/(data.max() - data.min())) #最小-最大规范化
print((data - data.mean())/data.std()) #零-均值规范化

可输出如下打印结果:

          0         1         2         3
0  0.074380  0.937291  0.923520  1.000000
1  0.619835  0.000000  0.000000  0.850941
2  0.214876  0.119565  0.813322  0.000000
3  0.000000  1.000000  1.000000  0.563676
4  1.000000  0.942308  0.996711  0.804149
5  0.264463  0.838629  0.814967  0.909310
6  0.636364  0.846990  0.786184  0.929571
          0         1         2         3
0 -0.905383  0.635863  0.464531  0.798149
1  0.604678 -1.587675 -2.193167  0.369390
2 -0.516428 -1.304030  0.147406 -2.078279
3 -1.111301  0.784628  0.684625 -0.456906
4  1.657146  0.647765  0.675159  0.234796
5 -0.379150  0.401807  0.152139  0.537286
6  0.650438  0.421642  0.069308  0.595564

附:代码中使用到的normalization_data.xls点击此处本站下载

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python Web服务器Tornado使用小结
May 06 Python
Python列表list解析操作示例【整数操作、字符操作、矩阵操作】
Jul 25 Python
Django中url的反向查询的方法
Mar 14 Python
python 解压pkl文件的方法
Oct 25 Python
Python 中 function(#) (X)格式 和 (#)在Python3.*中的注意事项
Nov 30 Python
python面向对象法实现图书管理系统
Apr 19 Python
详解利用python+opencv识别图片中的圆形(霍夫变换)
Jul 01 Python
python数据库开发之MongoDB安装及Python3操作MongoDB数据库详细方法与实例
Mar 18 Python
python实现扫雷小游戏
Apr 24 Python
python上selenium的弹框操作实现
Jul 13 Python
使用Python解决图表与画布的间距问题
Apr 11 Python
python和anaconda的区别
May 06 Python
Python实现的拉格朗日插值法示例
Jan 08 #Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 #Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 #Python
Django之模型层多表操作的实现
Jan 08 #Python
对python mayavi三维绘图的实现详解
Jan 08 #Python
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法
Jan 08 #Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
Jan 08 #Python
You might like
社区(php&&mysql)二
2006/10/09 PHP
PHP调用.NET的WebService 简单实例
2015/03/27 PHP
PHP数组编码gbk与utf8互相转换的两种方法
2016/09/01 PHP
详解PHP swoole process的使用方法
2017/08/26 PHP
Avengerls vs Newbee BO3 第三场2.18
2021/03/10 DOTA
Angular中的Promise对象($q介绍)
2015/03/03 Javascript
JS设置网页图片vspace和hspace属性的方法
2015/04/01 Javascript
JavaScript实现将xml转换成html table表格的方法
2015/04/17 Javascript
详解JavaScript中shift()方法的使用
2015/06/09 Javascript
IE6兼容透明背景图片及解决方案
2015/08/19 Javascript
浅谈使用splice函数对数组中的元素进行删除时的注意事项
2016/12/04 Javascript
jquery mobile实现可折叠的导航按钮
2017/03/11 Javascript
vue引入jq插件的实例讲解
2017/09/12 Javascript
vue2.0在table中实现全选和反选的示例代码
2017/11/04 Javascript
jQuery实现简单的下拉菜单导航功能示例
2017/12/07 jQuery
angularJs 表格添加删除修改查询方法
2018/02/27 Javascript
Vue.js做select下拉列表的实例(ul-li标签仿select标签)
2018/03/02 Javascript
jQuery 实现扁平式小清新导航
2020/07/07 jQuery
为Python程序添加图形化界面的教程
2015/04/29 Python
windows下python连接oracle数据库
2017/06/07 Python
神经网络相关之基础概念的讲解
2018/12/29 Python
Python控制键盘鼠标pynput的详细用法
2019/01/28 Python
Python opencv实现人眼/人脸识别以及实时打码处理
2019/04/29 Python
python基于递归解决背包问题详解
2019/07/03 Python
CSS3 优势以及网页设计师如何使用CSS3技术
2009/07/29 HTML / CSS
使用HTML5的Notification API制作web通知的教程
2015/05/08 HTML / CSS
高清屏中使用Canvas绘图出现模糊的问题及解决方法
2019/06/03 HTML / CSS
美国主要的特色咖啡和茶公司:Peet’s Coffee
2020/02/14 全球购物
解释下列WebService名词:WSDL、SOAP、UDDI
2012/06/22 面试题
国贸专业个人求职信分享
2013/12/04 职场文书
《晏子使楚》教学反思
2014/02/08 职场文书
法定代表人授权委托书
2014/04/04 职场文书
家长会演讲稿
2014/04/26 职场文书
高校优秀辅导员事迹材料
2014/05/07 职场文书
放弃遗产继承公证书
2015/01/26 职场文书
2015年学校政教工作总结
2015/07/20 职场文书