详解python实现数据归一化处理的方式:(0,1)标准化


Posted in Python onJuly 17, 2019

在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。

通常(0, 1)标注化处理的公式为:

详解python实现数据归一化处理的方式:(0,1)标准化

即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。

下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as plt


def noramlization(data):
  minVals = data.min(0)
  maxVals = data.max(0)
  ranges = maxVals - minVals
  normData = np.zeros(np.shape(data))
  m = data.shape[0]
  normData = data - np.tile(minVals, (m, 1))
  normData = normData/np.tile(ranges, (m, 1))
  return normData, ranges, minVals


x = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],
       [74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],
       [74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],
       [74487.4915, 26040.18441], [77134.2636, 24647.274],  [74975.2792, 24067.31441],
       [76013.5305, 24566.02273], [79191.518, 26840.29867], [80653.4589, 25937.22248],
       [79185.9935, 26996.18228], [74426.881, 24227.71439], [73246.4295, 26561.59268],
       [77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],
       [76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],
       [75251.7951, 24902.72185], [78458.073, 23924.15117], [82247.5439, 29671.33493],
       [82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],
       [79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449, 29724.53706],
       [81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],
       [75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],
       [80020.662, 30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],
       [81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],
       [78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],
       [81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],
       [83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],
       [80507.399, 28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],
       [80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],
       [80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])

newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

详解python实现数据归一化处理的方式:(0,1)标准化

可以看到数据的数值范围均为(0,1)之间了

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作摄像头截图实现远程监控的例子
Mar 25 Python
Fabric 应用案例
Aug 28 Python
Python解析excel文件存入sqlite数据库的方法
Nov 15 Python
Python实现并行抓取整站40万条房价数据(可更换抓取城市)
Dec 14 Python
pandas.dataframe按行索引表达式选取方法
Oct 30 Python
python分数表示方式和写法
Jun 26 Python
Python+Selenium使用Page Object实现页面自动化测试
Jul 14 Python
python3应用windows api对后台程序窗口及桌面截图并保存的方法
Aug 27 Python
python 矢量数据转栅格数据代码实例
Sep 30 Python
python实现LRU热点缓存及原理
Oct 29 Python
详解Python的三种拷贝方式
Feb 11 Python
python+pygame实现坦克大战小游戏的示例代码(可以自定义子弹速度)
Aug 11 Python
简单了解django索引的相关知识
Jul 17 #Python
python实现连连看辅助(图像识别)
Mar 25 #Python
Django中多种重定向方法使用详解
Jul 17 #Python
200行python代码实现2048游戏
Jul 17 #Python
Django后端接收嵌套Json数据及解析详解
Jul 17 #Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 #Python
python代码编写计算器小程序
Mar 30 #Python
You might like
php编写的抽奖程序中奖概率算法
2015/05/14 PHP
100多行PHP代码实现socks5代理服务器[2]
2016/05/05 PHP
jquery ui 1.7 ui.tabs 动态添加与关闭(按钮关闭+双击关闭)
2010/04/01 Javascript
JQuery UI DatePicker中z-index默认为1的解决办法
2010/09/28 Javascript
JQuery动态创建DOM、表单元素的实现代码
2011/08/09 Javascript
javascript中日期转换成时间戳的小例子
2013/03/21 Javascript
jQuery操作select下拉框的text值和value值的方法
2014/05/31 Javascript
nodejs导出excel的方法
2015/06/30 NodeJs
jQuery基于$.ajax设置移动端click超时处理方法
2016/05/14 Javascript
基于JS+Canves实现点击按钮水波纹效果
2016/09/15 Javascript
jquery组件WebUploader文件上传用法详解
2020/10/23 Javascript
JS按条件 serialize() 对应标签的使用方法
2017/07/24 Javascript
React-Native 组件之 Modal的使用详解
2017/08/08 Javascript
微信小程序云开发之数据库操作
2019/05/18 Javascript
基于node+websocket+html实现腾讯课堂聊天室聊天功能
2020/03/04 Javascript
[52:40]完美世界DOTA2联赛PWL S2 Magma vs GXR 第一场 11.29
2020/12/02 DOTA
python 排序算法总结及实例详解
2016/09/28 Python
Python 列表(List) 的三种遍历方法实例 详解
2017/04/15 Python
pytest中文文档之编写断言
2019/09/12 Python
Python使用gluon/mxnet模块实现的mnist手写数字识别功能完整示例
2019/12/18 Python
python 实现提取log文件中的关键句子,并进行统计分析
2019/12/24 Python
python+selenium+chrome批量文件下载并自动创建文件夹实例
2020/04/27 Python
基于HTML5 的人脸识别活体认证的实现方法
2016/06/22 HTML / CSS
HTML5适合的情人节礼物有纪念日期功能
2021/01/25 HTML / CSS
Bata印度官网:源自欧洲舒适鞋履品牌
2020/01/30 全球购物
几个Shell Script面试题
2012/08/31 面试题
电子商务专业自我鉴定
2013/12/18 职场文书
澳大利亚商务邀请函
2014/01/17 职场文书
六年级学生评语
2014/04/22 职场文书
学习张丽丽心得体会
2014/09/03 职场文书
大学生第一学年自我鉴定2015
2014/09/28 职场文书
交通局领导班子群众路线教育实践活动对照检查材料思想汇报
2014/10/09 职场文书
社区艾滋病宣传活动总结
2015/05/07 职场文书
幼儿园老师工作总结2015
2015/05/22 职场文书
入党介绍人意见范文
2015/06/01 职场文书
JavaScript前端面试扁平数据转tree与tree数据扁平化
2022/06/14 Javascript