详解python实现数据归一化处理的方式:(0,1)标准化


Posted in Python onJuly 17, 2019

在机器学习过程中,对数据的处理过程中,常常需要对数据进行归一化处理,下面介绍(0, 1)标准化的方式,简单的说,其功能就是将预处理的数据的数值范围按一定关系“压缩”到(0,1)的范围类。

通常(0, 1)标注化处理的公式为:

详解python实现数据归一化处理的方式:(0,1)标准化

即将样本点的数值减去最小值,再除以样本点数值最大与最小的差,原理公式就是这么基础。

下面看看使用python语言来编程实现吧

import numpy as np
import matplotlib.pyplot as plt


def noramlization(data):
  minVals = data.min(0)
  maxVals = data.max(0)
  ranges = maxVals - minVals
  normData = np.zeros(np.shape(data))
  m = data.shape[0]
  normData = data - np.tile(minVals, (m, 1))
  normData = normData/np.tile(ranges, (m, 1))
  return normData, ranges, minVals


x = np.array([[78434.0829, 26829.86612], [78960.4042, 26855.13451], [72997.8308, 26543.79201],
       [74160.2849, 26499.56629], [75908.5746, 26220.11996], [74880.6989, 26196.03995],
       [74604.7169, 27096.87862], [79547.6796, 25986.68579], [74997.7791, 24021.50132],
       [74487.4915, 26040.18441], [77134.2636, 24647.274],  [74975.2792, 24067.31441],
       [76013.5305, 24566.02273], [79191.518, 26840.29867], [80653.4589, 25937.22248],
       [79185.9935, 26996.18228], [74426.881, 24227.71439], [73246.4295, 26561.59268],
       [77963.1478, 25580.05298], [74469.8778, 26082.15448], [81372.3787, 26649.69232],
       [76826.8262, 24549.77367], [77774.2608, 25999.96037], [79673.1361, 25229.04353],
       [75251.7951, 24902.72185], [78458.073, 23924.15117], [82247.5439, 29671.33493],
       [82041.2247, 27903.34268], [80083.2029, 28692.35517], [80962.0043, 28519.81002],
       [79799.8328, 28740.27736], [80743.9947, 28862.75402], [80888.449, 29724.53706],
       [81768.4638, 30180.20618], [80283.8783, 30417.55057], [79460.7078, 29092.52867],
       [75514.1202, 28071.73721], [80595.5945, 30292.25917], [80750.4876, 29651.32254],
       [80020.662, 30023.70025], [82992.3395, 29466.83067], [80185.5946, 29943.15481],
       [81854.6163, 29846.18257], [81526.4017, 30218.27078], [79174.5312, 29960.69999],
       [78112.3051, 26467.57545], [80262.4121, 29340.23218], [81284.9734, 28257.71529],
       [81928.9905, 28752.84811], [80739.2727, 29288.85126], [83135.3435, 30223.4974],
       [83131.8223, 29049.10112], [82549.9076, 28910.15209], [81574.0822, 28326.55367],
       [80507.399, 28553.56851], [82956.2103, 29157.62372], [81909.7132, 29359.24497],
       [80893.5603, 29326.64155], [82520.1272, 30424.96703], [82829.8548, 31062.24418],
       [80532.1495, 29198.10407], [80112.7963, 29143.47905], [81175.0882, 28443.10574]])

newgroup, _, _ = noramlization(x)
newdata = newgroup
plt.scatter(x[:, 0], x[:, 1], marker='*', c='r', s=24)
plt.show()
print(len(x[:, 0]))
print(len(x[:, 1]))
print(newdata)

将数据进行归一化处理后,并使用matplotlib绘制出处理后的散点图分布如下:

详解python实现数据归一化处理的方式:(0,1)标准化

可以看到数据的数值范围均为(0,1)之间了

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中暂存上传图片的方法
Feb 18 Python
python结合shell查询google关键词排名的实现代码
Feb 27 Python
python 正确保留多位小数的实例
Jul 16 Python
python3 小数位的四舍五入(用两种方法解决round 遇5不进)
Apr 11 Python
Python数据类型之Number数字操作实例详解
May 08 Python
关于PyTorch 自动求导机制详解
Aug 18 Python
python函数声明和调用定义及原理详解
Dec 02 Python
py-charm延长试用期限实例
Dec 22 Python
python计算二维矩形IOU实例
Jan 18 Python
IntelliJ 中配置 Anaconda的过程图解
Jun 01 Python
python的链表基础知识点
Sep 13 Python
python实现录制全屏和选择区域录屏功能
Feb 05 Python
简单了解django索引的相关知识
Jul 17 #Python
python实现连连看辅助(图像识别)
Mar 25 #Python
Django中多种重定向方法使用详解
Jul 17 #Python
200行python代码实现2048游戏
Jul 17 #Python
Django后端接收嵌套Json数据及解析详解
Jul 17 #Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 #Python
python代码编写计算器小程序
Mar 30 #Python
You might like
NOD32 v2.70.32 简体中文封装版 提供下载了
2007/02/27 PHP
php中计算中文字符串长度、截取中文字符串的函数代码
2011/08/09 PHP
PHP中将网页导出为Word文档的代码
2012/05/25 PHP
Yii2超好用的日期和时间组件(值得收藏)
2016/05/05 PHP
Laravel利用gulp如何构建前端资源详解
2018/06/03 PHP
一个简单的javascript类定义例子
2009/09/12 Javascript
一个html5播放视频的video控件只支持android的默认格式mp4和3gp
2014/05/08 Javascript
JS常用函数使用指南
2014/11/23 Javascript
详解JavaScript函数对象
2015/11/15 Javascript
JavaScript编程中实现对象封装特性的实例讲解
2016/06/24 Javascript
xmlplus组件设计系列之下拉刷新(PullRefresh)(6)
2017/05/03 Javascript
CSS3+JavaScript实现翻页幻灯片效果
2017/06/28 Javascript
5分钟打造简易高效的webpack常用配置
2017/07/04 Javascript
AngularJS下$http服务Post方法传递json参数的实例
2018/03/29 Javascript
Nodejs调用Dll模块的方法
2018/09/17 NodeJs
解决vue axios的封装 请求状态的错误提示问题
2018/09/25 Javascript
vue 解除鼠标的监听事件的方法
2019/11/13 Javascript
在Mac OS上部署Nginx和FastCGI以及Flask框架的教程
2015/05/02 Python
Python写的一个简单监控系统
2015/06/19 Python
对python中的iter()函数与next()函数详解
2018/10/18 Python
利用django+wechat-python-sdk 创建微信服务器接入的方法
2019/02/20 Python
查看python安装路径及pip安装的包列表及路径
2019/04/03 Python
TensorFlow 输出checkpoint 中的变量名与变量值方式
2020/02/11 Python
python实现测试工具(二)——简单的ui测试工具
2020/10/19 Python
重构Python代码的六个实例
2020/11/25 Python
html5拖拽应用记录及注意点
2020/05/27 HTML / CSS
澳大利亚美容产品及化妆品在线:Activeskin
2020/06/03 全球购物
十一个高级MySql面试题
2014/10/06 面试题
文科生自我鉴定
2014/02/15 职场文书
简单的项目建议书模板
2014/03/12 职场文书
个人求职信范文
2014/05/24 职场文书
国际商务专业求职信
2014/07/15 职场文书
地方课程教学计划
2015/01/19 职场文书
党员倡议书
2015/01/19 职场文书
2015年科学教研组工作总结
2015/07/22 职场文书
python 单机五子棋对战游戏
2022/04/28 Python