Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python解析文件示例
Jan 23 Python
在Python中使用matplotlib模块绘制数据图的示例
May 04 Python
Python使用回溯法子集树模板获取最长公共子序列(LCS)的方法
Sep 08 Python
python异步存储数据详解
Mar 19 Python
Python 20行简单实现有道在线翻译的详解
May 15 Python
实例详解python函数的对象、函数嵌套、名称空间和作用域
May 31 Python
使用Python制作表情包实现换脸功能
Jul 19 Python
Pandas将列表(List)转换为数据框(Dataframe)
Apr 24 Python
Python读取Excel数据并生成图表过程解析
Jun 18 Python
Python 实现二叉查找树的示例代码
Dec 21 Python
python绕过图片滑动验证码实现爬取PTA所有题目功能 附源码
Jan 06 Python
python数字图像处理:图像简单滤波
Jun 28 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
php将数据库导出成excel的方法
2010/05/07 PHP
Javascript中Eval函数的使用说明
2008/10/11 Javascript
Mootools 1.2教程 类(一)
2009/09/15 Javascript
jQuery.Validate 使用笔记(jQuery Validation范例 )
2010/06/25 Javascript
JS判断不同分辨率调用不同的CSS样式文件实现思路及测试代码
2013/01/23 Javascript
jQuery 无刷新分页实例代码
2013/11/12 Javascript
chrome不支持form.submit的解决方案
2015/04/28 Javascript
Node.js中使用socket创建私聊和公聊聊天室
2015/11/19 Javascript
详解Backbone.js框架中的模型Model与其集合collection
2016/05/05 Javascript
JavaScript中解决多浏览器兼容性23个问题的快速解决方法
2016/05/19 Javascript
jQuery Mobile中的button按钮组件基础使用教程
2016/05/23 Javascript
全面了解js中的script标签
2016/07/04 Javascript
JS导出PDF插件的方法(支持中文、图片使用路径)
2016/07/12 Javascript
Vue数据驱动模拟实现3
2017/01/11 Javascript
jQuery实现下拉菜单的实例代码
2017/06/19 jQuery
vue 中动态绑定class 和 style的方法代码详解
2018/06/01 Javascript
JavaScript封闭函数及常用内置对象示例
2019/05/13 Javascript
vue实现评价星星功能
2020/06/30 Javascript
Python中的zipfile模块使用详解
2015/06/25 Python
用Python登录好友QQ空间点赞的示例代码
2017/11/04 Python
Python基于列表list实现的CRUD操作功能示例
2018/01/05 Python
详解python3中zipfile模块用法
2018/06/18 Python
解决PyCharm控制台输出乱码的问题
2019/01/16 Python
python处理excel绘制雷达图
2019/10/18 Python
python实现计算器功能
2019/10/31 Python
Html5页面在微信端的分享的实现方法
2018/08/30 HTML / CSS
详解使用HTML5 Canvas创建动态粒子网格动画
2016/12/14 HTML / CSS
Ellos丹麦:时尚和服装在线
2016/09/19 全球购物
美国儿童玩具、装扮和玩偶商店:Magic Cabin
2018/09/02 全球购物
俄罗斯茶和咖啡网上商店:Tea.ru
2021/01/26 全球购物
英智兴达软件测试笔试题
2016/10/12 面试题
工作保证书范文
2014/04/29 职场文书
保密工作承诺书
2014/08/29 职场文书
2014年餐厅服务员工作总结
2014/11/18 职场文书
论文答谢词
2015/01/20 职场文书
MySQL中使用or、in与union all在查询命令下的效率对比
2021/05/26 MySQL