Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现控制台输入密码的方法
May 29 Python
Python多线程结合队列下载百度音乐的方法
Jul 27 Python
浅谈Matplotlib简介和pyplot的简单使用——文本标注和箭头
Jan 09 Python
Python 类的特殊成员解析
Jun 20 Python
Python设计模式之代理模式实例详解
Jan 19 Python
Python 实现文件读写、坐标寻址、查找替换功能
Sep 11 Python
python set集合使用方法解析
Nov 05 Python
Jupyter打开图形界面并画出正弦函数图像实例
Apr 24 Python
Python使用sqlite3模块内置数据库
May 07 Python
python利用platform模块获取系统信息
Oct 09 Python
django 认证类配置实现
Nov 11 Python
解析python中的jsonpath 提取器
Jan 18 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
php文件上传的两种实现方法
2016/04/04 PHP
php自定义中文字符串截取函数substr_for_gb2312及substr_for_utf8示例
2016/05/28 PHP
PHP带节点操作的无限分类实现方法详解
2016/11/09 PHP
微信公众平台开发-微信服务器IP接口实例(含源码)
2017/03/05 PHP
LaravelS通过Swoole加速Laravel/Lumen详解
2018/03/02 PHP
js 覆盖和重载 函数
2009/09/25 Javascript
jquery移除button的inline onclick事件(已测试及兼容浏览器)
2013/01/25 Javascript
javascript实用小函数使用介绍
2013/11/11 Javascript
JavaScript闭包实例讲解
2014/04/22 Javascript
jQuery表格列宽可拖拽改变且兼容firfox
2014/09/03 Javascript
使用jQueryMobile实现滑动翻页效果的方法
2015/02/04 Javascript
jquery控制显示服务器生成的图片流
2015/08/04 Javascript
javascript基础知识分享之类与函数化
2016/02/13 Javascript
一步一步封装自己的HtmlHelper组件BootstrapHelper(二)
2016/09/14 Javascript
ros::spin() 和 ros::spinOnce()函数的区别及详解
2016/10/01 Javascript
vuex实现简易计数器
2016/10/27 Javascript
谈谈Vue.js——vue-resource全攻略
2017/01/16 Javascript
angularjs中使用ng-bind-html和ng-include的实例
2017/04/28 Javascript
JavaScript-定时器0~9抽奖系统详解(代码)
2017/08/16 Javascript
Node.js 使用jade模板引擎的示例
2018/05/11 Javascript
详解js 创建对象的几种方法
2019/03/08 Javascript
Python使用Flask框架同时上传多个文件的方法
2015/03/21 Python
Python的Django框架中URLconf相关的一些技巧整理
2015/07/18 Python
Python中一行和多行import模块问题
2018/04/01 Python
Pandas标记删除重复记录的方法
2018/04/08 Python
sublime python3 输入换行不结束的方法
2018/04/19 Python
在python中实现强制关闭线程的示例
2019/01/22 Python
CSS3实现复选框动画特效示例代码
2016/09/27 HTML / CSS
HTML5实现应用程序缓存(Application Cache)
2020/06/16 HTML / CSS
美国生鲜及杂货电商:FreshDirect
2018/01/29 全球购物
荷兰浴室和卫浴网上商店:Badkamerxxl.nl
2020/10/06 全球购物
软件测试企业面试试卷
2016/07/13 面试题
新闻发布会主持词
2014/03/28 职场文书
事假请假条范文
2014/04/11 职场文书
质检员工作总结2015
2015/04/25 职场文书
十大最强火系宝可梦,喷火龙上榜,第一名有双火属性
2022/03/18 日漫