Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用设计模式中的责任链模式与迭代器模式的示例
Mar 02 Python
深入理解python中的select模块
Apr 23 Python
Python多线程爬虫实战_爬取糗事百科段子的实例
Dec 15 Python
Python基于辗转相除法求解最大公约数的方法示例
Apr 04 Python
Python简单计算文件MD5值的方法示例
Apr 11 Python
Anaconda2下实现Python2.7和Python3.5的共存方法
Jun 11 Python
Python 编程速成(推荐)
Apr 15 Python
Python+Selenium使用Page Object实现页面自动化测试
Jul 14 Python
Django数据库操作之save与update的使用
Apr 01 Python
python 抓取知乎指定回答下视频的方法
Jul 09 Python
python基于tkinter制作无损音乐下载工具
Mar 29 Python
再谈python_tkinter弹出对话框创建
Mar 20 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
ThinkPHP的cookie和session冲突造成Cookie不能使用的解决方法
2014/07/01 PHP
PHP5.3与5.5废弃与过期函数整理汇总
2014/07/10 PHP
PHP-FPM之Chroot执行环境详解
2015/08/03 PHP
YII框架批量插入数据的方法
2017/03/18 PHP
对php 判断http还是https,以及获得当前url的方法详解
2019/01/15 PHP
js实现网站首页图片滚动显示
2013/02/04 Javascript
js中apply方法的使用详细解析
2013/11/04 Javascript
EasyUI在表单提交之前进行验证的实例代码
2016/06/24 Javascript
详解js的延迟对象、跨域、模板引擎、弹出层、AJAX【附实例下载】
2016/12/19 Javascript
nodejs获取微信小程序带参数二维码实现代码
2017/04/12 NodeJs
AngularJS 验证码60秒倒计时功能的实现
2017/06/05 Javascript
自定义类似于jQuery UI Selectable 的Vue指令v-selectable
2017/08/23 jQuery
react-native fetch的具体使用方法
2017/11/01 Javascript
jquery 给动态生成的标签绑定事件的几种方法总结
2018/02/24 jQuery
利用Dectorator分模块存储Vuex状态的实现
2019/02/05 Javascript
Flutter实现仿微信底部菜单栏功能
2019/09/18 Javascript
Vue项目环境搭建详细总结
2019/09/26 Javascript
element实现合并单元格通用方法
2019/11/13 Javascript
浅析Vue 中的 render 函数
2020/02/28 Javascript
Python处理JSON时的值报错及编码报错的两则解决实录
2016/06/26 Python
Python方法的延迟加载的示例代码
2017/12/18 Python
pandas 获取季度,月度,年度首尾日期的方法
2018/04/11 Python
ubuntu16.04制作vim和python3的开发环境
2018/09/23 Python
详解python tkinter教程-事件绑定
2019/03/28 Python
美国专注于健康商品的网站:eVitamins
2017/01/23 全球购物
酷瑞网络科技面试题
2012/03/30 面试题
史上最全面的Java面试题汇总!
2015/02/03 面试题
应届毕业生自我评价分享
2013/12/15 职场文书
协议书格式
2014/04/23 职场文书
综合素质自我评价怎么写
2014/09/14 职场文书
北京天坛导游词
2015/02/12 职场文书
幼儿园重阳节活动总结
2015/05/05 职场文书
学前教育见习总结
2015/06/23 职场文书
消防安全主题班会
2015/08/12 职场文书
springboot中一些比较常用的注解总结
2021/06/11 Java/Android
Vue.js中v-for指令的用法介绍
2022/03/13 Vue.js