Python Pandas 如何shuffle(打乱)数据


Posted in Python onJuly 30, 2019

在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。

应用情景:

我们有下面以个DataFrame

Python Pandas 如何shuffle(打乱)数据

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:

Python Pandas 如何shuffle(打乱)数据

实现方法:

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3。

有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实,sklearn(机器学习的库)中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外,numpy库中也有进行shuffle的方法(不建议)

df.iloc[np.random.permutation(len(df))]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python登录QQ邮箱发信的实现代码
Feb 10 Python
python列出目录下指定文件与子目录的方法
Jul 03 Python
Python处理文本文件中控制字符的方法
Feb 07 Python
Python获取SQLite查询结果表列名的方法
Jun 21 Python
Python爬虫常用库的安装及其环境配置
Sep 19 Python
python使用zip将list转为json的方法
Dec 31 Python
Python字符串逆序输出的实例讲解
Feb 16 Python
python机器学习实现决策树
Nov 11 Python
解决pycharm中的run和debug失效无法点击运行
Jun 09 Python
Python基于Socket实现简易多人聊天室的示例代码
Nov 29 Python
python使用scapy模块实现ping扫描的过程详解
Jan 21 Python
请求模块urllib之PYTHON爬虫的基本使用
Apr 08 Python
python tkinter实现屏保程序
Jul 30 #Python
python pandas 时间日期的处理实现
Jul 30 #Python
Django 反向生成url实例详解
Jul 30 #Python
Python Pandas数据中对时间的操作
Jul 30 #Python
python tkinter实现彩球碰撞屏保
Jul 30 #Python
详解python pandas 分组统计的方法
Jul 30 #Python
python文档字符串(函数使用说明)使用详解
Jul 30 #Python
You might like
phpmyadmin MySQL 加密配置方法
2009/07/05 PHP
DISCUZ在win2003环境下 Unable to access ./include/common.inc.php in... 的问题终极解决方案
2011/11/21 PHP
php去除二维数组的重复项方法
2015/11/03 PHP
Laravel手动分页实现方法详解
2016/10/09 PHP
php一个文件搞定微信jssdk配置
2016/12/12 PHP
php图片合成方法(多张图片合成一张)
2017/11/25 PHP
PHP微商城开源代码实例
2019/03/27 PHP
Laravel路由研究之domain解决多域名问题的方法示例
2019/04/04 PHP
PHP单元测试配置与使用方法详解
2019/12/27 PHP
扩展String功能方法
2006/09/22 Javascript
JavaScript入门之基本函数详解
2011/10/21 Javascript
Vuejs第十三篇之组件——杂项
2016/09/09 Javascript
微信小程序内拖动图片实现移动、放大、旋转的方法
2018/09/04 Javascript
vue实现前台列表数据过滤搜索、分页效果
2019/05/28 Javascript
AngularJS动态生成select下拉框的方法实例
2019/11/17 Javascript
JavaScript实现筛选数组
2021/03/02 Javascript
[01:07:22]2014 DOTA2华西杯精英邀请赛 5 24 DK VS VG加赛
2014/05/26 DOTA
Python实现识别手写数字 简易图片存储管理系统
2018/01/29 Python
详解Python匿名函数(lambda函数)
2019/04/19 Python
python中下标和切片的使用方法解析
2019/08/27 Python
python装饰器三种装饰模式的简单分析
2020/09/04 Python
python两种注释用法的示例
2020/10/09 Python
浅析pandas随机排列与随机抽样
2021/01/22 Python
HTML5 Canvas鼠标与键盘事件demo示例
2013/07/04 HTML / CSS
英国屋顶用品和材料超市:Roofing Supplies UK
2019/08/24 全球购物
Solaris操作系统的线程机制
2015/07/28 面试题
光电信息专业应届生求职信
2013/10/07 职场文书
语文教育专业推荐信范文
2013/11/25 职场文书
高中军训感想800字
2014/02/23 职场文书
团日活动总结怎么写
2014/06/25 职场文书
物流仓管员岗位职责
2015/04/01 职场文书
2015年勤工助学工作总结
2015/04/29 职场文书
2015年幼师个人工作总结
2015/10/15 职场文书
2019年恭贺升学祝福语集锦
2019/08/15 职场文书
pygame面向对象的飞行小鸟实现(Flappy bird)
2021/04/01 Python
无线电通信名词解释
2022/02/18 无线电