python pandas dataframe 去重函数的具体使用


Posted in Python onJuly 20, 2020

今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数

先看一个小例子

from pandas import Series, DataFrame
 
data = DataFrame({'k': [1, 1, 2, 2]})
 
print data
 
IsDuplicated = data.duplicated()
 
print IsDuplicated
print type(IsDuplicated)
 
data = data.drop_duplicates()
print data

执行结果是:

   k
0  1
1  1
2  2
3  2

0    False
1     True
2    False
3     True

   k
0  1
2  2

DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。

而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame

这两个方法会判断全部列,你也可以指定部分列进行重复项判段。

drop_duplicates根据数据的不同情况及处理数据的不同需求,通常会分为两种情况,一种是去除完全重复的行数据,另一种是去除某几列重复的行数据,就这两种情况可用下面的代码进行处理。

1. 去除完全重复的行数据

data.drop_duplicates(inplace=True)

2. 去除某几列重复的行数据

data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
  • subset: 列名,可选,默认为None
    • keep: {‘first', ‘last', False}, 默认值 ‘first'
    • first: 保留第一次出现的重复行,删除后面的重复行。
    • last: 删除重复项,除了最后一次出现。
  • False: 删除所有重复项。
  • inplace:布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

例如,希望对名字为k2的列进行去重,

data.drop_duplicates(['k2'])

到此这篇关于python pandas dataframe 去重函数的具体使用的文章就介绍到这了,更多相关python pandas dataframe 去重函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 元类使用说明
Dec 18 Python
python操作CouchDB的方法
Oct 08 Python
Python2和Python3中print的用法示例总结
Oct 25 Python
python实现简单flappy bird
Dec 24 Python
超简单使用Python换脸实例
Mar 27 Python
Python常见读写文件操作实例总结【文本、json、csv、pdf等】
Apr 15 Python
Python3多目标赋值及共享引用注意事项
May 27 Python
Python获取数据库数据并保存在excel表格中的方法
Jun 12 Python
tensorflow 实现数据类型转换
Feb 17 Python
没编程基础可以学python吗
Jun 17 Python
Python 如何查找特定类型文件
Aug 17 Python
python中pycryto实现数据加密
Apr 29 Python
Pandas中DataFrame基本函数整理(小结)
Jul 20 #Python
Python实现删除某列中含有空值的行的示例代码
Jul 20 #Python
解决python运行效率不高的问题
Jul 20 #Python
Python生成器generator原理及用法解析
Jul 20 #Python
Win10环境中如何实现python2和python3并存
Jul 20 #Python
python和go语言的区别是什么
Jul 20 #Python
Python基础教程(一)——Windows搭建开发Python开发环境
Jul 20 #Python
You might like
基于initPHP的框架介绍
2013/04/18 PHP
javawscript 三级菜单的实现原理
2009/07/01 Javascript
子窗口、父窗口和Silverlight之间的相互调用
2010/08/16 Javascript
javascript中使用正则计算中文长度的例子
2014/04/29 Javascript
js实现iframe自动自适应高度的方法
2015/02/17 Javascript
jQuery实现的背景动态变化导航菜单效果
2015/08/24 Javascript
js弹出框、对话框、提示框、弹窗实现方法总结(推荐)
2016/05/31 Javascript
学习JavaScript图片预加载模块
2016/11/07 Javascript
简单的JS控制button颜色随点击更改的实现方法
2017/04/17 Javascript
vue之父子组件间通信实例讲解(props、$ref、$emit)
2018/05/22 Javascript
详解用场景去理解函数柯里化(入门篇)
2019/04/11 Javascript
vue实现购物车的监听
2020/04/20 Javascript
JavaScript进阶(二)词法作用域与作用域链实例分析
2020/05/09 Javascript
使用js原生实现年份轮播选择效果实例
2021/01/12 Javascript
[04:17]DOTA2完美盛典,rOtk、BurNIng携手巴图演唱《倔强》
2017/11/28 DOTA
[33:23]VG vs Pain 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python 返回汉字的汉语拼音
2009/02/27 Python
Python中的测试模块unittest和doctest的使用教程
2015/04/14 Python
使用Python读写及压缩和解压缩文件的示例
2016/07/08 Python
详解Python中where()函数的用法
2018/03/27 Python
详解Numpy中的广播原则/机制
2018/09/20 Python
解决python中遇到字典里key值为None的情况,取不出来的问题
2018/10/17 Python
Python 共享变量加锁、释放详解
2019/08/28 Python
pyinstaller打包成无控制台程序时运行出错(与popen冲突的解决方法)
2020/04/15 Python
前端制作动画的几种方式(css3,js)
2016/12/12 HTML / CSS
汤米巴哈马官方网站:Tommy Bahama
2017/05/13 全球购物
印尼旅游网站:via
2017/11/12 全球购物
一道SQL存储过程面试题
2016/10/07 面试题
总经理职责
2013/12/22 职场文书
食品安全检查制度
2014/02/03 职场文书
乡镇遵守党的政治纪律情况对照检查材料
2014/09/26 职场文书
开展批评与自我批评发言稿
2014/10/16 职场文书
机械原理课程设计心得体会
2016/01/15 职场文书
2019大学生暑期实习心得总结
2019/08/21 职场文书
详解Python中的进程和线程
2021/06/23 Python
TV动画《间谍过家家》公开PV
2022/03/20 日漫