pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中while循环语句用法简单实例
May 07 Python
详解Python中time()方法的使用的教程
May 22 Python
Python正确重载运算符的方法示例详解
Aug 27 Python
基于Python实现的微信好友数据分析
Feb 26 Python
Python3 导入上级目录中的模块实例
Feb 16 Python
python爬取微信公众号文章的方法
Feb 26 Python
python实现对服务器脚本敏感信息的加密解密功能
Aug 13 Python
使用遗传算法求二元函数的最小值
Feb 11 Python
Python dict和defaultdict使用实例解析
Mar 12 Python
python用tkinter实现一个简易能进行随机点名的界面
Sep 27 Python
Python下使用Trackbar实现绘图板
Oct 27 Python
4种方法python批量修改替换列表中元素
Apr 07 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
Zend studio for eclipse中使php可以调用mysql相关函数的设置方法
2008/10/13 PHP
php SQL Injection with MySQL
2011/02/27 PHP
PHP扩展CURL的用法详解
2014/06/20 PHP
javascript去除字符串左右两端的空格
2015/02/05 Javascript
Javascript中使用parseInt函数需要注意的问题
2015/04/02 Javascript
JS实现统计复选框选中个数并提示确定与取消的方法
2015/07/01 Javascript
JS获取数组最大值、最小值及长度的方法
2015/11/24 Javascript
javascript从定义到执行 你不知道的那些事
2016/01/04 Javascript
jQuery插件fullPage.js实现全屏滚动效果
2016/12/02 Javascript
Angular动态绑定样式及改变UI框架样式的方法小结
2018/09/03 Javascript
node.js中 mysql 增删改查操作及async,await处理实例分析
2020/02/11 Javascript
js实现抽奖的两种方法
2020/03/19 Javascript
谈谈node.js中的模块系统
2020/09/01 Javascript
返回上一个url并刷新界面的js代码
2020/09/12 Javascript
[01:53]DOTA2超级联赛专访Zhou 五年职业青春成长
2013/05/29 DOTA
python腾讯语音合成实现过程解析
2019/08/01 Python
Python 实现自动导入缺失的库
2019/10/29 Python
Django自定义用户表+自定义admin后台中的字段实例
2019/11/18 Python
关于初始种子自动选取的区域生长实例(python+opencv)
2020/01/16 Python
python实现密度聚类(模板代码+sklearn代码)
2020/04/27 Python
Python爬取微信小程序通用方法代码实例详解
2020/09/29 Python
pandas map(),apply(),applymap()区别解析
2021/02/24 Python
HTML5+CSS3实现无插件拖拽上传图片(支持预览与批量)
2017/01/05 HTML / CSS
全球最大的户外用品零售商之一:The House
2018/06/12 全球购物
香港最大的洋酒零售连锁店:屈臣氏酒窖(Watson’s Wine)
2018/12/10 全球购物
美国便宜的横幅和标志印刷在线:Best of Signs
2019/05/29 全球购物
行政人事专员岗位职责
2014/03/05 职场文书
3分钟英语演讲稿
2014/04/29 职场文书
个人作风建设自查报告
2014/10/22 职场文书
大连星海广场导游词
2015/02/10 职场文书
2016年大学生社会实践心得体会
2015/10/09 职场文书
jQuery实现广告显示和隐藏动画
2021/07/04 jQuery
Python编程根据字典列表相同键的值进行合并
2021/10/05 Python
mysql数据插入覆盖和时间戳的问题及解决
2022/03/25 MySQL
Golang数据类型和相互转换
2022/04/12 Golang
Java时间工具类Date的常用处理方法
2022/05/25 Java/Android