pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python清除字符串里非字母字符的方法
Jul 02 Python
Django小白教程之Django用户注册与登录
Apr 22 Python
利用numpy+matplotlib绘图的基本操作教程
May 03 Python
基于python socketserver框架全面解析
Sep 21 Python
python获取文件路径、文件名、后缀名的实例
Apr 23 Python
Python基于多线程实现ping扫描功能示例
Jul 23 Python
python自定义线程池控制线程数量的示例
Feb 22 Python
Python Pandas 获取列匹配特定值的行的索引问题
Jul 01 Python
python opencv捕获摄像头并显示内容的实现
Jul 11 Python
Python 函数用法简单示例【定义、参数、返回值、函数嵌套】
Sep 20 Python
django项目中使用云片网发送短信验证码的实现
Jan 19 Python
高考要来啦!用Python爬取历年高考数据并分析
Jun 03 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
Thinkphp模板中使用自定义函数的方法
2012/09/23 PHP
PHP之生成GIF动画的实现方法
2013/06/07 PHP
php 数组随机取值的简单实例
2016/05/23 PHP
php实现异步将远程链接上内容(图片或内容)写到本地的方法
2016/11/30 PHP
php中get_magic_quotes_gpc()函数说明
2017/02/06 PHP
php支付宝系列之电脑网站支付
2018/05/30 PHP
javascript demo 基本技巧
2009/12/18 Javascript
JS弹出对话框返回值代码(asp.net后台)
2010/12/28 Javascript
jquery validate 自定义验证方法介绍 日期验证
2014/02/27 Javascript
javascript函数声明和函数表达式区别分析
2014/12/02 Javascript
在Node.js应用中使用Redis的方法简介
2015/06/24 Javascript
浅谈使用MVC模式进行JavaScript程序开发
2015/11/10 Javascript
Javascript随机标签云代码实例
2016/06/21 Javascript
JQuery控制DIV的选取实现方法
2016/09/18 Javascript
js获取当前页的URL与window.location.href简单方法
2017/02/13 Javascript
jQuery上传多张图片带进度条样式(DEMO)
2017/03/02 Javascript
JavaScript动态绑定详解
2017/09/14 Javascript
jQuery实现滚动到底部时自动加载更多的方法示例
2018/02/18 jQuery
vue实现键盘输入支付密码功能
2018/08/18 Javascript
Python实现生成简单的Makefile文件代码示例
2015/03/10 Python
python以环状形式组合排列图片并输出的方法
2015/03/17 Python
解决Python 爬虫URL中存在中文或特殊符号无法请求的问题
2018/05/11 Python
python 读取目录下csv文件并绘制曲线v111的方法
2018/07/06 Python
python对html过滤处理的方法
2018/10/21 Python
pandas的排序和排名的具体使用
2019/07/31 Python
python图像处理模块Pillow的学习详解
2019/10/09 Python
英语专业毕业生自我鉴定
2013/11/09 职场文书
教师一岗双责责任书
2014/04/16 职场文书
卫生系统先进事迹
2014/05/13 职场文书
新教师岗前培训方案
2014/06/05 职场文书
药剂专业自荐书
2014/06/20 职场文书
2015年学校教研室主任工作总结
2015/07/20 职场文书
《惊弓之鸟》教学反思
2016/02/20 职场文书
基于Redis位图实现用户签到功能
2021/05/08 Redis
Django实现翻页的示例代码
2021/05/24 Python
python编程项目中线上问题排查与解决
2021/11/01 Python