pandas DataFrame 删除重复的行的实现方法


Posted in Python onJanuary 29, 2019

1. 建立一个DataFrame

C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})

pandas DataFrame 删除重复的行的实现方法

2. 判断是否有重复项

用duplicated( )函数判断  

C.duplicated()

pandas DataFrame 删除重复的行的实现方法

3.  有重复项,则可以用drop_duplicates()移除重复项

C.drop_duplicates()

pandas DataFrame 删除重复的行的实现方法

4. Duplicated( )和drop_duplicates( )方法是以默认的方式判断全部的列(上面的例子中是看两个变量a和b是否都是重复出现)。

我们也可以对特定的列进行重复项判断。

C.duplicated(['a'])   C.drop_duplicates(['a'])

 C.duplicated(['b'])   C.drop_duplicates(['b'])

pandas DataFrame 删除重复的行的实现方法

5.  norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')

#上面的命令去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行

补充: 

  • 当keep=False时,就是去掉所有的重复行 
  • 当keep=‘first'时,就是保留第一次出现的重复行 
  • 当keep='last'时就是保留最后一次出现的重复行。 

(注意,这里的参数是字符串,要加引号!!!)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python元组操作实例解析
Sep 23 Python
Python实现代码统计工具(终极篇)
Jul 04 Python
django使用图片延时加载引起后台404错误
Apr 18 Python
python+selenium开发环境搭建图文教程
Aug 11 Python
解决pandas无法在pycharm中使用plot()方法显示图像的问题
May 24 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
python2 与 python3 实现共存的方法
Jul 12 Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 Python
python并发编程多进程 模拟抢票实现过程
Aug 20 Python
Django将默认的SQLite更换为MySQL的实现
Nov 18 Python
Python3 Tensorlfow:增加或者减小矩阵维度的实现
May 22 Python
Python3.7安装PyQt5 运行配置Pycharm的详细教程
Oct 15 Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
在Pandas中DataFrame数据合并,连接(concat,merge,join)的实例
Jan 29 #Python
对python numpy.array插入一行或一列的方法详解
Jan 29 #Python
对python中list的拷贝与numpy的array的拷贝详解
Jan 29 #Python
10 分钟快速入门 Python3的教程
Jan 29 #Python
解决python2 绘图title,xlabel,ylabel出现中文乱码的问题
Jan 29 #Python
You might like
十天学会php(2)
2006/10/09 PHP
php echo 输出字符串函数详解
2010/05/13 PHP
php中json_encode中文编码问题分析
2011/09/13 PHP
PHP实现格式化文件数据大小显示的方法
2015/01/03 PHP
php将服务端的文件读出来显示在web页面实例
2016/10/31 PHP
laravel5实现微信第三方登录功能
2018/12/06 PHP
如何在PHP中生成随机数
2020/06/04 PHP
返回顶部按钮响应滚动且动态显示与隐藏
2014/10/14 Javascript
js无法获取到html标签的属性的解决方法
2016/07/26 Javascript
详解JavaScript时间处理之几个月前或几个月后的指定日期
2016/12/21 Javascript
JavaScript常用正则验证函数实例小结【年龄,数字,Email,手机,URL,日期等】
2017/01/23 Javascript
JavaScript中的工厂函数(推荐)
2017/03/08 Javascript
利用Javascript开发一个二维周视图日历
2017/12/14 Javascript
在vue中安装使用vux的教程详解
2018/09/16 Javascript
vue-router的使用方法及含参数的配置方法
2018/11/13 Javascript
Nuxt.js之自动路由原理的实现方法
2018/11/21 Javascript
Cocos2d实现刮刮卡效果
2018/12/20 Javascript
JavaScript刷新页面的几种方法总结
2019/03/28 Javascript
微信小程序封装自定义弹窗的实现代码
2019/05/08 Javascript
[36:20]完美世界DOTA2联赛PWL S3 access vs Rebirth 第一场 12.17
2020/12/18 DOTA
用Python脚本生成Android SALT扰码的方法
2013/09/18 Python
Python获取Redis所有Key以及内容的方法
2019/02/19 Python
jupyter notebook 调用环境中的Keras或者pytorch教程
2020/04/14 Python
python爬虫容易学吗
2020/06/02 Python
python里的单引号和双引号的有什么作用
2020/06/17 Python
德国家具在线:Fashion For Home
2017/03/11 全球购物
TripAdvisor德国:全球领先的旅游网站
2017/12/07 全球购物
main 函数执行以前,还会执行什么代码
2013/04/17 面试题
办公室副主任岗位职责
2013/11/25 职场文书
学校安全生产承诺书
2014/05/23 职场文书
国庆节活动总结
2014/08/26 职场文书
医院领导班子四风问题对照检查材料
2014/10/26 职场文书
医院员工辞职信范文
2015/05/12 职场文书
小平小道观后感
2015/06/09 职场文书
为自己工作观后感
2015/06/11 职场文书
优秀员工演讲稿
2019/06/21 职场文书