pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
SublimeText 2编译python出错的解决方法(The system cannot find the file specified)
Nov 27 Python
Python程序员开发中常犯的10个错误
Jul 07 Python
Python查找相似单词的方法
Mar 05 Python
python daemon守护进程实现
Aug 27 Python
python numpy格式化打印的实例
May 14 Python
Python用5行代码写一个自定义简单二维码
Oct 21 Python
python修改txt文件中的某一项方法
Dec 29 Python
对python PLT中的image和skimage处理图片方法详解
Jan 10 Python
详解Anconda环境下载python包的教程(图形界面+命令行+pycharm安装)
Nov 11 Python
python系统指定文件的查找只输出目录下所有文件及文件夹
Jan 19 Python
Python爬虫获取豆瓣电影并写入excel
Jul 31 Python
python使用bs4爬取boss直聘静态页面
Oct 10 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
php下拉选项的批量操作的实现代码
2013/10/14 PHP
跟我学Laravel之快速入门
2014/10/15 PHP
php输出含有“#”字符串的方法
2017/01/18 PHP
js获取html页面节点方法(递归方式)
2013/12/13 Javascript
js判断当前浏览器类型,判断IE浏览器方法
2014/06/02 Javascript
javascript判断复选框是否选中的方法
2015/10/16 Javascript
如何解决ligerUI布局时Center中的Tab高度大小
2015/11/24 Javascript
javascript将list转换成树状结构的实例
2017/09/08 Javascript
Javascript网页抢红包外挂实现分享
2018/01/11 Javascript
vue 组件 全局注册和局部注册的实现
2018/02/28 Javascript
jQuery实现form表单序列化转换为json对象功能示例
2018/05/23 jQuery
ES6对象操作实例详解
2020/05/23 Javascript
[07:57]2018DOTA2国际邀请赛寻真——PSG.LGD凤凰浴火
2018/08/12 DOTA
[01:01:18]VP vs NIP 2019国际邀请赛小组赛 BO2 第二场 8.15
2019/08/17 DOTA
python2.7实现FTP文件下载功能
2018/04/15 Python
python合并已经存在的sheet数据到新sheet的方法
2018/12/11 Python
Django uwsgi Nginx 的生产环境部署详解
2019/02/02 Python
Python timeit模块的使用实践
2020/01/13 Python
TFRecord文件查看包含的所有Features代码
2020/02/17 Python
浅谈Pytorch torch.optim优化器个性化的使用
2020/02/20 Python
Django 删除upload_to文件的步骤
2020/03/30 Python
Django多层嵌套ManyToMany字段ORM操作详解
2020/05/19 Python
常用的四种CSS透明属性介绍
2014/04/12 HTML / CSS
CSS3打造百度贴吧的3D翻牌效果示例
2017/01/04 HTML / CSS
加拿大城市本地限时优惠:Buytopia.ca
2018/09/19 全球购物
Marlies Dekkers内衣美国官方网上商店:高端内衣品牌
2018/11/12 全球购物
暑期教师培训方案
2014/06/07 职场文书
公民授权委托书范本
2014/09/17 职场文书
致800米运动员广播稿(10篇)
2014/10/17 职场文书
四川省传达学习贯彻党的群众路线教育实践活动总结大会精神新闻稿
2014/10/26 职场文书
圆明园纪录片观后感
2015/06/03 职场文书
公司保洁员管理制度
2015/08/04 职场文书
小学三年级数学教学反思
2016/02/16 职场文书
简短的人生哲理(38句)
2019/08/13 职场文书
Nginx+Tomcat实现负载均衡、动静分离的原理解析
2021/03/31 Servers
详解TypeScript的基础类型
2022/02/18 Javascript