pandas.DataFrame.drop_duplicates 用法介绍


Posted in Python onJuly 06, 2020

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据

keep 包含三个参数first, last, False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把两行数据都删除,而不是保留其中一行。默认参数是first。

补充知识:python3删除数据重复值,只保留第一项。drop_duplicates()函数使用介绍

原始数据如下:

pandas.DataFrame.drop_duplicates 用法介绍

f 列的前3个数据都有重复项,现在要将重复值删去,只保留第一项或最后一项。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值,参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#读取文件数据,并将列命名为abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

结果:

pandas.DataFrame.drop_duplicates 用法介绍

可以看到 f 列中的重复值都被删除,且保留了第一项

以上这篇pandas.DataFrame.drop_duplicates 用法介绍就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python学习手册中的python多态示例代码
Jan 21 Python
Python中字符串对齐方法介绍
May 21 Python
python面向对象多线程爬虫爬取搜狐页面的实例代码
May 31 Python
python 读取文件并替换字段的实例
Jul 12 Python
对Python中TKinter模块中的Label组件实例详解
Jun 14 Python
Django CBV与FBV原理及实例详解
Aug 12 Python
python tkinter控件布局项目实例
Nov 04 Python
Pytorch 实现计算分类器准确率(总分类及子分类)
Jan 18 Python
TensorFlow实现checkpoint文件转换为pb文件
Feb 10 Python
深度学习入门之Pytorch 数据增强的实现
Feb 26 Python
Python判断字符串是否为合法标示符操作
Sep 03 Python
python实现KNN近邻算法
Dec 30 Python
TensorFlow Autodiff自动微分详解
Jul 06 #Python
Keras loss函数剖析
Jul 06 #Python
keras 模型参数,模型保存,中间结果输出操作
Jul 06 #Python
Python自省及反射原理实例详解
Jul 06 #Python
如何通过命令行进入python
Jul 06 #Python
解决TensorFlow调用Keras库函数存在的问题
Jul 06 #Python
python else语句在循环中的运用详解
Jul 06 #Python
You might like
PHP使用适合阅读的格式显示文件大小的方法
2015/03/05 PHP
Yii2表单事件之Ajax提交实现方法
2017/05/04 PHP
js arguments.callee的应用代码
2009/05/07 Javascript
javaScript array(数组)使用字符串作为数组下标的方法
2013/11/19 Javascript
父页面显示遮罩层弹出半透明状态的dialog
2014/03/04 Javascript
struts2+jquery组合验证注册用户是否存在
2014/04/30 Javascript
JQuery页面地址处理插件jqURL详解
2015/05/03 Javascript
jQuery Easyui学习之datagrid 动态添加、移除editor
2016/01/27 Javascript
浅析Bootstrap组件之面板组件
2016/05/04 Javascript
jQuery实现的省市县三级联动菜单效果完整实例
2016/08/01 Javascript
AngularJs 常用的过滤器
2017/05/15 Javascript
移动端网页开发调试神器Eruda的介绍与使用技巧
2017/10/30 Javascript
详解webpack+express多页站点开发
2017/12/22 Javascript
Vue弹出菜单功能的实现代码
2018/09/12 Javascript
layui表格数据复选框回显设置方法
2019/09/13 Javascript
JS运算符优先级与表达式示例详解
2020/09/04 Javascript
[38:44]DOTA2上海特级锦标赛A组小组赛#2 Secret VS CDEC第二局
2016/02/25 DOTA
python处理文本文件实现生成指定格式文件的方法
2014/07/31 Python
mac下pycharm设置python版本的图文教程
2018/06/13 Python
python中sys.argv函数精简概括
2018/07/08 Python
Python使用装饰器模拟用户登陆验证功能示例
2018/08/24 Python
windows下安装Python虚拟环境virtualenvwrapper-win
2019/06/14 Python
Django REST framework 分页的实现代码
2019/06/19 Python
tensorflow从ckpt和从.pb文件读取变量的值方式
2020/05/26 Python
Python脚本如何在bilibili中查找弹幕发送者
2020/06/04 Python
Python代码执行时间测量模块timeit用法解析
2020/07/01 Python
keras 模型参数,模型保存,中间结果输出操作
2020/07/06 Python
如何基于python把文字图片写入word文档
2020/07/31 Python
广告传媒专业应届生求职信
2014/03/01 职场文书
战略合作意向书范本
2014/04/01 职场文书
2015年小学财务工作总结
2015/07/20 职场文书
Nginx中break与last的区别详析
2021/03/31 Servers
修改MySQL的数据库引擎为INNODB的方法
2021/05/26 MySQL
详解Laravel框架的依赖注入功能
2021/05/27 PHP
日元符号 ¥
2022/02/17 杂记
使用Python开发贪吃蛇游戏 SnakeGame
2022/04/30 Python