Python对多属性的重复数据去重实例


Posted in Python onApril 18, 2018

python中的pandas模块中对重复数据去重步骤:

1)利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行,没有重复行显示为FALSE,有重复行显示为TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

注释:

如果duplicated方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['state']),则指定部分列(state列)进行重复项的判断。

具体实例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单的通用表达式求10乘阶示例
Mar 03 Python
浅要分析Python程序与C程序的结合使用
Apr 07 Python
在Django的模型和公用函数中使用惰性翻译对象
Jul 27 Python
python脚本设置超时机制系统时间的方法
Feb 21 Python
Python多线程经典问题之乘客做公交车算法实例
Mar 22 Python
Python测试网络连通性示例【基于ping】
Aug 03 Python
Python使用装饰器模拟用户登陆验证功能示例
Aug 24 Python
pyqt5实现登录界面的模板
May 30 Python
django用户登录验证的完整示例代码
Jul 21 Python
python编写猜数字小游戏
Oct 06 Python
在python中实现求输出1-3+5-7+9-......101的和
Apr 02 Python
用python画城市轮播地图
May 28 Python
Python3实现的字典遍历操作详解
Apr 18 #Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 #Python
python 删除列表里所有空格项的方法总结
Apr 18 #Python
python list删除元素时要注意的坑点分享
Apr 18 #Python
python爬虫之xpath的基本使用详解
Apr 18 #Python
基于python list对象中嵌套元组使用sort时的排序方法
Apr 18 #Python
python购物车程序简单代码
Apr 18 #Python
You might like
杏林同学录(四)
2006/10/09 PHP
PHP 编程请选择正确的文本编辑软件
2006/12/21 PHP
用PHP获取Google AJAX Search API 数据的代码
2010/03/12 PHP
yii框架通过控制台命令创建定时任务示例
2014/04/30 PHP
php实现设计模式中的单例模式详解
2014/10/11 PHP
关于PHP中Session文件过多的问题及session文件保存位置
2016/03/17 PHP
PHP命名空间namespace的定义方法详解
2017/03/29 PHP
优化JavaScript脚本的性能的几个注意事项
2006/12/22 Javascript
javascript 读取XML数据,在页面中展现、编辑、保存的实现
2009/10/27 Javascript
jquery关于页面焦点的定位(文本框获取焦点时改变样式 )
2010/09/10 Javascript
基于jQuery实现表格数据的动态添加与统计的代码
2011/01/31 Javascript
js replace正则表达式应用案例讲解
2013/01/17 Javascript
jquery带动画效果幻灯片特效代码
2015/08/27 Javascript
javascript实现加载xml文件的方法
2015/11/24 Javascript
jQuery实现伪分页的方法分享
2016/02/17 Javascript
Extjs gridpanel 中的checkbox(复选框)根据某行的条件不能选中的解决方法
2017/02/17 Javascript
vue-resource调用promise取数据方式详解
2017/07/21 Javascript
详解vue静态资源打包中的坑与解决方案
2018/02/05 Javascript
vue组件之间通信方式实例总结【8种方式】
2019/02/22 Javascript
js模拟实现烟花特效
2020/03/10 Javascript
ant design vue datepicker日期选择器中文化操作
2020/10/28 Javascript
Python升级导致yum、pip报错的解决方法
2017/09/06 Python
Python编程给numpy矩阵添加一列方法示例
2017/12/04 Python
详解如何在Apache中运行Python WSGI应用
2019/01/02 Python
使用Python刷淘宝喵币(低阶入门版)
2019/10/30 Python
Python2与Python3的区别点整理
2019/12/12 Python
Python PyQt5模块实现窗口GUI界面代码实例
2020/05/12 Python
python支持多继承吗
2020/06/19 Python
Django --Xadmin 判断登录者身份实例
2020/07/03 Python
美国网上鞋城:Shoeline.com
2016/11/17 全球购物
台湾生鲜宅配:大口市集
2017/10/14 全球购物
工艺员岗位职责
2014/02/11 职场文书
建筑工程技术专业求职信
2014/07/16 职场文书
2015年网络管理员工作总结
2015/05/21 职场文书
龙猫观后感
2015/06/09 职场文书
解决Pytorch dataloader时报错每个tensor维度不一样的问题
2021/05/28 Python