Pandas 同元素多列去重的实例


Posted in Python onJuly 03, 2018

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:

G1 G2
a b
b a
c d
d c
e f

对这样的两列数据进行同元素去重,最终得到结果为:

G1 G2
a b
c d
e f

代码如下:

#-*- coding: utf-8 -*-
data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}
data = pd.DataFrame(data)
data['G3'] = data['G1'] + '|' + data['G2']
p = []
for i in data['G3'].tolist():
  tmp = sorted(i.split('|')) # The most important part,sort 
  p.append(tmp[0] + '|' + tmp[1])
data['G3'] = pd.Series(p)
data = data.drop_duplicates('G3')

以上这篇Pandas 同元素多列去重的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
利用QT写一个极简单的图形化Python闹钟程序
Apr 07 Python
Python制作爬虫抓取美女图
Jan 20 Python
Python的网络编程库Gevent的安装及使用技巧
Jun 24 Python
python实现最长公共子序列
May 22 Python
Python 访问限制 private public的详细介绍
Oct 16 Python
Django2.1集成xadmin管理后台所遇到的错误集锦(填坑)
Dec 20 Python
python实时获取外部程序输出结果的方法
Jan 12 Python
通过实例学习Python Excel操作
Jan 06 Python
python读取ini配置的类封装代码实例
Jan 08 Python
TensorFlow2.1.0安装过程中setuptools、wrapt等相关错误指南
Apr 08 Python
Python中免验证跳转到内容页的实例代码
Oct 23 Python
python 实现网易邮箱邮件阅读和删除的辅助小脚本
Mar 01 Python
Python中Numpy包的安装与使用方法简明教程
Jul 03 #Python
Python单元测试简单示例
Jul 03 #Python
Python3使用pandas模块读写excel操作示例
Jul 03 #Python
Python+pandas计算数据相关系数的实例
Jul 03 #Python
在dataframe两列日期相减并且得到具体的月数实例
Jul 03 #Python
python设置值及NaN值处理方法
Jul 03 #Python
数据清洗--DataFrame中的空值处理方法
Jul 03 #Python
You might like
PHP把数字转成人民币大写的函数分享
2014/06/30 PHP
php使用gd2绘制基本图形示例(直线、圆、正方形)
2017/02/15 PHP
PHP实现负载均衡下的session共用功能
2018/04/17 PHP
PHP的mysqli_select_db()函数讲解
2019/01/23 PHP
Jquery 获得服务器控件值的方法小结
2010/05/11 Javascript
jquery 圆形旋转图片滚动切换效果
2011/01/19 Javascript
js仿土豆网带缩略图的焦点图片切换效果实现方法
2015/02/23 Javascript
关于JS中prototype的理解
2015/09/07 Javascript
安装使用Mongoose配合Node.js操作MongoDB的基础教程
2016/03/01 Javascript
图文详解Heap Sort堆排序算法及JavaScript的代码实现
2016/05/04 Javascript
使用jquery获取url以及jquery获取url参数的实现方法
2016/05/25 Javascript
AngularJS过滤器filter用法实例分析
2016/11/04 Javascript
js实现微信/QQ直接跳转到支付宝APP打开口令领红包功能
2018/01/09 Javascript
VueAwesomeSwiper在VUE中的使用以及遇到的一些问题
2018/01/11 Javascript
Vue ElementUi同时校验多个表单(巧用new promise)
2018/06/06 Javascript
NodeJs入门教程之定时器和队列
2019/03/08 NodeJs
javascript实现雪花飘落效果
2020/08/19 Javascript
vue使用screenfull插件实现全屏功能
2020/09/17 Javascript
[03:30]DOTA2完美“圣”典精彩集锦
2016/12/27 DOTA
python和C语言混合编程实例
2014/06/04 Python
关于Python中浮点数精度处理的技巧总结
2017/08/10 Python
python实现机械分词之逆向最大匹配算法代码示例
2017/12/13 Python
python 获取文件下所有文件或目录os.walk()的实例
2018/04/23 Python
python中正则表达式 re.findall 用法
2018/10/23 Python
将pandas.dataframe的数据写入到文件中的方法
2018/12/07 Python
Python timeit模块的使用实践
2020/01/13 Python
python pptx复制指定页的ppt教程
2020/02/14 Python
PyCharm中配置PySide2的图文教程
2020/06/18 Python
CSS3属性 line-clamp控制文本行数的使用
2020/03/19 HTML / CSS
函授自我鉴定
2013/11/06 职场文书
大学生简短的自我评价分享
2014/02/20 职场文书
中国梦演讲稿教师篇
2014/04/23 职场文书
中学生打架检讨书之500字
2019/08/06 职场文书
Python 中的Sympy详细使用
2021/08/07 Python
mysql的单列多值存储实例详解
2022/04/05 MySQL
SpringBoot集成MongoDB实现文件上传的步骤
2022/04/18 MongoDB