pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python zip文件 压缩
Dec 24 Python
python算法学习之桶排序算法实例(分块排序)
Dec 18 Python
解决python使用open打开文件中文乱码的问题
Dec 29 Python
Python之dict(或对象)与json之间的互相转化实例
Jun 05 Python
利用Python写一个爬妹子的爬虫
Jun 08 Python
详解程序意外中断自动重启shell脚本(以Python为例)
Jul 26 Python
Python 、Pycharm、Anaconda三者的区别与联系、安装过程及注意事项
Oct 11 Python
python 并发下载器实现方法示例
Nov 22 Python
Python字符串格式化输出代码实例
Nov 22 Python
Python调用OpenCV实现图像平滑代码实例
Jun 19 Python
Python select及selectors模块概念用法详解
Jun 22 Python
Python 可视化神器Plotly详解
Dec 26 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
一个PHP操作Access类(PHP+ODBC+Access)
2007/01/02 PHP
linux环境apache多端口配置虚拟主机的方法深入介绍
2013/06/09 PHP
php获取服务器操作系统相关信息的方法
2016/10/08 PHP
利用php-cli和任务计划实现订单同步功能的方法
2017/05/03 PHP
让您的菜单不离网站
2006/10/03 Javascript
js获取select标签选中值的两种方式
2014/01/09 Javascript
JavaScript设计模式之适配器模式介绍
2014/12/28 Javascript
javascript中slice(),splice(),split(),substring(),substr()使用方法
2015/03/13 Javascript
基于javascript实现图片懒加载
2016/01/05 Javascript
浅析在javascript中创建对象的各种模式
2016/05/06 Javascript
jQuery File Upload文件上传插件使用详解
2016/12/06 Javascript
js图片加载效果实例代码(延迟加载+瀑布流加载)
2017/05/12 Javascript
详解如何在vue中使用sass
2017/06/21 Javascript
基于vue-cli 打包时抽离项目相关配置文件详解
2018/03/07 Javascript
详解vue中axios请求的封装
2019/04/08 Javascript
layui表格 列自动适应大小失效的解决方法
2019/09/06 Javascript
微信小程序连接服务器展示MQTT数据信息的实现
2020/07/14 Javascript
JavaScript实现点击出现子菜单效果
2021/02/08 Javascript
[01:04:01]2014 DOTA2国际邀请赛中国区预选赛 5 23 CIS VS DT第一场
2014/05/24 DOTA
python生成多个只含0,1元素的随机数组或列表的实例
2018/11/12 Python
Python学习笔记基本数据结构之序列类型list tuple range用法分析
2019/06/08 Python
对tensorflow中cifar-10文档的Read操作详解
2020/02/10 Python
Python的赋值、深拷贝与浅拷贝的区别详解
2020/02/12 Python
Python:__eq__和__str__函数的使用示例
2020/09/26 Python
Ibatis中如何提高SQL Map的性能
2013/05/11 面试题
房地产销售经理岗位职责
2014/01/01 职场文书
公务员职业生涯规划书范文  
2014/01/19 职场文书
小学教师师德感言
2014/02/10 职场文书
大学生个人求职口试自我评价
2014/02/16 职场文书
经销商订货会主持词
2014/03/27 职场文书
艺人经纪人岗位职责
2014/04/15 职场文书
2015教师个人工作总结范文
2015/03/31 职场文书
毕业论文致谢格式模板
2015/05/14 职场文书
2016年幼儿园教师政治学习心得体会
2016/01/23 职场文书
选对餐饮营销策略,营业额才会上涨
2019/08/27 职场文书
jQuery ajax - getScript() 方法和getJSON方法
2021/05/14 jQuery