pandas求两个表格不相交的集合方法


Posted in Python onDecember 08, 2018

Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

pandas求两个表格不相交的集合方法

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd 
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]} 
a=pd.DataFrame(a0) 
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]} 
b=pd.DataFrame(b0)

看一下两个DataFrame的样子

pandas求两个表格不相交的集合方法

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是如下所示。虽然过程很简单,但是很好用。

pandas求两个表格不相交的集合方法

同样的道理可用来求差集,在此不做赘述。

以上这篇pandas求两个表格不相交的集合方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现socket客户端和服务端简单示例
Feb 24 Python
python中list循环语句用法实例
Nov 10 Python
Python利用多进程将大量数据放入有限内存的教程
Apr 01 Python
在Python中利用Pandas库处理大数据的简单介绍
Apr 07 Python
用Python中的wxPython实现最基本的浏览器功能
Apr 14 Python
Python编程实现数学运算求一元二次方程的实根算法示例
Apr 02 Python
Python使用flask框架操作sqlite3的两种方式
Jan 31 Python
Python实现爬取百度贴吧帖子所有楼层图片的爬虫示例
Apr 26 Python
Python 实现在文件中的每一行添加一个逗号
Apr 29 Python
python多进程 主进程和子进程间共享和不共享全局变量实例
Apr 25 Python
Django Admin 上传文件到七牛云的示例代码
Jun 20 Python
python 爬取京东指定商品评论并进行情感分析
May 27 Python
对pytorch网络层结构的数组化详解
Dec 08 #Python
pytorch对可变长度序列的处理方法详解
Dec 08 #Python
pytorch 转换矩阵的维数位置方法
Dec 08 #Python
pytorch 调整某一维度数据顺序的方法
Dec 08 #Python
Python操作mongodb数据库的方法详解
Dec 08 #Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 #Python
python-opencv颜色提取分割方法
Dec 08 #Python
You might like
PHP 开源AJAX框架14种
2009/08/24 PHP
PHP提交表单失败后如何保留已经填写的信息
2014/06/20 PHP
PHP中使用localhost连接Mysql不成功的解决方法
2014/08/20 PHP
Laravel实现搜索的时候分页并携带参数
2019/10/15 PHP
javascript一点特殊用法
2008/05/28 Javascript
动态为事件添加js代码示例
2009/02/15 Javascript
JavaScript 在各个浏览器中执行的耐性
2009/04/06 Javascript
js跨域访问示例(客户端/服务端)
2014/05/19 Javascript
JS 实现可停顿的垂直滚动实例代码
2016/11/23 Javascript
webpack入门必知必会
2017/01/16 Javascript
JavaScript观察者模式(publish/subscribe)原理与实现方法
2017/03/30 Javascript
ES6中Array.find()和findIndex()函数的用法详解
2017/09/16 Javascript
vue实现模态框的通用写法推荐
2018/02/26 Javascript
Vue表单及表单绑定方法
2018/09/04 Javascript
node.js环境搭建图文详解
2018/09/19 Javascript
vue配置font-awesome5的方法步骤
2019/01/27 Javascript
微信小程序云函数添加数据到数据库的方法
2020/03/04 Javascript
js的Object.assign用法示例分析
2020/03/05 Javascript
javascript中contains是否包含功能实现代码(扩展字符、数组、dom)
2020/04/07 Javascript
uniapp 仿微信的右边下拉选择弹出框的实现代码
2020/07/12 Javascript
[54:24]Optic vs TNC 2018国际邀请赛小组赛BO2 第二场
2018/08/18 DOTA
详解Python中的日志模块logging
2015/06/19 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
2019/02/12 Python
python3.7简单的爬虫实例详解
2019/07/08 Python
Python操作注册表详细步骤介绍
2020/02/05 Python
如何使用repr调试python程序
2020/02/28 Python
adidas美国官网:adidas US
2016/09/21 全球购物
德国原装品牌香水、化妆品和手表网站:BRASTY.DE
2016/10/16 全球购物
远程Wi-Fi宠物监控相机:Petcube
2017/04/26 全球购物
薇姿法国官网:Vichy法国
2021/01/28 全球购物
教师绩效考核方案
2014/01/21 职场文书
庆八一活动方案
2014/01/25 职场文书
《故乡》教学反思
2014/04/10 职场文书
创业融资计划书
2014/04/25 职场文书
乡镇干部个人对照检查材料思想汇报(原创篇)
2014/09/28 职场文书
2016入党培训心得体会范文
2016/01/08 职场文书