使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python在linux系统下获取系统内存使用情况的方法
May 11 Python
python通过函数属性实现全局变量的方法
May 16 Python
Python功能键的读取方法
May 28 Python
Python利用Beautiful Soup模块修改内容方法示例
Mar 27 Python
Python 中Pickle库的使用详解
Feb 24 Python
Python SQL查询并生成json文件操作示例
Aug 17 Python
使用python 打开文件并做匹配处理的实例
Jan 02 Python
Python生成rsa密钥对操作示例
Apr 26 Python
基于Pycharm加载多个项目过程图解
Jan 19 Python
Python JSON编解码方式原理详解
Jan 20 Python
Django框架models使用group by详解
Mar 11 Python
浅析NumPy 切片和索引
Sep 02 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
深入apache host的配置详解
2013/06/09 PHP
显示程序执行时间php函数代码
2013/08/29 PHP
PHPMailer的主要功能特点和简单使用说明
2014/02/17 PHP
thinkPHP框架中执行事务的方法示例
2018/05/31 PHP
tp5 sum某个字段相加得到总数的例子
2019/10/18 PHP
神奇的代码 通杀各种网站-可随意修改复制页面内容
2008/07/17 Javascript
jquery 选择器引擎sizzle浅析
2013/02/06 Javascript
js字符串截取函数substr substring slice使用对比
2013/11/27 Javascript
DOM操作一些常用的属性汇总
2015/03/13 Javascript
js倒计时抢购实例
2015/12/20 Javascript
JavaScript实现阿拉伯数字和中文数字互相转换
2016/06/12 Javascript
js判断数组key是否存在(不用循环)的简单实例
2016/08/03 Javascript
vue制作加载更多功能的正确打开方式
2016/10/12 Javascript
解决Vue2.0 watch对象属性变化监听不到的问题
2018/09/11 Javascript
layer弹出框确定前验证:弹出消息框的方法(弹出两个layer)
2019/09/21 Javascript
vue+koa2搭建mock数据环境的详细教程
2020/05/18 Javascript
Vue执行方法,方法获取data值,设置data值,方法传值操作
2020/08/05 Javascript
[13:39]2014 DOTA2华西杯精英邀请赛 5 25 NewBee VS DK第一场
2014/05/26 DOTA
[43:47]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#2 MVP.Phx VS Fnatic第一局
2016/03/05 DOTA
[01:04:35]2018DOTA2亚洲邀请赛 4.3 突围赛 Secret vs VG 第一场
2018/04/04 DOTA
浅谈python中np.array的shape( ,)与( ,1)的区别
2018/06/04 Python
python3 对list中每个元素进行处理的方法
2018/06/29 Python
详解django.contirb.auth-认证
2018/07/16 Python
python实现嵌套列表平铺的两种方法
2018/11/08 Python
Django中更改默认数据库为mysql的方法示例
2018/12/05 Python
深入了解Python iter() 方法的用法
2019/07/11 Python
python中append实例用法总结
2019/07/30 Python
Python字符串中添加、插入特定字符的方法
2019/09/10 Python
python zip,lambda,map函数代码实例
2020/04/04 Python
Pytest测试框架基本使用方法详解
2020/11/25 Python
邮政员工辞职信
2014/01/16 职场文书
学习2014年全国两会心得体会
2014/03/12 职场文书
个人贷款收入证明
2014/10/26 职场文书
2015年初中教务处工作总结
2015/07/21 职场文书
SQL Server2019数据库备份与还原脚本,数据库可批量备份
2021/11/20 SQL Server
你知道Java Spring的两种事务吗
2022/03/16 Java/Android