使用pd.merge表连接出现多余行的问题解决


Posted in Python onJune 16, 2022

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

使用pd.merge表连接出现多余行的问题解决

使用pd.merge表连接出现多余行的问题解决

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
pycharm 使用心得(八)如何调用另一文件中的函数
Jun 06 Python
numpy数组拼接简单示例
Dec 15 Python
详解Python3 中hasattr()、getattr()、setattr()、delattr()函数及示例代码数
Apr 18 Python
用python简单实现mysql数据同步到ElasticSearch的教程
May 30 Python
Python中if elif else及缩进的使用简述
May 31 Python
浅谈python脚本设置运行参数的方法
Dec 03 Python
Python设计模式之组合模式原理与用法实例分析
Jan 11 Python
python使用PyQt5的简单方法
Feb 27 Python
python滑块验证码的破解实现
Nov 10 Python
pandas之分组groupby()的使用整理与总结
Jun 18 Python
基于Tensorflow读取MNIST数据集时网络超时的解决方式
Jun 22 Python
解决keras模型保存h5文件提示无此目录问题
Jul 01 Python
pd.DataFrame中的几种索引变换的实现
Python实战实现爬取天气数据并完成可视化分析详解
pandas时间序列之pd.to_datetime()的实现
Jun 16 #Python
pandas中pd.groupby()的用法详解
Jun 16 #Python
python中pd.cut()与pd.qcut()的对比及示例
Jun 16 #Python
Python自动操作神器PyAutoGUI的使用教程
Jun 16 #Python
python内置模块之上下文管理contextlib
Jun 14 #Python
You might like
php下载文件的代码示例
2012/06/29 PHP
PHP多个文件上传到服务器实例
2014/10/29 PHP
php调用新浪短链接API的方法
2014/11/08 PHP
PHP的Socket通信之UDP通信实例
2015/07/02 PHP
php curl模拟post请求和提交多维数组的示例代码
2015/11/19 PHP
Yii支持多域名cors原理的实现
2018/12/05 PHP
记Laravel调用Gin接口调用formData上传文件的实现方法
2019/12/12 PHP
JavaScript中的Screen屏幕对象
2008/01/16 Javascript
Mootools 1.2教程 Fx.Tween的使用
2009/09/15 Javascript
Jquery.TreeView结合ASP.Net和数据库生成菜单导航条
2010/08/27 Javascript
使用CSS样式position:fixed水平滚动的方法
2014/02/19 Javascript
js 获取页面高度和宽度兼容 ie firefox chrome等
2014/05/14 Javascript
Nodejs中自定义事件实例
2014/06/20 NodeJs
ie8模式下click无反应点击option无反应的解决方法
2014/10/11 Javascript
高效的jquery数字滚动特效
2015/12/17 Javascript
js实现四舍五入完全保留两位小数的方法
2016/08/02 Javascript
js 上传文件预览的简单实例
2016/08/16 Javascript
node.js请求HTTPS报错:UNABLE_TO_VERIFY_LEAF_SIGNATURE\的解决方法
2016/12/18 Javascript
AngularJS打开页面隐藏显示表达式用法示例
2016/12/25 Javascript
javaScript中封装的各种写法示例(推荐)
2017/07/03 Javascript
为什么要使用Vuex的介绍
2019/01/19 Javascript
详解webpack的clean-webpack-plugin插件报错
2020/10/16 Javascript
浅谈Vue使用Elementui修改默认的最快方法
2020/12/05 Vue.js
python学习笔记之列表(list)与元组(tuple)详解
2017/11/23 Python
python机器学习之神经网络(一)
2017/12/20 Python
英国现代家具和装饰网站:PN Home
2018/08/16 全球购物
我的五年职业生涯规划
2014/01/23 职场文书
内蒙古鄂尔多斯市市长寄语
2014/04/10 职场文书
作文评语集锦大全
2014/04/23 职场文书
英文演讲稿
2014/05/15 职场文书
团结就是力量演讲稿
2014/05/21 职场文书
民事授权委托书范文
2014/08/02 职场文书
民政局个人整改措施
2014/09/24 职场文书
小学运动会入场口号
2015/12/24 职场文书
深入理解java.lang.String类的不可变性
2021/06/27 Java/Android
Go语言基础map用法及示例详解
2021/11/17 Golang