python:pandas合并csv文件的方法(图书数据集成)


Posted in Python onApril 12, 2018

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

python:pandas合并csv文件的方法(图书数据集成)

ReaderRentRecode.csv:

python:pandas合并csv文件的方法(图书数据集成)

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
  data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv

python:pandas合并csv文件的方法(图书数据集成)

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python函数中定义参数的四种方式
Nov 30 Python
深入理解Python中字典的键的使用
Aug 19 Python
python 实时遍历日志文件
Apr 12 Python
Python的多维空数组赋值方法
Apr 13 Python
详解python中sort排序使用
Mar 23 Python
python实现合并多个list及合并多个django QuerySet的方法示例
Jun 11 Python
Django中间件基础用法详解
Jul 18 Python
解决python中的幂函数、指数函数问题
Nov 25 Python
简单了解Java Netty Reactor三种线程模型
Apr 26 Python
使用python创建生成动态链接库dll的方法
May 09 Python
解决导入django_filters不成功问题No module named 'django_filter'
Jul 15 Python
新手必备Python开发环境搭建教程
May 28 Python
用pandas按列合并两个文件的实例
Apr 12 #Python
Python中多个数组行合并及列合并的方法总结
Apr 12 #Python
Python实现的凯撒密码算法示例
Apr 12 #Python
python merge、concat合并数据集的实例讲解
Apr 12 #Python
Python实现的维尼吉亚密码算法示例
Apr 12 #Python
python pandas dataframe 按列或者按行合并的方法
Apr 12 #Python
python监控进程脚本
Apr 12 #Python
You might like
php 修改zen-cart下单和付款流程以防止漏单
2010/03/08 PHP
自己写的php中文截取函数mb_strlen和mb_substr
2015/02/09 PHP
PHP钩子与简单分发方式实例分析
2017/09/04 PHP
Laravel路由研究之domain解决多域名问题的方法示例
2019/04/04 PHP
php集成开发环境详解
2019/09/24 PHP
PHP7 list() 函数修改
2021/03/09 PHP
7个去伪存真的JavaScript面试题
2016/01/07 Javascript
js定时器实例分享
2016/12/20 Javascript
jQuery选择器中的特殊符号处理方法
2017/09/08 jQuery
Express使用html模板的详细代码
2017/09/18 Javascript
React-Router如何进行页面权限管理的方法
2017/12/06 Javascript
微信小程序实现发红包功能
2018/07/11 Javascript
vue-router权限控制(简单方式)
2018/10/29 Javascript
vue 实现微信浮标效果
2019/09/01 Javascript
基于vue和bootstrap实现简单留言板功能
2020/05/30 Javascript
详解React 元素渲染
2020/07/07 Javascript
微信小程序实现签到弹窗动画
2020/09/21 Javascript
[01:03:31]DOTA2上海特级锦标赛B组资格赛#1 Alliance VS Fnatic第二局
2016/02/26 DOTA
python&MongoDB爬取图书馆借阅记录
2016/02/05 Python
老生常谈进程线程协程那些事儿
2017/07/24 Python
人机交互程序 python实现人机对话
2017/11/14 Python
Python将多个excel文件合并为一个文件
2018/01/03 Python
详解python异步编程之asyncio(百万并发)
2018/07/07 Python
浅谈python 导入模块和解决文件句柄找不到问题
2018/12/15 Python
Python3.6+Django2.0以上 xadmin站点的配置和使用教程图解
2019/06/04 Python
Windows 安装 Anaconda3+PyCharm的方法步骤
2019/06/13 Python
浅析Python 抽象工厂模式的优缺点
2020/07/13 Python
小白教你PyCharm从下载到安装再到科学使用PyCharm2020最新激活码
2020/09/25 Python
农行实习自我鉴定
2013/09/22 职场文书
毕业生就业自荐信
2013/12/04 职场文书
关于廉洁的广播稿
2014/01/30 职场文书
财务人员求职自荐书范文
2014/02/10 职场文书
《乌塔》教学反思
2014/02/17 职场文书
中队活动总结
2014/08/27 职场文书
自愿解除劳动合同协议书
2014/09/11 职场文书
维稳工作承诺书
2015/01/20 职场文书