Python使用Pandas对csv文件进行数据处理的方法


Posted in Python onAugust 01, 2019

今天接到一个新的任务,要对一个140多M的csv文件进行数据处理,总共有170多万行,尝试了导入本地的MySQL数据库进行查询,结果用Navicat导入直接卡死....估计是XAMPP套装里面全默认配置的MySQL性能不给力,又尝试用R搞一下吧结果发现光加载csv文件就要3分钟左右的时间,相当不给力啊,翻了翻万能的知乎发现了Python下的一个神器包:Pandas(熊猫们?),加载这个140多M的csv文件两秒钟就搞定,后面的分类汇总等操作也都是秒开,太牛逼了!记录一下这次数据处理的过程:

使用Python3.6.4环境(对中文支持比较好),安装Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #进行具体的sum,count等计算时候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #这里绝对路径一定要用/,windows下也是如此,不加参数默认csv文件首行为标题行
df.head() #查看引入的csv文件前5行数据
df[“播种面积”] #查看指定列,后面跟[:5]查看前5行数据

Python使用Pandas对csv文件进行数据处理的方法

df[“调查对象代码”].str[:6] #获取指定列前6位字符串

df["ADDR"]=df["调查对象代码"].str[:6] #将上一行处理后的6位地址码作为新列ADDR插入

Python使用Pandas对csv文件进行数据处理的方法

gp=df.groupby(["ADDR","代码"])["播种面积"].sum() #根据ADDR和代码进行分组后对播种面积列进行sum求和计算

Python使用Pandas对csv文件进行数据处理的方法

pv=df.pivot_table(["播种面积"],index="ADDR",columns="代码",margins=True,aggfunc=np.sum,fill_value=0) #数据透视图,对播种面积列进行汇总计算,index为行,columns为列,margins=True增加一个全部行汇总,aggfunc=np.sum透视图中对播种面积值进行sum计算,这里np是开头import的numpy as np,fill_value=0对空值进行0替换,否则没有数据会显示NaN

Python使用Pandas对csv文件进行数据处理的方法

pv.to_csv("d:/snp/test.csv") #写入csv文件

总结

以上所述是小编给大家介绍的Python使用Pandas对csv文件进行数据处理的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Windows下PyMongo下载及安装教程
Apr 27 Python
Python实现对PPT文件进行截图操作的方法
Apr 28 Python
python执行子进程实现进程间通信的方法
Jun 02 Python
python 使用 requests 模块发送http请求 的方法
Dec 09 Python
python ddt数据驱动最简实例代码
Feb 22 Python
Django打印出在数据库中执行的语句问题
Jul 25 Python
Python导入数值型Excel数据并生成矩阵操作
Jun 09 Python
如何理解python对象
Jun 21 Python
Python手动或自动协程操作方法解析
Jun 22 Python
PyTorch如何搭建一个简单的网络
Aug 24 Python
python PyAUtoGUI库实现自动化控制鼠标键盘
Sep 09 Python
使用python绘制分组对比柱状图
Apr 21 Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
python读写csv文件并增加行列的实例代码
Aug 01 #Python
Flask框架重定向,错误显示,Responses响应及Sessions会话操作示例
Aug 01 #Python
python对csv文件追加写入列的方法
Aug 01 #Python
Django Aggregation聚合使用方法解析
Aug 01 #Python
Flask教程之重定向与错误处理实例分析
Aug 01 #Python
You might like
php excel reader读取excel内容存入数据库实现代码
2012/12/06 PHP
PHP实现的简易版图片相似度比较
2015/01/07 PHP
Thinkphp关闭缓存的方法
2015/06/26 PHP
php生成图片验证码-附五种验证码
2015/08/19 PHP
php redis实现文章发布系统(用户投票系统)
2017/03/04 PHP
PHP+AJAX 投票器功能
2017/11/11 PHP
PHP7 安装event扩展的实现方法
2019/10/08 PHP
捕获键盘事件(且兼容各浏览器)
2013/07/03 Javascript
javascript处理表单示例(javascript提交表单)
2014/04/28 Javascript
JavaScript基础语法、dom操作树及document对象
2014/12/02 Javascript
javascript简单实现类似QQ头像弹出效果的方法
2015/08/03 Javascript
理解 JavaScript Scoping & Hoisting(二)
2015/11/18 Javascript
JS实现iframe自适应高度的方法(兼容IE与FireFox)
2016/06/24 Javascript
JavaScript学习笔记整理_关于表达式和语句
2016/09/19 Javascript
从零开始学习Node.js系列教程之设置HTTP头的方法示例
2017/04/13 Javascript
layuiAdmin循环遍历展示商品图片列表的方法
2019/09/16 Javascript
JavaScript 作用域scope简单汇总
2019/10/23 Javascript
[01:57]2018年度DOTA2最具潜力解说-完美盛典
2018/12/16 DOTA
利用python程序帮大家清理windows垃圾
2017/01/15 Python
Python Unittest自动化单元测试框架详解
2018/04/04 Python
Python 实现平台类游戏添加跳跃功能
2020/03/27 Python
CSS3实现自定义Checkbox特效实例代码
2017/04/24 HTML / CSS
AmazeUI 手机版页面的顶部导航条Header与侧边导航栏offCanvas的示例代码
2020/08/19 HTML / CSS
英国著名国际平价时尚男装品牌:Topman
2016/08/27 全球购物
Mytheresa英国官网:拥有160多个奢侈品品牌
2016/10/09 全球购物
英国综合网上购物商城:The Hut
2018/07/03 全球购物
override和overload的区别
2016/03/09 面试题
当当网软件测试笔试题
2015/11/24 面试题
冰淇淋店的创业计划书
2014/02/07 职场文书
测绘专业大学生职业生涯规划书
2014/02/10 职场文书
2014会计年终工作总结
2014/12/20 职场文书
入党宣誓仪式主持词
2015/06/29 职场文书
普希金的诗歌赏析(3首)
2019/08/20 职场文书
发工资啦!教你用Python实现邮箱自动群发工资条
2021/05/10 Python
修改MySQL的默认密码的四种小方法
2021/05/26 MySQL
spring boot实现文件上传
2022/08/14 Java/Android