pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
推荐下python/ironpython:从入门到精通
Oct 02 Python
python 图片验证码代码分享
Jul 04 Python
django model去掉unique_together报错的解决方案
Oct 18 Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 Python
python利用正则表达式提取字符串
Dec 08 Python
Python中动态创建类实例的方法
Mar 24 Python
详细分析python3的reduce函数
Dec 05 Python
[原创]pip和pygal的安装实例教程
Dec 07 Python
Python可迭代对象操作示例
May 07 Python
python 申请内存空间,用于创建多维数组的实例
Dec 02 Python
python 偷懒技巧——使用 keyboard 录制键盘事件
Sep 21 Python
pip/anaconda修改镜像源,加快python模块安装速度的操作
Mar 04 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
Smarty实现页面静态化(生成HTML)的方法
2016/05/23 PHP
PHP结合Ueditor并修改图片上传路径
2016/10/16 PHP
PHP变量的作用范围实例讲解
2020/12/22 PHP
用javascript动态调整iframe高度的代码
2007/04/10 Javascript
jQuery中的height innerHeight outerHeight区别示例介绍
2014/06/15 Javascript
原生JS和JQuery动态添加、删除表格行的方法
2015/05/28 Javascript
基于jquery实现图片相关操作(重绘、获取尺寸、调整大小、缩放)
2015/12/25 Javascript
使用pcs api往免费的百度网盘上传下载文件的方法
2016/03/17 Javascript
js实现textarea限制输入字数
2017/02/13 Javascript
React + webpack 环境配置的方法步骤
2017/09/07 Javascript
js构建二叉树进行数值数组的去重与优化详解
2018/03/26 Javascript
Vuex 使用 v-model 配合 state的方法
2018/11/13 Javascript
elementUI Tree 树形控件的官方使用文档
2019/04/25 Javascript
layui.use模块外部使用其内部定义的js封装函数方法
2019/09/16 Javascript
JS代码屏蔽F12,右键,粘贴,复制,剪切,选中,操作实例
2019/09/17 Javascript
JS自定义滚动条效果
2020/03/13 Javascript
vue实现简单跑马灯效果
2020/05/25 Javascript
[51:06]DOTA2-DPC中国联赛 正赛 Elephant vs Aster BO3 第二场 1月26日
2021/03/11 DOTA
python实现本地图片转存并重命名的示例代码
2018/10/27 Python
python+PyQT实现系统桌面时钟
2020/06/16 Python
Python 一句话生成字母表的方法
2019/01/02 Python
python中break、continue 、exit() 、pass终止循环的区别详解
2019/07/08 Python
Python Matplotlib 基于networkx画关系网络图
2019/07/10 Python
Python with用法:自动关闭文件进程
2019/07/10 Python
PyQT5 emit 和 connect的用法详解
2019/12/13 Python
浅谈Python 参数与变量
2020/06/20 Python
基于CSS3特效之动画:animation的应用
2013/05/09 HTML / CSS
美体小铺美国官网:The Body Shop美国
2017/11/10 全球购物
Casetify官网:自制专属手机壳、iPad护壳和Apple Watch手表带
2018/05/09 全球购物
澳大利高级泳装品牌:Bondi Born
2018/05/23 全球购物
超市中秋节促销方案
2014/03/21 职场文书
代领报检证委托书范本
2014/10/11 职场文书
2014小学年度工作总结
2014/12/20 职场文书
司机岗位职责范本
2015/04/10 职场文书
2015年度酒店客房部工作总结
2015/05/25 职场文书
golang正则之命名分组方式
2021/04/25 Golang