对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python文件操作相关知识点总结整理
Feb 22 Python
python 网络爬虫初级实现代码
Feb 27 Python
python使用matplotlib绘制柱状图教程
Feb 08 Python
python+opencv实现动态物体识别
Jan 09 Python
hmac模块生成加入了密钥的消息摘要详解
Jan 11 Python
Tensorflow卷积神经网络实例
May 24 Python
浅谈pandas用groupby后对层级索引levels的处理方法
Nov 06 Python
浅谈Pycharm调用同级目录下的py脚本bug
Dec 03 Python
Python批量处理csv并保存过程解析
May 16 Python
python Protobuf定义消息类型知识点讲解
Mar 02 Python
Python实现打乒乓小游戏
Sep 25 Python
Python Django项目和应用的创建详解
Nov 27 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
phpMyAdmin 安装教程全攻略
2007/03/19 PHP
PHP+sqlite数据库操作示例(创建/打开/插入/检索)
2016/05/26 PHP
phpcms中的评论样式修改方法
2016/10/21 PHP
PHP实现将上传图片自动缩放到指定分辨率,并保持清晰度封装类示例
2019/06/17 PHP
Laravel框架实现多个视图共享相同数据的方法详解
2019/07/09 PHP
详解PHP 7.4 中数组延展操作符语法知识点
2019/07/19 PHP
防止动态加载JavaScript引起的内存泄漏问题
2009/10/08 Javascript
Javascript 倒计时源代码.(时.分.秒) 详细注释版
2011/05/09 Javascript
JS模拟面向对象全解(一、类型及传递)
2011/07/13 Javascript
jquery表格内容筛选实现思路及代码
2013/04/16 Javascript
Javascript获取HTML静态页面参数传递值示例
2013/08/18 Javascript
javascript移动设备Web开发中对touch事件的封装实例
2014/06/05 Javascript
Window.Open如何在同一个标签页打开
2014/06/20 Javascript
分享33个jQuery与CSS3实现的绚丽鼠标悬停效果
2014/12/15 Javascript
javascript与jquery中的this关键字用法实例分析
2015/12/24 Javascript
JS实现的打字机效果完整实例
2016/06/20 Javascript
基于javascript实现按圆形排列DIV元素(三)
2016/12/02 Javascript
详解Vue.js 2.0 如何使用axios
2017/04/21 Javascript
vue中手机号,邮箱正则验证以及60s发送验证码的实例
2018/03/16 Javascript
用ES6的class模仿Vue写一个双向绑定的示例代码
2018/04/20 Javascript
微信小程序使用canvas自适应屏幕画海报并保存图片功能
2019/07/25 Javascript
使用Python发送邮件附件以定时备份MySQL的教程
2015/04/25 Python
浅谈python为什么不需要三目运算符和switch
2016/06/17 Python
由浅入深讲解python中的yield与generator
2017/04/05 Python
Python图像处理之简单画板实现方法示例
2018/08/30 Python
python tkinter控件布局项目实例
2019/11/04 Python
如何利用pygame实现简单的五子棋游戏
2019/12/29 Python
解决Python图形界面中设置尺寸的问题
2020/03/05 Python
matplotlib 生成的图像中无法显示中文字符的解决方法
2020/06/10 Python
Python logging模块原理解析及应用
2020/08/13 Python
python中用Scrapy实现定时爬虫的实例讲解
2021/01/18 Python
详解Python之Scrapy爬虫教程NBA球员数据存放到Mysql数据库
2021/01/24 Python
anaconda安装pytorch1.7.1和torchvision0.8.2的方法(亲测可用)
2021/02/01 Python
优秀的教师个人的中文求职信
2013/09/21 职场文书
十八届三中全会个人学习材料
2014/02/13 职场文书
2016大学生暑期三下乡心得体会
2016/01/23 职场文书