Pandas中resample方法详解


Posted in Python onJuly 02, 2019

Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。

方法的格式是:

DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention='start',kind=None, loffset=None, limit=None, base=0)

参数详解是:

参数 说明
freq 表示重采样频率,例如‘M'、‘5min',Second(15)
how='mean' 用于产生聚合值的函数名或数组函数,例如‘mean'、‘ohlc'、np.max等,默认是‘mean',其他常用的值由:‘first'、‘last'、‘median'、‘max'、‘min'
axis=0 默认是纵轴,横轴设置axis=1
fill_method = None 升采样时如何插值,比如‘ffill'、‘bfill'等
closed = ‘right' 在降采样时,各时间段的哪一段是闭合的,‘right'或‘left',默认‘right'
label= ‘right' 在降采样时,如何设置聚合值的标签,例如,9:30-9:35会被标记成9:30还是9:35,默认9:35
loffset = None 面元标签的时间校正值,比如‘-1s'或Second(-1)用于将聚合标签调早1秒
limit=None 在向前或向后填充时,允许填充的最大时期数
kind = None 聚合到时期(‘period')或时间戳(‘timestamp'),默认聚合到时间序列的索引类型
convention = None 当重采样时期时,将低频率转换到高频率所采用的约定(start或end)。默认‘end'

首先创建一个Series,采样频率为一分钟。

>>> index = pd.date_range('1/1/2000', periods=9, freq='T')
>>> series = pd.Series(range(9), index=index)
>>> series
2000-01-01 00:00:00  0
2000-01-01 00:01:00  1
2000-01-01 00:02:00  2
2000-01-01 00:03:00  3
2000-01-01 00:04:00  4
2000-01-01 00:05:00  5
2000-01-01 00:06:00  6
2000-01-01 00:07:00  7
2000-01-01 00:08:00  8
Freq: T, dtype: int64

降低采样频率为三分钟

>>> series.resample('3T').sum()
2000-01-01 00:00:00   3
2000-01-01 00:03:00  12
2000-01-01 00:06:00  21
Freq: 3T, dtype: int64

降低采样频率为三分钟,但是每个标签使用right来代替left。请注意,bucket中值的用作标签。

>>> series.resample('3T', label='right').sum()
2000-01-01 00:03:00   3
2000-01-01 00:06:00  12
2000-01-01 00:09:00  21
Freq: 3T, dtype: int64

降低采样频率为三分钟,但是关闭right区间。

>>> series.resample('3T', label='right', closed='right').sum()
2000-01-01 00:00:00   0
2000-01-01 00:03:00   6
2000-01-01 00:06:00  15
2000-01-01 00:09:00  15
Freq: 3T, dtype: int64

增加采样频率到30秒

>>> series.resample('30S').asfreq()[0:5] #select first 5 rows
2000-01-01 00:00:00   0
2000-01-01 00:00:30  NaN
2000-01-01 00:01:00   1
2000-01-01 00:01:30  NaN
2000-01-01 00:02:00   2
Freq: 30S, dtype: float64

增加采样频率到30S,使用pad方法填充nan值。

>>> series.resample('30S').pad()[0:5]
2000-01-01 00:00:00  0
2000-01-01 00:00:30  0
2000-01-01 00:01:00  1
2000-01-01 00:01:30  1
2000-01-01 00:02:00  2
Freq: 30S, dtype: int64

增加采样频率到30S,使用bfill方法填充nan值。

>>> series.resample('30S').bfill()[0:5]
2000-01-01 00:00:00  0
2000-01-01 00:00:30  1
2000-01-01 00:01:00  1
2000-01-01 00:01:30  2
2000-01-01 00:02:00  2
Freq: 30S, dtype: int64

通过apply运行一个自定义函数

>>> def custom_resampler(array_like):
...   return np.sum(array_like)+5
>>> series.resample('3T').apply(custom_resampler)
2000-01-01 00:00:00   8
2000-01-01 00:03:00  17
2000-01-01 00:06:00  26
Freq: 3T, dtype: int64

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python私有属性和方法实例分析
Jan 15 Python
Python中__init__.py文件的作用详解
Sep 18 Python
Python实现随机漫步功能
Jul 09 Python
python3调用百度翻译API实现实时翻译
Aug 16 Python
python使用folium库绘制地图点击框
Sep 21 Python
python 实现批量xls文件转csv文件的方法
Oct 23 Python
python 应用之Pycharm 新建模板默认添加编码格式-作者-时间等信息【推荐】
Jun 17 Python
Python3+Requests+Excel完整接口自动化测试框架的实现
Oct 11 Python
Python3列表List入门知识附实例
Feb 09 Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 Python
Python Socketserver实现FTP文件上传下载代码实例
Mar 27 Python
Python3.7在anaconda里面使用IDLE编译器的步骤详解
Apr 29 Python
Python何时应该使用Lambda函数
Jul 02 #Python
Python Pandas分组聚合的实现方法
Jul 02 #Python
使用Python做垃圾分类的原理及实例代码附源码
Jul 02 #Python
python flask框架实现重定向功能示例
Jul 02 #Python
python实现串口自动触发工作的示例
Jul 02 #Python
python常用函数与用法示例
Jul 02 #Python
pandas DataFrame 行列索引及值的获取的方法
Jul 02 #Python
You might like
php 启动时报错的简单解决方法
2014/01/27 PHP
php类自动装载、链式操作、魔术方法实现代码
2017/07/23 PHP
PJBlog插件 防刷新的在线播放器
2006/10/25 Javascript
Javascript----文件操作
2007/01/18 Javascript
JavaScript中的isXX系列是否继续使用的分析
2011/04/16 Javascript
在JavaScript中typeof的用途介绍
2013/04/11 Javascript
jQuery插件 selectToSelect使用方法
2013/10/02 Javascript
jquery-syntax动态语法着色示例代码
2014/05/14 Javascript
基于jquery css3实现点击动画弹出表单源码特效
2015/08/31 Javascript
javascript学习小结之prototype
2015/12/03 Javascript
js的form表单提交url传参数(包含+等特殊字符)的两种解决方法
2016/05/25 Javascript
利用JS实现数字增长
2016/07/28 Javascript
jQuery 获取页面li数组并删除不在数组中的key
2016/08/02 Javascript
JavaScript 实现 Tab 点击切换实例代码
2017/03/25 Javascript
三步搞定:Vue.js调用Android原生操作
2020/09/07 Javascript
Python实现读取txt文件并转换为excel的方法示例
2018/05/17 Python
python使用循环打印所有三位数水仙花数的实例
2018/11/13 Python
在Pycharm terminal中字体大小设置的方法
2019/01/16 Python
Python微医挂号网医生数据抓取
2019/01/24 Python
Python计算时间间隔(精确到微妙)的代码实例
2019/02/26 Python
python自动保存百度盘资源到百度盘中的实例代码
2019/08/26 Python
Python大数据之从网页上爬取数据的方法详解
2019/11/16 Python
pytorch的batch normalize使用详解
2020/01/15 Python
Python实现遗传算法(二进制编码)求函数最优值方式
2020/02/11 Python
在ipython notebook中使用argparse方式
2020/04/20 Python
python seaborn heatmap可视化相关性矩阵实例
2020/06/03 Python
css3进行截取替代js的substring
2013/09/02 HTML / CSS
在HTML5 canvas里用卷积核进行图像处理的方法
2018/05/02 HTML / CSS
中国专业的综合网上购物商城:京东
2016/08/02 全球购物
会计专业推荐信
2013/10/29 职场文书
科技之星事迹材料
2014/06/02 职场文书
捐助感谢信
2015/01/22 职场文书
项目投资意向书范本
2015/05/09 职场文书
2015年环卫处个人工作总结
2015/07/27 职场文书
幼儿园开学家长寄语(2016秋季)
2015/12/03 职场文书
十大最强火系宝可梦,喷火龙上榜,第一名有双火属性
2022/03/18 日漫