pandas参数设置的实用小技巧


Posted in Python onAugust 23, 2020

前言

在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。

而pandas有着自己的一套参数设置系统,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识。

pandas参数设置的实用小技巧
图1

1 设置DataFrame最大显示行数

pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子:

pandas参数设置的实用小技巧
图2

在修改display.max_rows的参数值之后,我们的数据框只会显示指定行数的数据,中间的部分都会以省略号的形式显示,当我们的数据框行数较多,可以加大这个参数以显示更多行数据。

2 设置DataFrame最大显示列数

类似display.max_rows,通过修改display.max_columns我们可以调节最大显示的数据框列数(默认是20列),这在我们的数据框字段较多又想全部查看的时候很有用:

pandas参数设置的实用小技巧
图3

3 设置每列的最大显示宽度

对于一些单元格内容长度较长的数据譬如长文本,在查看数据框时过长的部分会被简化为省略号,而通过修改display.max_colwidth参数我们可以在必要时,使得超长的部分也显示出来:

pandas参数设置的实用小技巧
图4

4 指定小于某个数的元素显示为0

通过display.chop_threshold参数我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0:

pandas参数设置的实用小技巧
图5

5 格式化浮点数

通过display.float_format参数我们可以设置浮点数的显示格式,譬如这里我们给浮点数加上前缀并设定保留两位小数:

pandas参数设置的实用小技巧
图6

6 设置info()方法中非缺失值检查的行数上限

针对数据框的info()方法可以帮助我们查看数据框的一些概览信息,譬如每一列对应的非缺失值个数。

但默认情况下当数据框行数大于1690784行时,再查看info()信息,会处于计算效率的考虑略去缺失值检查信息。

这时我们可以通过设置display.max_info_rows参数来提高这个上限:

pandas参数设置的实用小技巧
图7

7 控制小数打印的精度

控制数据框中小数的显示精度除了上文提到的方法之外,还可以通过修改display.precision参数来控制,默认是6位小数:

pandas参数设置的实用小技巧
图8

8 临时修改参数

有些时候我们只希望在某张表上进行设置参数的修改,不希望影响到之后的其他表的显示。

这时除了用pd.reset_option()对指定的参数进行复原之外,我们还可以利用with关键词配合pd.option_context以临时的方式将指定的参数作用在局部范围内:

pandas参数设置的实用小技巧
图9

总结

到此这篇关于pandas参数设置实用小技巧的文章就介绍到这了,更多相关pandas参数设置技巧内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python文件比较示例分享
Jan 10 Python
Python操作MongoDB数据库PyMongo库使用方法
Apr 27 Python
使用Python下载歌词并嵌入歌曲文件中的实现代码
Nov 13 Python
Python探索之Metaclass初步了解
Oct 28 Python
python实现简单中文词频统计示例
Nov 08 Python
利用python画出折线图
Jul 26 Python
在Python中通过getattr获取对象引用的方法
Jan 21 Python
浅析python 中大括号中括号小括号的区分
Jul 29 Python
python如何使用socketserver模块实现并发聊天
Dec 14 Python
python代数式括号有效性检验示例代码
Oct 04 Python
Restful_framework视图组件代码实例解析
Nov 17 Python
虚拟环境及venv和virtualenv的区别说明
Feb 05 Python
Python如何把字典写入到CSV文件的方法示例
Aug 23 #Python
Python tkinter界面实现历史天气查询的示例代码
Aug 23 #Python
套娃式文件夹如何通过Python批量处理
Aug 23 #Python
python进度条显示-tqmd模块的实现示例
Aug 23 #Python
基于python tkinter的点名小程序功能的实例代码
Aug 22 #Python
python+selenium 简易地疫情信息自动打卡签到功能的实现代码
Aug 22 #Python
python进度条显示之tqmd模块
Aug 22 #Python
You might like
使用sockets:从新闻组中获取文章(一)
2006/10/09 PHP
php上传文件常见问题总结
2015/02/03 PHP
php通过rmdir删除目录的简单用法
2015/03/18 PHP
PHP开发之归档格式phar文件概念与用法详解【创建,使用,解包还原提取】
2017/11/17 PHP
PHP基于openssl实现的非对称加密操作示例
2019/01/11 PHP
Javascript解决常见浏览器兼容问题的12种方法
2010/01/04 Javascript
JQuery 拾色器插件发布-jquery.icolor.js
2010/10/20 Javascript
Json对象替换字符串占位符实现代码
2010/11/17 Javascript
Js如何判断客户端是PC还是手持设备简单分析
2012/11/22 Javascript
jQuery.prop() 使用详解
2015/07/19 Javascript
js实现索引图片切换效果
2015/11/21 Javascript
JavaScript jQuery 中定义数组与操作及jquery数组操作
2015/12/18 Javascript
JS实现HTML标签转义及反转义
2020/04/14 Javascript
BootStrap select2 动态改变值的方法
2017/02/10 Javascript
vue项目常用组件和框架结构介绍
2017/12/24 Javascript
javascript原型链学习记录之继承实现方式分析
2019/05/01 Javascript
关于在LayUI中使用AJAX提交巨坑记录
2019/10/25 Javascript
TypeScript的安装、使用、自动编译的实现
2020/04/10 Javascript
vue-cli或vue项目利用HBuilder打包成移动端app操作
2020/07/29 Javascript
python自动安装pip
2014/04/24 Python
在Python的Django框架中编写错误提示页面
2015/07/22 Python
Django自定义manage命令实例代码
2018/02/11 Python
Python将DataFrame的某一列作为index的方法
2018/04/08 Python
详解flask入门模板引擎
2018/07/18 Python
python Tkinter版学生管理系统
2019/02/20 Python
Jacobi迭代算法的Python实现详解
2019/06/29 Python
Python使用正则表达式分割字符串的实现方法
2019/07/16 Python
python hash每次调用结果不同的原因
2019/11/21 Python
Pandas实现dataframe和np.array的相互转换
2019/11/30 Python
pandas中read_csv、rolling、expanding用法详解
2020/04/21 Python
Alpine安装Python3依赖出现的问题及解决方法
2020/12/25 Python
房产协议书范本2014
2014/09/30 职场文书
个人销售励志奋斗口号
2019/12/05 职场文书
PostgreSQL通过oracle_fdw访问Oracle数据的实现步骤
2021/05/21 PostgreSQL
Java Dubbo框架知识点梳理
2021/06/26 Java/Android
Redis+AOP+自定义注解实现限流
2022/06/28 Redis