Pandas||过滤缺失数据||pd.dropna()函数的用法说明


Posted in Python onMay 14, 2021

看代码吧~

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.

pd.dropna()函数(官方文档)用于过滤数据中的缺失数据.

缺失数据在pandas中用NaN标记.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])        # 随机产生5行3列的数据    
df.ix[1, :-1] = np.nan        # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan
print(df)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

df.dropna()   #删除所有带缺失数据的行

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

parameters 详解
axis default 0指行,1为列
how {‘any', ‘all'}, default ‘any'指带缺失值的所有行;'all'指清除全是缺失值的行
thresh int,保留含有int个非空值的行
subset 对特定的列进行缺失值删除处理
inplace 这个很常见,True表示就地更改

补充:Python-pandas的dropna()方法-丢弃含空值的行、列

0.摘要

dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。

1.函数详解

函数形式:dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数:

axis:轴。0或'index',表示按行删除;1或'columns',表示按列删除。

how:筛选方式。‘any',表示该行/列只要有一个以上的空值,就删除该行/列;‘all',表示该行/列全部都为空值,就删除该行/列。

thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。

subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index',subset中元素为列的索引;如果axis=1或者‘column',subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

2.示例

创建DataFrame数据:

import numpy as np
import pandas as pd
 
a = np.ones((11,10))
for i in range(len(a)):
    a[i,:i] = np.nan
 
d = pd.DataFrame(data=a)
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:存在空值,即删除该行

# 按行删除:存在空值,即删除该行
print(d.dropna(axis=0, how='any'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:所有数据都为空值,即删除该行

#  按行删除:所有数据都为空值,即删除该行
print(d.dropna(axis=0, how='all'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按列删除:该列非空元素小于5个的,即删除该列

# 按列删除:该列非空元素小于5个的,即删除该列
print(d.dropna(axis='columns', thresh=5))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第0、5、6、7列都为空的行

# 设置子集:删除第0、5、6、7列都为空的行
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第5、6、7行存在空值的列

# 设置子集:删除第5、6、7行存在空值的列
print(d.dropna(axis=1, how='any', subset=[5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

原地修改

# 原地修改
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python处理JSON数据并生成条形图
Aug 05 Python
python斐波那契数列的计算方法
Sep 27 Python
在Python中将函数作为另一个函数的参数传入并调用的方法
Jan 22 Python
Python OpenCV实现视频分帧
Jun 01 Python
关于Python 的简单栅格图像边界提取方法
Jul 05 Python
python OpenCV GrabCut使用实例解析
Nov 11 Python
python GUI库图形界面开发之PyQt5线程类QThread详细使用方法
Feb 26 Python
python统计文章中单词出现次数实例
Feb 27 Python
TensorFlow实现批量归一化操作的示例
Apr 22 Python
Python离线安装各种库及pip的方法
Nov 28 Python
python opencv通过按键采集图片源码
May 20 Python
Jupyter notebook 更改文件打开的默认路径操作
May 21 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
MATLAB 全景图切割及盒图显示的实现步骤
使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull())
May 14 #Python
PyQt5爬取12306车票信息程序的实现
python flask框架快速入门
如何将numpy二维数组中的np.nan值替换为指定的值
May 14 #Python
使用numpy nonzero 找出非0元素
May 14 #Python
You might like
PHP 5.0对象模型深度探索之绑定
2006/09/05 PHP
php类中的各种拦截器用法分析
2014/11/03 PHP
PHP SPL标准库之接口(Interface)详解
2015/05/11 PHP
php解决和避免form表单重复提交的几种方法
2016/08/31 PHP
php foreach如何跳出两层循环(详解)
2016/11/05 PHP
用javascript将数据库中的TEXT类型数据动态赋值到TEXTAREA中
2007/04/20 Javascript
ExtJs事件机制基本代码模型和流程解析
2010/10/24 Javascript
javascript数字时钟示例分享
2014/04/23 Javascript
调整小数的格式保留小数点后两位
2014/05/14 Javascript
谷歌浏览器不支持showModalDialog模态对话框的解决方法
2014/09/22 Javascript
jquery实现滑屏大图定时收缩为小banner图片的广告代码
2015/09/02 Javascript
JavaScript iframe数据共享接口实现方法
2016/01/06 Javascript
Angular动态绑定样式及改变UI框架样式的方法小结
2018/09/03 Javascript
详解Vue项目在其他电脑npm run dev运行报错的解决方法
2018/10/29 Javascript
微信小程序实现图片上传
2019/05/23 Javascript
layer.msg()去掉默认时间,实现手动关闭的方法
2019/09/12 Javascript
vue excel上传预览和table内容下载到excel文件中
2019/12/10 Javascript
JS JQuery获取data-*属性值方法解析
2020/09/01 jQuery
用Python代码来解图片迷宫的方法整理
2015/04/02 Python
python入门基础之用户输入与模块初认识
2016/11/14 Python
详解Python各大聊天系统的屏蔽脏话功能原理
2016/12/01 Python
Django如何实现内容缓存示例详解
2017/09/24 Python
Python操作Oracle数据库的简单方法和封装类实例
2018/05/07 Python
Python二元算术运算常用方法解析
2020/09/15 Python
python 实现IP子网计算
2021/02/18 Python
美国正版电视节目和电影在线观看:Hulu
2018/05/24 全球购物
Myprotein法国官网:欧洲第一运动营养品牌
2019/03/26 全球购物
德国足球商店:OUTFITTER
2019/05/06 全球购物
Armor Lux法国官方网站:水手服装、成衣和内衣
2020/05/26 全球购物
餐饮管理自我介绍信
2014/01/15 职场文书
期末自我鉴定
2014/01/23 职场文书
应聘护理专业毕业自荐书范文
2014/02/12 职场文书
学习“七一”讲话精神体会
2014/07/08 职场文书
2015年六一儿童节活动总结
2015/02/11 职场文书
会计工作自我鉴定范文
2019/06/21 职场文书
JS监听Esc 键触发事键
2021/04/14 Javascript