Pandas||过滤缺失数据||pd.dropna()函数的用法说明


Posted in Python onMay 14, 2021

看代码吧~

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.

pd.dropna()函数(官方文档)用于过滤数据中的缺失数据.

缺失数据在pandas中用NaN标记.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])        # 随机产生5行3列的数据    
df.ix[1, :-1] = np.nan        # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan
print(df)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

df.dropna()   #删除所有带缺失数据的行

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

parameters 详解
axis default 0指行,1为列
how {‘any', ‘all'}, default ‘any'指带缺失值的所有行;'all'指清除全是缺失值的行
thresh int,保留含有int个非空值的行
subset 对特定的列进行缺失值删除处理
inplace 这个很常见,True表示就地更改

补充:Python-pandas的dropna()方法-丢弃含空值的行、列

0.摘要

dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。

1.函数详解

函数形式:dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数:

axis:轴。0或'index',表示按行删除;1或'columns',表示按列删除。

how:筛选方式。‘any',表示该行/列只要有一个以上的空值,就删除该行/列;‘all',表示该行/列全部都为空值,就删除该行/列。

thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。

subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index',subset中元素为列的索引;如果axis=1或者‘column',subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。

inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

2.示例

创建DataFrame数据:

import numpy as np
import pandas as pd
 
a = np.ones((11,10))
for i in range(len(a)):
    a[i,:i] = np.nan
 
d = pd.DataFrame(data=a)
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:存在空值,即删除该行

# 按行删除:存在空值,即删除该行
print(d.dropna(axis=0, how='any'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按行删除:所有数据都为空值,即删除该行

#  按行删除:所有数据都为空值,即删除该行
print(d.dropna(axis=0, how='all'))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

按列删除:该列非空元素小于5个的,即删除该列

# 按列删除:该列非空元素小于5个的,即删除该列
print(d.dropna(axis='columns', thresh=5))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第0、5、6、7列都为空的行

# 设置子集:删除第0、5、6、7列都为空的行
print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

设置子集:删除第5、6、7行存在空值的列

# 设置子集:删除第5、6、7行存在空值的列
print(d.dropna(axis=1, how='any', subset=[5,6,7]))

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

原地修改

# 原地修改
print(d.dropna(axis=0, how='any', inplace=True))
print("==============================")
print(d)

Pandas||过滤缺失数据||pd.dropna()函数的用法说明

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
极简的Python入门指引
Apr 01 Python
python处理大数字的方法
May 27 Python
Mac中Python 3环境下安装scrapy的方法教程
Oct 26 Python
django2用iframe标签完成网页内嵌播放b站视频功能
Jun 20 Python
对python实现二维函数高次拟合的示例详解
Dec 29 Python
使用python绘制二元函数图像的实例
Feb 12 Python
Numpy数组array和矩阵matrix转换方法
Aug 05 Python
python各层级目录下import方法代码实例
Jan 20 Python
容易被忽略的Python内置类型
Sep 03 Python
python list的index()和find()的实现
Nov 16 Python
详解Python如何批量采集京东商品数据流程
Jan 22 Python
Python实现将多张图片合成MP4视频并加入背景音乐
Apr 28 Python
Python爬虫:从m3u8文件里提取小视频的正确操作
MATLAB 全景图切割及盒图显示的实现步骤
使用pandas或numpy处理数据中的空值(np.isnan()/pd.isnull())
May 14 #Python
PyQt5爬取12306车票信息程序的实现
python flask框架快速入门
如何将numpy二维数组中的np.nan值替换为指定的值
May 14 #Python
使用numpy nonzero 找出非0元素
May 14 #Python
You might like
php IP及IP段进行访问限制的代码
2008/12/17 PHP
php语言中使用json的技巧及json的实现代码详解
2015/10/27 PHP
php实现支付宝当面付(扫码支付)功能
2018/05/30 PHP
用javascript实现无刷新更新数据的详细步骤 asp
2006/12/26 Javascript
Javascript模块化编程(一)AMD规范(规范使用模块)
2013/01/17 Javascript
jquery教程限制文本框只能输入数字和小数点示例分享
2014/01/13 Javascript
JavaScript判断手机号运营商是移动、联通、电信还是其他(代码简单)
2015/09/25 Javascript
javascript伸缩型菜单实现代码
2015/11/16 Javascript
jQuery+css实现炫目的动态块漂移效果
2016/01/28 Javascript
jQuery设置Cookie及删除Cookie实例分析
2016/04/15 Javascript
jQuery自定义插件详解及实例代码
2016/12/29 Javascript
基于vue实现分页效果
2017/11/06 Javascript
vue系列之requireJs中引入vue-router的方法
2018/07/18 Javascript
vue中选项卡点击切换且能滑动切换功能的实现代码
2018/11/25 Javascript
vue返回上一页面时回到原先滚动的位置的方法
2018/12/20 Javascript
js的继承方法小结(prototype、call、apply)(推荐)
2019/04/17 Javascript
[49:31]DOTA2-DPC中国联赛 正赛 Elephant vs LBZS BO3 第二场 1月29日
2021/03/11 DOTA
ssh批量登录并执行命令的python实现代码
2012/05/25 Python
python中合并两个文本文件并按照姓名首字母排序的例子
2014/04/25 Python
python的re模块应用实例
2014/09/26 Python
Python内置函数 next的具体使用方法
2017/11/24 Python
Anaconda2 5.2.0安装使用图文教程
2018/09/19 Python
Python中包的用法及安装
2020/02/11 Python
Python3.6安装卸载、执行命令、执行py文件的方法详解
2020/02/20 Python
selenium设置浏览器为headless无头模式(Chrome和Firefox)
2021/01/08 Python
Beauty Expert美国/加拿大:购买奢侈美容产品
2018/12/05 全球购物
伦敦香水公司:The London Perfume Company
2019/11/13 全球购物
区域销售经理职责
2013/12/22 职场文书
十佳护士先进事迹
2014/05/08 职场文书
经济管理专业求职信
2014/06/09 职场文书
机关作风建设剖析材料
2014/10/11 职场文书
毕业论文指导教师评语
2014/12/30 职场文书
法院个人总结
2015/03/03 职场文书
2015年工程部工作总结
2015/04/30 职场文书
公司环境卫生管理制度
2015/08/05 职场文书
Python基础教程,Python入门教程(超详细)
2021/06/24 Python