python缺失值填充方法示例代码


Posted in Python onDecember 24, 2022

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值(数据集中异常值为“-”)

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数,确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

python缺失值填充方法示例代码

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,

.any()表示只要按行或列计算,有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时,一列有多个缺失值,同理,计算行缺失,计算有多少个行

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

  • dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作,axis=1:对列删除进行操作
how=‘any’:表示维度 存在“缺失值”就删除相应行/列操作;how=‘all’:进行相关行或列删除操作时,只有所有维度缺失才删除
thresh=None:等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False:表示对原来的数据集不进行操作,True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

  • fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:将前面的值填充于后面位置。
backfill’, 'bfill:表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python三种遍历文件目录的方法实例代码
Jan 19 Python
基于Django用户认证系统详解
Feb 21 Python
使用anaconda的pip安装第三方python包的操作步骤
Jun 11 Python
python numpy和list查询其中某个数的个数及定位方法
Jun 27 Python
用Python编写一个高效的端口扫描器的方法
Dec 20 Python
详解Python基础random模块随机数的生成
Mar 23 Python
OpenCV里的imshow()和Matplotlib.pyplot的imshow()的实现
Nov 25 Python
使用OpenCV获取图片连通域数量,并用不同颜色标记函
Jun 04 Python
python为什么会环境变量设置不成功
Jun 23 Python
Python __slots__的使用方法
Nov 15 Python
python自动打开浏览器下载zip并提取内容写入excel
Jan 04 Python
python中scipy.stats产生随机数实例讲解
Feb 19 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 #Python
Python find()、rfind()方法及作用
Dec 24 #Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 #Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
You might like
PHP array 的加法操作代码
2010/07/24 PHP
php入门学习知识点五 关于php数组的几个基本操作
2011/07/14 PHP
合格的PHP程序员必备技能
2015/11/13 PHP
Smarty模板简单配置与使用方法示例
2016/05/23 PHP
PHP flush 函数使用注意事项
2016/08/26 PHP
php遍历目录下文件并按修改时间排序操作示例
2019/07/12 PHP
用脚本调用样式的几种方法
2006/12/09 Javascript
JavaScript 笔记二 Array和Date对象方法
2010/05/22 Javascript
jQuery类选择器用法实例
2014/12/23 Javascript
js中this的用法实例分析
2015/01/10 Javascript
JS实现鼠标点击展开或隐藏表格行的方法
2015/03/03 Javascript
Angular Js文件上传之form-data
2015/08/28 Javascript
JS实现网页标题栏显示当前时间和日期的完整代码
2015/11/02 Javascript
详解本地Node.js服务器作为api服务器的解决办法
2017/02/28 Javascript
浅谈js中startsWith 函数不能在任何浏览器兼容的问题
2017/03/01 Javascript
Angular 4依赖注入学习教程之ValueProvider的使用(七)
2017/06/04 Javascript
Angular限制input框输入金额(是小数的话只保留两位小数点)
2017/07/13 Javascript
jQuery实现可兼容IE6的滚动监听功能
2017/09/20 jQuery
bootstrap响应式导航条模板使用详解(含下拉菜单,弹出框)
2017/11/17 Javascript
vue脚手架搭建过程图解
2018/06/06 Javascript
JS正则表达式封装与使用操作示例
2019/05/15 Javascript
ligerUI的ligerDialog关闭刷新的方法
2019/09/27 Javascript
[01:02:07]Liquid vs Newbee 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
Python实现绘制双柱状图并显示数值功能示例
2018/06/23 Python
pycharm远程linux开发和调试代码的方法
2018/07/17 Python
pygame游戏之旅 如何制作游戏障碍
2018/11/20 Python
使用Pytorch来拟合函数方式
2020/01/14 Python
乐天旅游台湾网站:Rakuten Travel TW
2017/06/01 全球购物
Helly Hansen工作服美国官方网上商店:为最恶劣的环境
2019/09/04 全球购物
刑事辩护授权委托书
2014/09/13 职场文书
职工擅自离岗检讨书
2014/09/23 职场文书
2015年小学美术工作总结
2015/05/25 职场文书
硕士毕业答辩开场白
2015/05/27 职场文书
小兵张嘎电影观后感
2015/06/03 职场文书
2016年中秋节晚会领导致辞
2015/11/26 职场文书
Python中request的基本使用解决乱码问题
2022/04/12 Python