pandas中read_csv的缺失值处理方式


Posted in Python onDecember 19, 2019

今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。

例:

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python删除指定目录下过期文件的2个脚本分享
Apr 10 Python
Python lambda和Python def区别分析
Nov 30 Python
python实现中文输出的两种方法
May 09 Python
详解python中的json和字典dict
Jun 22 Python
python使用Matplotlib画条形图
Mar 25 Python
Python supervisor强大的进程管理工具的使用
Apr 24 Python
使用python实现简单五子棋游戏
Jun 18 Python
python re.sub()替换正则的匹配内容方法
Jul 22 Python
pandas apply多线程实现代码
Aug 17 Python
Django+Django-Celery+Celery的整合实战
Jan 20 Python
Jupyter安装拓展nbextensions及解决官网下载慢的问题
Mar 03 Python
Python Flask搭建yolov3目标检测系统详解流程
Nov 07 Python
python错误调试及单元文档测试过程解析
Dec 19 #Python
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
Dec 19 #Python
解决Python列表字符不区分大小写的问题
Dec 19 #Python
简单了解为什么python函数后有多个括号
Dec 19 #Python
解决Python使用列表副本的问题
Dec 19 #Python
python读写Excel表格的实例代码(简单实用)
Dec 19 #Python
python装饰器原理与用法深入详解
Dec 19 #Python
You might like
php将会员数据导入到ucenter的代码
2010/07/18 PHP
php set_time_limit()函数的使用详解
2013/06/05 PHP
PHP响应post请求上传文件的方法
2015/12/17 PHP
JS面向对象编程 for Cookie
2010/09/19 Javascript
JavaScript建立一个语法高亮输入框实现思路
2013/02/26 Javascript
JS onmousemove鼠标移动坐标接龙DIV效果实例
2013/12/16 Javascript
详解node.js平台下Express的session与cookie模块包的配置
2017/04/26 Javascript
JavaScript正则表达式和级联效果
2017/09/14 Javascript
JS实现按钮颜色切换效果
2020/09/05 Javascript
浅谈React深度编程之受控组件与非受控组件
2017/12/26 Javascript
浅谈super-vuex使用体验
2018/06/25 Javascript
微信小程序chooseImage的用法(从本地相册选择图片或使用相机拍照)
2018/08/22 Javascript
[02:48]DOTA2英雄基础教程 拉席克
2013/12/12 DOTA
python中enumerate函数用法实例分析
2015/05/20 Python
举例讲解Python中的死锁、可重入锁和互斥锁
2015/11/05 Python
python批量制作雷达图的实现方法
2016/07/26 Python
Python增量循环删除MySQL表数据的方法
2016/09/23 Python
Django Admin实现三级联动的示例代码(省市区)
2018/06/22 Python
10分钟用python搭建一个超好用的CMDB系统
2019/07/17 Python
python中如何实现将数据分成训练集与测试集的方法
2019/09/13 Python
python3 tkinter实现添加图片和文本
2019/11/26 Python
Python计算公交发车时间的完整代码
2020/02/12 Python
解决pytorch-yolov3 train 报错的问题
2020/02/18 Python
Python Opencv 通过轨迹(跟踪)栏实现更改整张图像的背景颜色
2020/03/09 Python
UGG雪地靴荷兰官网:UGG荷兰
2016/09/09 全球购物
英国时尚家具、家居饰品及礼品商店:Graham & Green
2016/09/15 全球购物
100%植物性、有机、即食餐:Sakara Life
2018/10/25 全球购物
银行学习十八大感想
2014/01/11 职场文书
小学教师事迹材料
2014/01/13 职场文书
买房委托公证书
2014/04/08 职场文书
结婚保证书(卖身契)
2015/02/26 职场文书
辞职信标准格式
2015/02/27 职场文书
一文搞懂python异常处理、模块与包
2021/06/26 Python
victoriaMetrics库布隆过滤器初始化及使用详解
2022/04/05 Golang
netty 实现tomcat的示例代码
2022/06/05 Servers
JavaScript实现音乐播放器
2022/08/14 Javascript