详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python字符串详细介绍
May 09 Python
python生成验证码图片代码分享
Jan 28 Python
Python字符编码判断方法分析
Jul 01 Python
Python分支结构(switch)操作简介
Jan 17 Python
浅析python中的迭代与迭代对象
Oct 08 Python
详解python中TCP协议中的粘包问题
Mar 22 Python
python pyinstaller 加载ui路径方法
Jun 10 Python
Python 使用 Pillow 模块给图片添加文字水印的方法
Aug 30 Python
Python xlrd excel文件操作代码实例
Mar 10 Python
Pycharm连接远程服务器过程图解
Apr 30 Python
Python代码需要缩进吗
Jul 01 Python
pyqt5实现井字棋的示例代码
Dec 07 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
php中通过curl检测页面是否被百度收录
2013/09/27 PHP
Yii基于数组和对象的Model查询技巧实例详解
2015/12/28 PHP
PHP查询附近的人及其距离的实现方法
2016/05/11 PHP
js 有框架页面跳转(target)三种情况下的应用
2013/04/09 Javascript
jQuery动态显示和隐藏datagrid中的某一列的方法
2013/12/11 Javascript
网站内容禁止复制和粘贴、另存为的js代码
2014/02/26 Javascript
JavaScript使用Prototype实现面向对象的方法
2015/04/14 Javascript
JS实现新浪博客左侧的Blog管理菜单效果代码
2015/10/22 Javascript
Angularjs中UI Router的使用方法
2016/05/14 Javascript
Ajax使用原生态JS验证用户名是否存在
2020/05/26 Javascript
JavaScript运动框架 多物体任意值运动(三)
2017/05/17 Javascript
Angular2入门教程之模块和组件详解
2017/05/28 Javascript
关于jquery form表单序列化的注意事项详解
2017/08/01 jQuery
基于jQuery的左滑出现删除按钮的示例
2017/08/29 jQuery
jQuery中 DOM节点操作方法大全
2017/10/12 jQuery
微信小程序实现城市列表选择
2018/06/05 Javascript
js实现多个倒计时并行 js拼团倒计时
2019/02/25 Javascript
使用wxPython获取系统剪贴板中的数据的教程
2015/05/06 Python
Python实现短网址ShortUrl的Hash运算实例讲解
2015/08/10 Python
Python实现Sqlite将字段当做索引进行查询的方法
2016/07/21 Python
Python中pandas dataframe删除一行或一列:drop函数详解
2018/07/03 Python
python内置数据类型之列表操作
2018/11/12 Python
python+webdriver自动化环境搭建步骤详解
2019/06/03 Python
django获取from表单multiple-select的value和id的方法
2019/07/19 Python
PyQt5基本控件使用详解:单选按钮、复选框、下拉框
2019/08/05 Python
flask/django 动态查询表结构相同表名不同数据的Model实现方法
2019/08/29 Python
python 协程中的迭代器,生成器原理及应用实例详解
2019/10/28 Python
用Python实现校园通知更新提醒功能
2019/11/23 Python
个人求职信范文分享
2013/12/13 职场文书
国际贸易专业个人鉴定
2014/02/22 职场文书
国际语言毕业生求职信
2014/07/08 职场文书
校园环境卫生倡议书
2015/04/29 职场文书
初中政治教学反思
2016/02/23 职场文书
创业计划书之甜品店
2019/09/18 职场文书
导游词之江苏溱潼古镇
2019/11/27 职场文书
redis 存储对象的方法对比分析
2021/08/02 Redis