详解pandas如何去掉、过滤数据集中的某些值或者某些行?


Posted in Python onMay 15, 2019

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

0.导入我们需要使用的包

import pandas as pd

pandas是很常用的数据分析,数据处理的包。anaconda已经有这个包了,纯净版python的可以自行pip安装。

1.去掉某些具体值

数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。

import pandas as pd

df[(True-df['appPlatform'].isin([2]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

当然,有时候我们需要去掉不止一个值,这个时候只需要在isin([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。

df[(True-df['appID'].isin([278,382]))]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况。例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。

df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]

其实,在这里我们看到,就是由两部分组成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。两者取逻辑关系 与(&)

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

2.过滤掉某个范围的值

上面我们是了解了如何取掉某个具体值,下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。

df[df['creativeID']<=10000]

详解pandas如何去掉、过滤数据集中的某些值或者某些行?

另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(&)就可以,不过值得注意的是,每个条件要用括号()括起来。

以上所述是小编给大家介绍的pandas如何去掉、过滤数据集中的某些值或者某些行详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python查找相似单词的方法
Mar 05 Python
Python检测QQ在线状态的方法
May 09 Python
Python使用正则表达式获取网页中所需要的信息
Jan 29 Python
Python模块搜索路径代码详解
Jan 29 Python
浅谈Scrapy网络爬虫框架的工作原理和数据采集
Feb 07 Python
Python : turtle色彩控制实例详解
Jan 19 Python
python使用梯度下降算法实现一个多线性回归
Mar 24 Python
浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别
Jun 12 Python
关于python的缩进规则的知识点详解
Jun 22 Python
python 发送get请求接口详解
Nov 17 Python
Django中ORM的基本使用教程
Dec 22 Python
总结Pyinstaller打包的高级用法
Jun 28 Python
详解Python列表赋值复制深拷贝及5种浅拷贝
May 15 #Python
Python 20行简单实现有道在线翻译的详解
May 15 #Python
Python中的字符串切片(截取字符串)的详解
May 15 #Python
python3 property装饰器实现原理与用法示例
May 15 #Python
详解Python下载图片并保存本地的两种方式
May 15 #Python
Python常用模块之requests模块用法分析
May 15 #Python
Django框架实现的普通登录案例【使用POST方法】
May 15 #Python
You might like
超级简单的发送邮件程序
2006/10/09 PHP
让PHP以ROOT权限执行系统命令的方法
2011/02/10 PHP
php循环table实现一行两列显示的方法
2015/06/04 PHP
php简单生成一组与多组随机字符串的方法
2017/05/09 PHP
PHP 实现浏览记录并按日期分组
2017/05/11 PHP
Laravel5.* 打印出执行的sql语句的方法
2017/07/24 PHP
Gambit vs ForZe BO3 第三场 2.13
2021/03/10 DOTA
使用Java实现简单的server/client回显功能的方法介绍
2013/05/03 Javascript
关于extjs4如何获取grid修改后的数据的问题
2013/08/07 Javascript
javascript函数声明和函数表达式区别分析
2014/12/02 Javascript
JS实现将数字金额转换为大写人民币汉字的方法
2016/08/02 Javascript
在js代码拼接dom对象到页面上去的模板总结(必看)
2017/02/14 Javascript
JS去掉字符串前后空格、阻止表单提交的实现代码
2017/06/08 Javascript
jquery实现下拉菜单的手风琴效果
2017/07/23 jQuery
简述vue状态管理模式之vuex
2018/08/29 Javascript
[01:18:43]2014 DOTA2华西杯精英邀请赛5 24 iG VS DK
2014/05/25 DOTA
[01:22]DOTA2神秘商店携大量周边降临完美大师赛
2017/11/07 DOTA
[54:26]完美世界DOTA2联赛PWL S3 Forest vs Rebirth 第一场 12.10
2020/12/12 DOTA
Python利用前序和中序遍历结果重建二叉树的方法
2016/04/27 Python
详解Python3之数据指纹MD5校验与对比
2019/06/11 Python
在pandas中遍历DataFrame行的实现方法
2019/10/23 Python
Python连接HDFS实现文件上传下载及Pandas转换文本文件到CSV操作
2020/06/06 Python
使用keras实现孪生网络中的权值共享教程
2020/06/11 Python
python之pygame模块实现飞机大战完整代码
2020/11/29 Python
常用的HTML5列表标签
2017/06/20 HTML / CSS
Brora官网:英国领先的羊绒服装品牌
2019/08/28 全球购物
荷兰最大的多品牌男装连锁店:Adam Brandstore
2019/12/31 全球购物
Discard Protocol抛弃协议的作用是什么
2015/10/10 面试题
毕业学生推荐信
2013/12/01 职场文书
优秀班集体获奖感言
2014/02/03 职场文书
作风转变心得体会
2014/09/02 职场文书
2014年十一国庆节活动方案
2014/09/16 职场文书
“四风”问题整改措施和努力方向
2014/09/20 职场文书
社区学习党的群众路线教育实践活动心得体会
2014/11/03 职场文书
导游带团欢迎词
2015/09/30 职场文书
Java 在生活中的 10 大应用
2021/11/02 Java/Android