利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
详解在Python中处理异常的教程
May 24 Python
python变量不能以数字打头详解
Jul 06 Python
python Spyder界面无法打开的解决方法
Apr 27 Python
用python编写第一个IDA插件的实例
May 29 Python
对python mayavi三维绘图的实现详解
Jan 08 Python
linux查找当前python解释器的位置方法
Feb 20 Python
Python2与Python3的区别实例分析
Apr 11 Python
在flask中使用python-dotenv+flask-cli自定义命令(推荐)
Jan 05 Python
使用python图形模块turtle库绘制樱花、玫瑰、圣诞树代码实例
Mar 16 Python
PySide2出现“ImportError: DLL load failed: 找不到指定的模块”的问题及解决方法
Jun 10 Python
Python爬虫小例子——爬取51job发布的工作职位
Jul 10 Python
Python如何截图保存的三种方法(小结)
Sep 01 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
php过滤危险html代码
2008/08/18 PHP
php smarty truncate UTF8乱码问题解决办法
2014/06/13 PHP
用 Composer构建自己的 PHP 框架之设计 MVC
2014/10/30 PHP
javascript操作数组详解
2014/12/17 Javascript
JQuery控制div外点击隐藏而div内点击不会隐藏的方法
2015/01/13 Javascript
jquery实现兼容IE8的异步上传文件
2015/06/15 Javascript
jQuery实现百叶窗焦点图动画效果代码分享(附源码下载)
2016/03/14 Javascript
Bootstrap Table服务器分页与在线编辑应用总结
2016/08/08 Javascript
JavaScript自定义函数实现查找两个字符串最长公共子串的方法
2016/11/24 Javascript
JS中用try catch对代码运行的性能影响分析
2016/12/26 Javascript
浅谈vue引入css,less遇到的坑和解决方法
2018/01/20 Javascript
js实现动态改变radio状态的方法
2018/02/28 Javascript
Vue仿微信app页面跳转动画效果
2019/08/21 Javascript
浅谈实现在线预览PDF的几种解决办法
2020/08/10 Javascript
微信小程序实现自定义动画弹框/提示框的方法实例
2020/11/06 Javascript
JavaScript 防盗链的原理以及破解方法
2020/12/29 Javascript
python批量生成本地ip地址的方法
2015/03/23 Python
Python3数据库操作包pymysql的操作方法
2018/07/16 Python
Python中的类与类型示例详解
2019/07/10 Python
Python 在OpenCV里实现仿射变换—坐标变换效果
2019/08/30 Python
Python中生成一个指定长度的随机字符串实现示例
2019/11/06 Python
从多个tfrecord文件中无限读取文件的例子
2020/02/17 Python
Python实现aes加密解密多种方法解析
2020/05/15 Python
五款漂亮的纯CSS3动画按钮的实例教程
2014/11/21 HTML / CSS
哈萨克斯坦最大的时装、鞋子和配饰在线商店:Lamoda.kz
2019/11/19 全球购物
计算机个人求职信范例
2014/01/24 职场文书
《夏夜多美》教学反思
2014/02/17 职场文书
小学清明节活动总结
2014/07/04 职场文书
社区创先争优承诺书
2014/08/30 职场文书
行政执法队伍作风整顿个人剖析材料
2014/10/11 职场文书
技术股东合作协议书
2014/12/02 职场文书
2015年社区妇联工作总结
2015/04/21 职场文书
聘用合同范本
2015/09/21 职场文书
节水宣传标语口号
2015/12/26 职场文书
用Python远程登陆服务器的步骤
2021/04/16 Python
Python+Selenium实现读取网易邮箱验证码
2022/03/13 Python