利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python字典get()方法用法分析
Apr 17 Python
Python中的ceil()方法使用教程
May 14 Python
如何用python整理附件
May 13 Python
python 限制函数执行时间,自己实现timeout的实例
Jan 12 Python
python开启debug模式的方法
Jun 27 Python
python创建子类的方法分析
Nov 28 Python
python wxpython 实现界面跳转功能
Dec 17 Python
关于ResNeXt网络的pytorch实现
Jan 14 Python
python实现字符串和数字拼接
Mar 02 Python
Python lambda表达式原理及用法解析
Aug 18 Python
详解Python模块化编程与装饰器
Jan 16 Python
Python 处理表格进行成绩排序的操作代码
Jul 26 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
php中的时间处理
2006/10/09 PHP
PHP的FTP学习(三)
2006/10/09 PHP
php 文章采集正则代码
2009/12/28 PHP
php实现向javascript传递数组的方法
2015/07/27 PHP
php简单统计在线人数的方法
2016/05/10 PHP
php中namespace及use用法分析
2016/12/06 PHP
PHP容器类的两种实现方式示例
2019/07/24 PHP
关于PHP求解三数之和问题详析
2020/11/09 PHP
JavaScript中的Document文档对象
2008/01/16 Javascript
js 一个关于图片onload加载的事
2013/11/10 Javascript
扩展JS Date对象时间格式化功能的小例子
2013/12/02 Javascript
JavaScript变量声明详解
2014/11/27 Javascript
超级简单的jquery操作表格方法
2014/12/15 Javascript
javascript中的正则表达式使用指南
2015/03/01 Javascript
简述Jquery与DOM对象
2015/07/10 Javascript
原生JavaScript实现Ajax的方法
2016/04/07 Javascript
在 Angular2 中实现自定义校验指令(确认密码)的方法
2017/01/23 Javascript
vue页面使用阿里oss上传功能的实例(一)
2017/08/09 Javascript
Bootstrap table使用方法汇总
2017/11/17 Javascript
浅析Vue自定义组件的v-model
2017/11/26 Javascript
使用vue如何构建一个自动建站项目
2018/02/05 Javascript
JavaScript基础之this和箭头函数详析
2019/09/05 Javascript
js实现头像上传并且可预览提交
2020/12/25 Javascript
Python tkinter和exe打包的方法
2020/02/05 Python
Python 动态变量名定义与调用方法
2020/02/09 Python
多个python文件调用logging模块报错误
2020/02/12 Python
Django之腾讯云短信的实现
2020/06/12 Python
浅谈html5标签css3的常用样式
2016/10/20 HTML / CSS
eBay加拿大站:eBay.ca
2019/06/20 全球购物
编写类String 的构造函数、析构函数和赋值函数
2012/09/09 面试题
环境日宣传活动总结
2014/07/09 职场文书
金秋助学感谢信
2015/01/21 职场文书
2015年国庆节慰问信
2015/03/23 职场文书
学校隐患排查制度
2015/08/05 职场文书
小学生节约用水倡议书
2019/08/12 职场文书
CSS中实现动画效果-附案例
2022/02/28 HTML / CSS