利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python交换变量
Sep 06 Python
零基础写python爬虫之HTTP异常处理
Nov 05 Python
Python实现删除当前目录下除当前脚本以外的文件和文件夹实例
Jul 27 Python
Python实现列表转换成字典数据结构的方法
Mar 11 Python
Python实现PS图像明亮度调整效果示例
Jan 23 Python
jupyter notebook 中输出pyecharts图实例
Apr 23 Python
Python列表与元组的异同详解
Jul 02 Python
Python 使用matplotlib模块模拟掷骰子
Aug 08 Python
Python实现加密的RAR文件解压的方法(密码已知)
Sep 11 Python
基于Python爬取股票数据过程详解
Oct 21 Python
jupyter notebook快速入门及使用详解
Nov 13 Python
Python合并pdf文件的工具
Jul 01 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
php 正则表达式小结
2009/08/31 PHP
PHP数据库链接类(PDO+Access)实例分享
2013/12/05 PHP
php绘图之生成饼状图的方法
2015/01/24 PHP
PHP的cURL库简介及使用示例
2015/02/06 PHP
php ajax异步读取rss文档数据
2016/03/29 PHP
PHP模板引擎Smarty之配置文件在模板变量中的使用方法示例
2016/04/11 PHP
Yii框架中sphinx索引配置方法解析
2016/10/18 PHP
javascript 简单高效判断数据类型 系列函数 By shawl.qiu
2007/03/06 Javascript
JS 页面自动加载函数(兼容多浏览器)
2009/05/18 Javascript
数组Array进行原型prototype扩展后带来的for in遍历问题
2010/02/07 Javascript
五段实用的js高级技巧
2011/12/20 Javascript
js获取某元素的class里面的css属性值代码
2014/01/16 Javascript
javascript操作表格排序实例分析
2015/05/06 Javascript
js实现一个链接打开两个链接地址的方法
2015/05/12 Javascript
JavaScript几种数组去掉重复值的方法推荐
2016/04/12 Javascript
JS常用函数和常用技巧小结
2016/10/15 Javascript
Vue的Flux框架之Vuex状态管理器
2017/07/30 Javascript
Angular实现响应式表单
2017/08/04 Javascript
NodeJS收发GET和POST请求的示例代码
2017/08/25 NodeJs
jQuery中ajax请求后台返回json数据并渲染HTML的方法
2018/08/08 jQuery
微信小程序实现工作时间段选择
2019/02/15 Javascript
JS实现页面跳转与刷新的方法汇总
2019/08/30 Javascript
[01:33]一分钟玩转DOTA2第三弹:DOTA2&DotA快捷操作大对比
2014/06/04 DOTA
Python中类的定义、继承及使用对象实例详解
2015/04/30 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
2020/03/04 Python
python将数据插入数据库的代码分享
2020/08/16 Python
Python 2.6.6升级到Python2.7.15的详细步骤
2020/12/14 Python
用CSS3实现瀑布流布局的示例代码
2017/11/10 HTML / CSS
css3利用transform变形结合事件完成扇形导航
2020/10/26 HTML / CSS
Lenox官网:精美的瓷器&独特的礼品
2017/02/12 全球购物
Linux如何压缩可执行文件
2013/10/21 面试题
给导游的表扬信
2014/01/10 职场文书
2014最新离职证明范本
2014/09/12 职场文书
工作表扬信
2015/01/17 职场文书
学校2016年九九重阳节活动总结
2016/04/01 职场文书
python实现语音常用度量方法的代码详解
2021/05/25 Python