进行数据处理的6个 Python 代码块分享


Posted in Python onApril 06, 2022

前言:

大家好,今天和大家分享自己总结的6个常用的 Python 数据处理代码,对于经常处理数据的coder最好熟练掌握。

1、选取有空值的行

在观察数据结构时,该方法可以快速定位存在缺失值的行。

df = pd.DataFrame({'A': [0, 1, 2],
                   'B': [0, 1, None],
                   'C': [0, None, 2]})
df[df.isnull().T.any()]

输出:

  A   B   C           A   B   C
0 0 0.0 0.0         1 1 1.0 NaN
1 1 1.0 NaN   -->   2 2 NaN 2.0
2 2 NaN 2.0

2、快速替换列值

实际数据处理经常会根据一些限定条件来替换列中的值。

df = pd.DataFrame({'name':['Python', 'Java', 'C']})

# 第一种方式
df['name'].replace('Java', 'JavaScript', inplace=True)
# 第二种方式
df.loc[df['name'].str.contains('Java'), 'name'] = 'JavaScript'

输出:

     name                   name
0  Python          0      Python
1    Java    --->  1  JavaScript
2       C          2           C

3、对列进行分区

很多情况下,对于数值类型的数据,我们需要分区来计算每个区间数据出现的频率。这时用 pd.cut 就能很好的解决这一问题。

import random

age = random.sample(range(90), 20)
cut_res = pd.cut(age, bins=[0, 18, 35, 60, 90])
# cut_res type:<class 'pandas.core.arrays.categorical.Categorical'>
cut_res.value_counts()

输出:

(0, 18]     6
(18, 35]    1
(35, 60]    6
(60, 90]    7

4、将一列分为多列

在文本数据清洗时,一些列中存在分隔符(‘’, ‘,’, ‘:’)分隔的值,我们只需将该列根据分隔符进行 split 即可。

import pandas as pd

df = pd.DataFrame({'address': ['四川省 成都市',
                               '湖北省 武汉市',
                               '浙江省 杭州市']})
res = df['address'].str.split(' ', expand=True)  
res.columns = ['province', 'city']

输出:

  province city
0 四川省    成都市
1 湖北省    武汉市
2 浙江省    杭州市

expand参数选择是否扩展为 DataFrame,False 则返回 Series

5、中文筛选

同样在清洗过程中,往往会出现一些不需要的中文字段,这时直接用 str.contains 筛选即可。

df = pd.DataFrame({'mobile_phone':
                   ['15928765644',
                    '15567332235',
                    '暂无']})
df[~df['mobile_phone'].str.contains('[\u4e00-\u9fa5]')]

输出:

  mobile_phone         mobile_phone
0 15928765644        0 15928765644
1 15567332235   -->  1 15567332235
2 暂无

6、更改列的位置

有时我们需要调整列的位置,当数据列较少时,可以用下面的方式

df = pd.DataFrame({'name': ['A', 'B', 'C'],
                   'age': [10, 20, 30],
                   'gender': [0, 1, 0]})
df = df[['name', 'gender', 'age']]

输出:

 name age gender    name gender age
0   A  10 0        0   A 0       10
1   B  20 1   -->  1   B 1       20
2   C  30 0        2   C 0       30

如果列较多,那么,一个个列举出来会比较繁琐,推荐下面插入的方式。

col = df['gender']
df.drop('gender', axis=1, inplace=True)
df.insert(1, 'gender', col)

到此这篇关于进行数据处理的6个 Python 代码块分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python笔记(1) 关于我们应不应该继续学习python
Oct 24 Python
python 性能提升的几种方法
Jul 15 Python
python 循环while和for in简单实例
Aug 16 Python
python实现FTP服务器服务的方法
Apr 11 Python
pycharm远程linux开发和调试代码的方法
Jul 17 Python
Python生成器generator用法示例
Aug 10 Python
Python enumerate函数功能与用法示例
Mar 01 Python
利用Tensorflow的队列多线程读取数据方式
Feb 05 Python
Python垃圾回收机制三种实现方法
Apr 27 Python
基于Tensorflow读取MNIST数据集时网络超时的解决方式
Jun 22 Python
记一次django内存异常排查及解决方法
Aug 07 Python
Python-split()函数实例用法讲解
Dec 18 Python
 分享一个Python 遇到数据库超好用的模块
Apr 06 #Python
Python利用capstone实现反汇编
关于Python中进度条的六个实用技巧分享
如何在Python中妥善使用进度条详解
Apr 05 #Python
Python接口自动化之文件上传/下载接口详解
Apr 05 #Python
关于python3 opencv 图像二值化的问题(cv2.adaptiveThreshold函数)
Python中使用Opencv开发停车位计数器功能
You might like
php表单提交问题的解决方法
2011/04/12 PHP
php中用加号与用array_merge合并数组的区别深入分析
2013/06/03 PHP
php中get_cfg_var()和ini_get()的用法及区别
2015/03/04 PHP
PHP crypt()函数的用法讲解
2019/02/15 PHP
PHP正则表达式处理函数(PCRE 函数)实例小结
2019/05/09 PHP
用htc组件制作windows选项卡
2007/01/13 Javascript
jquery 页面全选框实践代码
2010/04/02 Javascript
node.js中的fs.closeSync方法使用说明
2014/12/17 Javascript
jquery中checkbox全选失效的解决方法
2014/12/26 Javascript
javascript制作的简单注册模块表单验证
2015/04/13 Javascript
javascript用正则表达式过滤空格的实现代码
2016/06/14 Javascript
JavaScript制作简单分页插件
2016/09/11 Javascript
微信小程序 toast 详解及实例代码
2016/11/09 Javascript
浅谈对于react-thunk中间件的简单理解
2019/05/01 Javascript
JavaScript中的this基本问题实例小结
2020/03/09 Javascript
JS实现前端路由功能示例【原生路由】
2020/05/29 Javascript
Python实现过滤单个Android程序日志脚本分享
2015/01/16 Python
Python匹配中文的正则表达式
2016/05/11 Python
Python设计模式之中介模式简单示例
2018/01/09 Python
使用Python快速搭建HTTP服务和文件共享服务的实例讲解
2018/06/04 Python
Linux下Pycharm、Anaconda环境配置及使用踩坑
2018/12/19 Python
Python如何用wx模块创建文本编辑器
2020/06/07 Python
瑰珀翠美国官网:Crabtree & Evelyn美国
2016/11/29 全球购物
欧洲品牌瓷器餐具网上商店:Porzellantreff.de
2018/04/04 全球购物
Nike法国官方网站:Nike.com FR
2018/07/22 全球购物
《鸟的天堂》教学反思
2014/02/27 职场文书
党的群众路线教育实践活动宣传标语口号
2014/06/06 职场文书
环境科学专业教师求职信
2014/07/12 职场文书
浪漫婚礼主题活动策划方案
2014/09/15 职场文书
小区门卫的岗位职责
2014/09/26 职场文书
英语辞职信怎么写
2015/02/28 职场文书
食堂采购员岗位职责
2015/04/03 职场文书
2015年仓库管理员工作总结
2015/04/21 职场文书
圆明园纪录片观后感
2015/06/03 职场文书
企业法人任命书
2015/09/21 职场文书
导游词之井冈山
2019/11/20 职场文书