Python数据处理的三个实用技巧分享


Posted in Python onApril 01, 2022

我使用的 Pandas 版本如下,顺便也导入 Pandas 库。

>>> import pandas as pd
>>> pd.__version__
'0.25.1'

在开始前先确保解释器和数据集在同一目录下:

>>> import os
>>> os.chdir('D://source/dataset') # 这是我的数据集所在目录
>>> os.listdir() # 确认此目录已经存在 IMDB-Movie-Data 数据集
['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']

准备工作就位后,正式开始数据处理技巧之旅。

1 Pandas 移除某列

导入数据

>>> df = pd.read_csv("IMDB-Movie-Data.csv")
>>> df.head(1) # 导入并显示第一行
   Rank                    Title                    Genre  ...   Votes Revenue (Millions) Metascore
0     1  Guardians of the Galaxy  Action,Adventure,Sci-Fi  ...  757074             333.13      76.0

[1 rows x 12 columns]

使用 pop 方法移除指定列:

>>> meta = df.pop("Title").to_frame() # 移除 Title 列

确认是否已被移除:

>>> df.head(1) # df 变为 11列
   Rank                    Genre  ... Revenue (Millions) Metascore
0     1  Action,Adventure,Sci-Fi  ...             333.13      76.0

[1 rows x 11 columns]

2 统计标题单词数

pop 后得到 meta,显示 meta 前 3 行:

>>> meta.head(3)
                     Title
0  Guardians of the Galaxy
1               Prometheus
2                    Split

标题是由单词组成,中间用空格分隔。

# .str.count(" ") + 1 得到单词个数 
>>> meta["words_count"] = meta["Title"].str.count(" ") + 1 
>>> meta.head(3) # words_count 列代表单词个数
                     Title  words_count
0  Guardians of the Galaxy            4
1               Prometheus            1
2                    Split            1

3 Genre 频次统计

下面统计电影 Genre 的频次,

>>> vc = df["Genre"].value_counts()

下面显示电影 Genre 的 Top5 ,最高频为出现 50 次的 Action,Adventure,Sci-Fi 类,次之为 48 次的 Drama 类:

>>> vc.head()
Action,Adventure,Sci-Fi    50
Drama                      48
Comedy,Drama,Romance       35
Comedy                     32
Drama,Romance              31
Name: Genre, dtype: int64

展示 Top5 的饼状图:

>>> import matplotlib.pyplot as plt
>>> vc[:5].plot(kind='pie')
<matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948>
>>> plt.show()

Python数据处理的三个实用技巧分享

到此这篇关于Python数据处理的三个实用技巧分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现简单HTML表格解析的方法
Jun 15 Python
python 编程之twisted详解及简单实例
Jan 28 Python
Python新手入门最容易犯的错误总结
Apr 24 Python
详解Golang 与python中的字符串反转
Jul 21 Python
Python基于回溯法子集树模板解决取物搭配问题实例
Sep 02 Python
Python编程pygame模块实现移动的小车示例代码
Jan 03 Python
详解关于Django中ORM数据库迁移的配置
Oct 08 Python
对pandas中时间窗函数rolling的使用详解
Nov 28 Python
Python3爬虫学习之爬虫利器Beautiful Soup用法分析
Dec 12 Python
复化梯形求积分实例——用Python进行数值计算
Nov 20 Python
python中元组的用法整理
Jun 15 Python
Python读写压缩文件的方法
Jul 30 Python
Python+Tkinter打造签名设计工具
Python正则表达式中flags参数的实例详解
Apr 01 #Python
Python+Tkinter制作专属图形化界面
Pyhton爬虫知识之正则表达式详解
python 离散点图画法的实现
Python学习之迭代器详解
Python实战之大鱼吃小鱼游戏的实现
You might like
PHP中IP地址与整型数字互相转换详解
2014/08/20 PHP
php获取文件名后缀常用方法小结
2015/02/24 PHP
php使用Imagick生成图片的方法
2015/07/31 PHP
Laravel中日期时间处理包Carbon的简单使用
2017/09/21 PHP
PHP基于自定义函数生成笛卡尔积的方法示例
2017/09/30 PHP
PHP unlink与rmdir删除目录及目录下所有文件实例代码
2018/02/07 PHP
打开超链需要“确认”对话框的方法
2007/03/08 Javascript
JQUERY CHECKBOX全选,取消全选,反选方法三
2008/08/30 Javascript
Javascript下判断是否为闰年的Datetime包
2010/10/26 Javascript
JavaScript设计模式之工厂方法模式介绍
2014/12/28 Javascript
初步认识JavaScript函数库jQuery
2015/06/18 Javascript
jQuery on()方法绑定动态元素的点击事件实例代码浅析
2016/06/16 Javascript
Vue.js绑定HTML class数组语法错误的原因分析
2016/10/19 Javascript
JS弹出窗口的运用与技巧大全
2016/11/01 Javascript
基于vuejs+webpack的日期选择插件
2020/05/21 Javascript
bootstrap提示标签、提示框实现代码
2016/12/28 Javascript
js实现随机点名系统(实例讲解)
2017/10/18 Javascript
详解Angular5路由传值方式及其相关问题
2018/04/28 Javascript
vue实现图片懒加载的方法分析
2020/02/05 Javascript
JavaScript实现指定数量的并发限制的示例代码
2020/03/10 Javascript
[01:45]2014DOTA2 TI预选赛预选赛 战前探营!
2014/05/21 DOTA
[01:36]DOTA2完美大师赛趣味视频之与队友相处的十万个技巧
2017/11/19 DOTA
图文讲解选择排序算法的原理及在Python中的实现
2016/05/04 Python
Python中利用Scipy包的SIFT方法进行图片识别的实例教程
2016/06/03 Python
详解基于python-django框架的支付宝支付案例
2019/09/23 Python
python DataFrame转dict字典过程详解
2019/12/26 Python
Python-openCV开运算实例
2020/07/05 Python
用ldap作为django后端用户登录验证的实现
2020/12/07 Python
python requests库的使用
2021/01/06 Python
韩国三大免税店之一:THE GRAND 中文免税店
2016/07/21 全球购物
同学聚会策划方案
2014/06/06 职场文书
摄影专业毕业生求职信
2014/08/05 职场文书
2014小学二年级班主任工作总结
2014/12/05 职场文书
村官个人总结范文
2015/03/03 职场文书
2019已经过半,你知道年中工作总结该怎么写吗?
2019/07/03 职场文书
教你一步步实现一个简易promise
2021/11/02 Javascript