python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Windows下使Python2.x版本的解释器与3.x共存的方法
Oct 25 Python
详解Python中open()函数指定文件打开方式的用法
Jun 04 Python
python的random模块及加权随机算法的python实现方法
Jan 04 Python
K-means聚类算法介绍与利用python实现的代码示例
Nov 13 Python
django在接受post请求时显示403forbidden实例解析
Jan 25 Python
详解Python3.6安装psutil模块和功能简介
May 30 Python
在IPython中进行Python程序执行时间的测量方法
Nov 01 Python
Python数据结构之栈、队列及二叉树定义与用法浅析
Dec 27 Python
安装docker-compose的两种最简方法
Jul 30 Python
解决Keras TensorFlow 混编中 trainable=False设置无效问题
Jun 28 Python
Django+Django-Celery+Celery的整合实战
Jan 20 Python
使用python绘制横竖条形图
Apr 21 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
PHP数组交集的优化代码分析
2011/03/06 PHP
函数中使用require_once问题深入探讨 优雅的配置文件定义方法推荐
2014/07/02 PHP
PHP生成指定范围内的N个不重复的随机数
2019/03/18 PHP
laravel框架查询数据集转为数组的两种方法
2019/10/10 PHP
超级酷和最实用的jQuery实例收集(20个)
2010/04/21 Javascript
jQuery插件分享之分页插件jqPagination
2014/06/06 Javascript
jQuery实现响应浏览器缩放大小并改变背景颜色
2014/10/31 Javascript
js跨域问题浅析及解决方法优缺点对比
2014/11/08 Javascript
jQuery中closest和parents的区别分析
2015/05/07 Javascript
浅析Node.js 中 Stream API 的使用
2015/10/23 Javascript
常用原生JS兼容性写法汇总
2016/04/27 Javascript
js根据手机客户端浏览器类型,判断跳转官网/手机网站多个实例代码
2016/04/30 Javascript
Three.js的使用及绘制基础3D图形详解
2017/04/27 Javascript
js中如何完美的解析数据
2018/03/18 Javascript
BootStrap table实现表格行拖拽效果
2018/12/01 Javascript
详解Vue 全局变量,局部变量
2019/04/17 Javascript
解决Vue+Electron下Vuex的Dispatch没有效果问题
2019/05/20 Javascript
vue实现带复选框的树形菜单
2019/05/27 Javascript
Layui数据表格 前后端json数据接收的方法
2019/09/19 Javascript
JS操作字符串转数字的常见方法示例
2019/10/29 Javascript
Element-ui el-tree新增和删除节点后如何刷新tree的实例
2020/08/31 Javascript
原生JavaScript实现购物车
2021/01/10 Javascript
python开发之函数定义实例分析
2015/11/12 Python
Python实现的归并排序算法示例
2017/11/21 Python
python多进程实现进程间通信实例
2017/11/24 Python
python 重命名轴索引的方法
2018/11/10 Python
Python一句代码实现找出所有水仙花数的方法
2018/11/13 Python
HTML的form表单和django的form表单
2019/07/25 Python
python使用bs4爬取boss直聘静态页面
2020/10/10 Python
五四演讲稿范文
2014/09/03 职场文书
2014年党风廉政工作总结
2014/12/03 职场文书
2014年测量员工作总结
2014/12/12 职场文书
2015年党员创先争优承诺书
2015/01/22 职场文书
大学生自荐信范文
2015/03/05 职场文书
退税申请报告怎么写
2015/05/18 职场文书
教你怎么用Python实现GIF动图的提取及合成
2021/06/15 Python