python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python对象的深拷贝和浅拷贝详解
Aug 25 Python
使用Python对Excel进行读写操作
Mar 30 Python
Python爬虫基础之XPath语法与lxml库的用法详解
Sep 13 Python
用Python实现筛选文件脚本的方法
Oct 27 Python
Python检查和同步本地时间(北京时间)的实现方法
Dec 03 Python
python读取.mat文件的数据及实例代码
Jul 12 Python
python+opencv像素的加减和加权操作的实现
Jul 14 Python
wxPython多个窗口的基本结构
Nov 19 Python
Python安装依赖(包)模块方法详解
Feb 14 Python
Anaconda+vscode+pytorch环境搭建过程详解
May 25 Python
4款Python 类型检查工具,你选择哪个呢?
Oct 30 Python
Python matplotlib多个子图绘制整合
Apr 13 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
PHP中通过fopen()函数访问远程文件示例
2014/11/18 PHP
php 魔术常量详解及实例代码
2016/12/04 PHP
Laravel Validator 实现两个或多个字段联合索引唯一
2019/05/08 PHP
Javascript限制网页只能在微信内置浏览器中访问
2014/11/09 Javascript
移动Web中图片自适应的两种JavaScript解决方法
2015/06/18 Javascript
探讨JavaScript中的Rest参数和参数默认值
2015/07/29 Javascript
详解js实现线段交点的三种算法
2016/08/09 Javascript
JS函数修改html的元素内容,及修改属性内容的方法
2016/10/28 Javascript
基于ExtJs在页面上window再调用Window的事件处理方法
2017/07/26 Javascript
JS实现按钮控制计时开始和停止功能
2017/07/27 Javascript
利用js将ajax获取到的后台数据动态加载至网页中的方法
2018/08/08 Javascript
js中innerText/textContent和innerHTML与target和currentTarget的区别
2019/01/21 Javascript
如何在Node和浏览器控制台中打印彩色文字
2020/01/09 Javascript
Python3的urllib.parse常用函数小结(urlencode,quote,quote_plus,unquote,unquote_plus等)
2016/09/18 Python
Python实现全角半角字符互转的方法
2016/11/28 Python
Python在图片中插入大量文字并且自动换行
2019/01/02 Python
python机器学习实现决策树
2019/11/11 Python
解决python Jupyter不能导入外部包问题
2020/04/15 Python
vscode写python时的代码错误提醒和自动格式化的方法
2020/05/07 Python
浅析Python 条件控制语句
2020/07/15 Python
Python:__eq__和__str__函数的使用示例
2020/09/26 Python
英国床垫在线:Mattress Online
2016/12/07 全球购物
澳大利亚美容产品及化妆品在线:Activeskin
2020/06/03 全球购物
MYSQL相比于其他数据库有哪些特点
2013/07/19 面试题
怎么写好自荐信
2013/10/30 职场文书
上班迟到检讨书
2014/01/10 职场文书
致100米运动员广播稿
2014/02/14 职场文书
倡议书格式
2014/08/30 职场文书
大学生学习面向未来的赶考思想汇报
2014/09/12 职场文书
2014年公路养护工作总结
2014/12/04 职场文书
2015年基层党组织公开承诺书
2015/01/21 职场文书
试用期转正工作总结2015
2015/05/28 职场文书
PyTorch的Debug指南
2021/05/07 Python
mysql5.6主从搭建以及不同步问题详解
2021/12/04 MySQL
详解Vue中$props、$attrs和$listeners的使用方法
2022/02/18 Vue.js
Python基本的内置数据类型及使用方法
2022/04/13 Python