Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python转换字符串为摩尔斯电码的方法
Jul 06 Python
Python 类与元类的深度挖掘 II【经验】
May 06 Python
利用Python中SocketServer 实现客户端与服务器间非阻塞通信
Dec 15 Python
django的登录注册系统的示例代码
May 14 Python
python matplotlib绘图,修改坐标轴刻度为文字的实例
May 25 Python
Python中return self的用法详解
Jul 27 Python
python 使用pandas计算累积求和的方法
Feb 08 Python
解决python 上传图片限制格式问题
Oct 30 Python
Python 解析简单的XML数据
Jul 24 Python
python爬虫爬取网页数据并解析数据
Sep 18 Python
Scrapy 配置动态代理IP的实现
Sep 28 Python
Python实现树莓派摄像头持续录像并传送到主机的步骤
Nov 30 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
在PHP3中实现SESSION的功能(二)
2006/10/09 PHP
ThinkPHP使用UTFWry地址库进行IP定位实例
2014/04/01 PHP
php精确的统计在线人数的方法
2015/10/21 PHP
php5与php7的区别点总结
2019/10/11 PHP
javascript中的一些注意事项 更新中
2010/12/06 Javascript
jQuery ajax请求返回list数据动态生成input标签,并把list数据赋值到input标签
2016/03/29 Javascript
基于Bootstrap实现图片轮播效果
2016/05/22 Javascript
JS实现复选框的全选和批量删除功能
2017/04/05 Javascript
微信小程序登录换取token的教程
2018/05/31 Javascript
详解Node.js读写中文内容文件操作
2018/10/10 Javascript
微信小程序绘制图片发送朋友圈
2019/07/25 Javascript
微信小程序实现聊天室
2020/08/21 Javascript
利用JavaScript模拟京东按键输入功能
2020/12/01 Javascript
[02:44]DOTA2英雄基础教程 魅惑魔女
2014/01/07 DOTA
编写Python CGI脚本的教程
2015/06/29 Python
python比较两个列表大小的方法
2015/07/11 Python
Python 制作糗事百科爬虫实例
2016/09/22 Python
浅谈django model的get和filter方法的区别(必看篇)
2017/05/23 Python
Python3.4实现远程控制电脑开关机
2018/02/22 Python
使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法
2018/06/22 Python
Python面向对象进阶学习
2019/05/21 Python
解决python文件双击运行秒退的问题
2019/06/24 Python
python 杀死自身进程的实现方法
2019/07/01 Python
Python 正则表达式 re.match/re.search/re.sub的使用解析
2019/07/22 Python
Python‘==‘ 及 ‘is‘相关原理解析
2020/09/05 Python
Python学习工具jupyter notebook安装及用法解析
2020/10/23 Python
python元组拆包实现方法
2021/02/28 Python
爱奇艺VIP会员:大剧抢先看
2018/07/11 全球购物
一套VC试题
2015/01/23 面试题
行政总经理岗位职责
2013/12/05 职场文书
2014年创卫实施方案
2014/02/18 职场文书
工商管理自荐书
2014/07/06 职场文书
图解上海144收音机
2021/04/22 无线电
如何用Node.js编写内存效率高的应用程序
2021/04/30 Javascript
python numpy中multiply与*及matul 的区别说明
2021/05/26 Python
tensorflow中的数据类型dtype用法说明
2021/05/26 Python