Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现对PPT文件进行截图操作的方法
Apr 28 Python
详谈Python基础之内置函数和递归
Jun 21 Python
Python获取昨天、今天、明天开始、结束时间戳的方法
Jun 01 Python
一步步教你用python的scrapy编写一个爬虫
Apr 17 Python
Python 给定的经纬度标注在地图上的实现方法
Jul 05 Python
Win10+GPU版Pytorch1.1安装的安装步骤
Sep 27 Python
Tensorflow Summary用法学习笔记
Jan 10 Python
python爬虫开发之urllib模块详细使用方法与实例全解
Mar 09 Python
django自带的权限管理Permission用法说明
May 13 Python
python基本算法之实现归并排序(Merge sort)
Sep 01 Python
Python selenium实现断言3种方法解析
Sep 08 Python
python图像处理基本操作总结(PIL库、Matplotlib及Numpy)
Jun 08 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
php xml文件操作代码(一)
2009/03/20 PHP
初次接触php抽象工厂模式(Elgg)
2010/03/21 PHP
深入PHP autoload机制的详解
2013/06/09 PHP
PHP内核探索:变量存储与类型使用说明
2014/01/30 PHP
简单谈谈php中ob_flush和flush的区别
2014/11/27 PHP
Laravel 5.3 学习笔记之 配置
2016/08/28 PHP
ThinkPHP3.1.x修改成功与失败跳转页面的方法
2017/09/29 PHP
PHP实现数组转JSon和JSon转数组的方法示例
2018/06/14 PHP
PHP实现获取文件mime类型多种方法解析
2020/05/28 PHP
JS中style属性
2006/10/11 Javascript
一组JS创建和操作表格的函数集合
2009/05/07 Javascript
基于jQuery的投票系统显示结果插件
2011/08/12 Javascript
jQuery源码分析-03构造jQuery对象-源码结构和核心函数
2011/11/14 Javascript
jQuery中[attribute]选择器用法实例
2014/12/31 Javascript
javascript的几种写法总结
2016/09/30 Javascript
详解JavaScript中js对象与JSON格式字符串的相互转换
2017/02/14 Javascript
angular过滤器实现排序功能
2017/06/27 Javascript
React Router v4 入坑指南(小结)
2018/04/08 Javascript
快速解决select2在bootstrap模态框中下拉框隐藏的问题
2018/08/10 Javascript
微信公众号H5支付接口调用方法
2019/01/10 Javascript
基于layui table返回的值的多级嵌套的解决方法
2019/09/19 Javascript
js实现AI五子棋人机大战
2020/05/28 Javascript
微信小程序保存图片到相册权限设置
2020/04/09 Javascript
在Django框架中设置语言偏好的教程
2015/07/27 Python
python numpy函数中的linspace创建等差数列详解
2017/10/13 Python
ML神器:sklearn的快速使用及入门
2019/07/11 Python
使用Python制作表情包实现换脸功能
2019/07/19 Python
Tensorflow实现酸奶销量预测分析
2019/07/19 Python
python将字符串转变成dict格式的实现
2019/11/18 Python
python从内存地址上加载python对象过程详解
2020/01/08 Python
俄罗斯花园种植材料批发和零售网上商店:Беккер
2019/07/22 全球购物
医院实习介绍信
2014/01/12 职场文书
校运会口号
2014/06/18 职场文书
励志演讲稿500字
2014/08/21 职场文书
出资证明书范本(标准版)
2014/09/24 职场文书
2014年社区工会工作总结
2014/12/18 职场文书