Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python笔记(叁)继续学习
Oct 24 Python
Python实现对比不同字体中的同一字符的显示效果
Apr 23 Python
python基于pygame实现响应游戏中事件的方法(附源码)
Nov 11 Python
Python实现简单的获取图片爬虫功能示例
Jul 12 Python
每天迁移MySQL历史数据到历史库Python脚本
Apr 13 Python
Flask和Django框架中自定义模型类的表名、父类相关问题分析
Jul 19 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 Python
python 根据时间来生成唯一的字符串方法
Jan 14 Python
Python Opencv实现图像轮廓识别功能
Mar 23 Python
代码实例讲解python3的编码问题
Jul 08 Python
python开根号实例讲解
Aug 30 Python
python 如何用map()函数创建多线程任务
Apr 07 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
受疫情影响 动画《Re从零开始的异世界生活》第二季延期至7月
2020/03/10 日漫
DedeCMS dede_channeltype表字段注释
2010/04/07 PHP
PHP队列用法实例
2014/11/05 PHP
php去掉文件前几行的方法
2015/07/29 PHP
基于命令行执行带参数的php脚本并取得参数的方法
2016/01/25 PHP
javascript 避免闭包引发的问题
2009/03/17 Javascript
Prototype 学习 工具函数学习($A方法)
2009/07/12 Javascript
javascript string字符串优化问题
2011/07/31 Javascript
Three.js源码阅读笔记(基础的核心Core对象)
2012/12/27 Javascript
ExtJS4 表格的嵌套 rowExpander应用
2014/05/02 Javascript
浅谈Javascript中深复制
2014/12/01 Javascript
JavaScript中length属性的使用方法
2015/06/05 Javascript
jQuery实现带滚动导航效果的全屏滚动相册实例
2015/06/19 Javascript
最全的Javascript编码规范(推荐)
2016/06/22 Javascript
jQuery实现导航滚动到指定内容效果完整实例【附demo源码下载】
2016/09/20 Javascript
详解Node.js中的事件机制
2016/09/22 Javascript
es6的数字处理的方法(5个)
2017/03/16 Javascript
原生javascript上传图片带进度条【实例分享】
2017/04/06 Javascript
基于easyui checkbox 的一些操作处理方法
2017/07/10 Javascript
Vue源码探究之状态初始化
2018/11/14 Javascript
js中怎么判断两个字符串相等的实例
2019/01/17 Javascript
Flutter实现仿微信底部菜单栏功能
2019/09/18 Javascript
javascript实现摄像头拍照预览
2019/09/30 Javascript
vue路由传参页面刷新参数丢失问题解决方案
2019/10/08 Javascript
Jquery属性的获取/设置及样式添加/删除操作技巧分析
2019/12/23 jQuery
解决element-ui里的下拉多选框 el-select 时,默认值不可删除问题
2020/08/14 Javascript
使用python实现strcmp函数功能示例
2014/03/25 Python
Python删除指定目录下过期文件的2个脚本分享
2014/04/10 Python
Python3随机漫步生成数据并绘制
2018/08/27 Python
解析HTML5中的新功能本地存储localStorage
2016/03/01 HTML / CSS
保洁主管岗位职责
2013/11/20 职场文书
先进事迹报告会感言
2014/01/24 职场文书
护理中职生求职信范文
2014/02/24 职场文书
媒矿安全生产承诺书
2014/05/23 职场文书
售房协议书
2014/08/19 职场文书
2016年安康杯竞赛活动总结
2016/04/05 职场文书