Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
python简单获取数组元素个数的方法
Jul 13 Python
Python中操作符重载用法分析
Apr 29 Python
Django返回json数据用法示例
Sep 18 Python
Python爬虫实例_城市公交网络站点数据的爬取方法
Jan 10 Python
python列表生成式与列表生成器的使用
Feb 23 Python
Django中ORM外键和表的关系详解
May 20 Python
Python3.7.0 Shell添加清屏快捷键的实现示例
Mar 23 Python
python nohup 实现远程运行不宕机操作
Apr 16 Python
python 追踪except信息方式
Apr 25 Python
Django ORM 查询表中某列字段值的方法
Apr 30 Python
python如何进行矩阵运算
Jun 05 Python
python中的None与NULL用法说明
May 25 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
如何将一个表单同时提交到两个地方处理
2006/10/09 PHP
PHP4实际应用经验篇(6)
2006/10/09 PHP
yii2 上传图片的示例代码
2018/11/02 PHP
Laravel访问出错提示:`Warning: require(/vendor/autoload.php): failed to open stream: No such file or di解决方法
2019/04/02 PHP
xtree.js 代码
2007/03/13 Javascript
js 通用javascript函数库整理
2011/08/14 Javascript
Javascript中Event属性搜集整理
2013/09/17 Javascript
jquery和ajax的关系详细介绍
2013/11/29 Javascript
Json序列化和反序列化方法解析
2013/12/19 Javascript
jQuery 常用代码集锦(必看篇)
2016/05/16 Javascript
jquery遍历标签中自定义的属性方法
2016/09/17 Javascript
BootStrap轮播HTML代码(推荐)
2016/12/10 Javascript
jquery实现下拉框左右选择功能
2017/02/21 Javascript
微信小程序上传图片功能(附后端代码)
2020/06/19 Javascript
Angular-UI Bootstrap组件实现警报功能
2018/07/16 Javascript
详解webpack-dev-server使用方法
2018/09/14 Javascript
countUp.js实现数字滚动效果
2019/10/18 Javascript
vue 组件开发原理与实现方法详解
2019/11/29 Javascript
Vue插件之滑动验证码用法详解
2020/04/05 Javascript
基于postman获取动态数据过程详解
2020/09/08 Javascript
用python找出那些被“标记”的照片
2017/04/20 Python
python 利用栈和队列模拟递归的过程
2018/05/29 Python
Python实现点阵字体读取与转换的方法
2019/01/29 Python
浅析python 动态库m.so.1.0错误问题
2020/05/09 Python
详解使用scrapy进行模拟登陆三种方式
2021/02/21 Python
美国电子产品折扣网站:Daily Steals
2017/05/20 全球购物
计算机科学系职业生涯规划书
2014/03/08 职场文书
青春寄语大全
2014/04/09 职场文书
安全责任书范本
2014/04/15 职场文书
社会学专业求职信
2014/07/17 职场文书
群众路线教育实践活动整改落实情况汇报
2014/10/28 职场文书
大学生简历自我评价2015
2015/03/03 职场文书
2015年志愿者服务工作总结
2015/04/20 职场文书
2015年秋学期教研工作总结
2015/10/14 职场文书
医学会议开幕词
2016/03/03 职场文书
MySQL count(*)统计总数问题汇总
2022/09/23 MySQL