Python读取word文本操作详解


Posted in Python onJanuary 22, 2018

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下。

一,docx模块

Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。

二,相关概念

如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念。

1,Document对象,表示一个word文档。
2,Paragraph对象,表示word文档中的一个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

三,模块的安装和导入

需要注意,python-docx模块安装需要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句英文Successfully installed,成功地安装完成,十分考验英文水平。)

Python读取word文本操作详解

注意在导入模块时,用的是import docx。

也真是奇了怪了,怎么安装和导入模块时,很多都不用一个名字,看来是很有必要出一个python版本的模块管理程序python-maven了,本段纯属PS。

四,读取word文本

在了解了上面的信息之后,就很简单了,下面先创建一个D:\temp\word.docx文件,并在其中输入如下内容。

Python读取word文本操作详解

然后写一段程序,代码及输出结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\\temp\\word.docx")
print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>>

总结

以上就是本文关于Python读取word文本操作详解的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

Python 相关文章推荐
Python 用户登录验证的小例子
Mar 06 Python
如何用Python实现简单的Markdown转换器
Jul 16 Python
python中的字符串内部换行方法
Jul 19 Python
python 在屏幕上逐字显示一行字的实例
Dec 24 Python
python3实现斐波那契数列(4种方法)
Jul 15 Python
Pycharm 字体大小调整设置的方法实现
Sep 27 Python
Python作用域与名字空间原理详解
Mar 21 Python
python中对二维列表中一维列表的调用方法
Jun 07 Python
keras实现多GPU或指定GPU的使用介绍
Jun 17 Python
python 多线程共享全局变量的优劣
Sep 24 Python
python字符串的多行输出的实例详解
Jun 08 Python
Python读写yaml文件
Mar 20 Python
python导出hive数据表的schema实例代码
Jan 22 #Python
Python的SimpleHTTPServer模块用处及使用方法简介
Jan 22 #Python
一道python走迷宫算法题
Jan 22 #Python
浅谈使用Python内置函数getattr实现分发模式
Jan 22 #Python
python正则表达式及使用正则表达式的例子
Jan 22 #Python
Python深度优先算法生成迷宫
Jan 22 #Python
Python使用Tkinter实现机器人走迷宫
Jan 22 #Python
You might like
PHP常用处理静态操作类
2015/04/03 PHP
PHP中error_reporting函数用法详细介绍
2017/06/11 PHP
PHP生成随机码的思路与方法实例探索
2019/04/11 PHP
jQuery 使用手册(五)
2009/09/23 Javascript
javascript实现TreeView 无刷新展开的实例代码
2013/07/13 Javascript
简介可以自动完成UI的AngularJS工具angular-smarty
2015/06/23 Javascript
jquery实现简易的移动端验证表单
2015/11/08 Javascript
js提交form表单,并传递参数的实现方法
2016/05/25 Javascript
jQuery学习笔记之回调函数
2016/08/15 Javascript
用NodeJS实现批量查询地理位置的经纬度接口
2016/08/16 NodeJs
最好用的Bootstrap fileinput.js文件上传组件
2016/12/12 Javascript
基于Javascript倒计时效果
2016/12/22 Javascript
微信小程序之数据双向绑定与数据操作
2017/05/12 Javascript
Angular 2 ngForm中的ngModel、[ngModel]和[(ngModel)]的写法
2017/06/29 Javascript
JavaScript利用fetch实现异步请求的方法实例
2017/07/26 Javascript
JS实现带导航城市列表以及输入搜索功能
2018/01/04 Javascript
vue elementui tree 任意级别拖拽功能代码
2020/08/31 Javascript
JavaScript arguments.callee作用及替换方案详解
2020/09/02 Javascript
Python将多个excel表格合并为一个表格
2021/02/22 Python
Pandas DataFrame数据的更改、插入新增的列和行的方法
2019/06/25 Python
django 控制页面跳转的例子
2019/08/06 Python
Python根据服务获取端口号的方法
2019/09/25 Python
django的autoreload机制实现
2020/06/03 Python
New Balance澳大利亚官网:运动鞋和健身服装
2019/02/23 全球购物
用C#语言写出与SQLSERVER访问时的具体过程
2013/04/16 面试题
美术教师岗位职责
2014/03/18 职场文书
银行求职信怎么写
2014/05/26 职场文书
工会主席事迹材料
2014/06/03 职场文书
微电影大赛策划方案
2014/06/05 职场文书
校运会口号
2014/06/18 职场文书
租房协议书样本
2014/08/20 职场文书
工作会议简报
2015/07/20 职场文书
汽车修理厂管理制度
2015/08/05 职场文书
2019升学宴主持词范本5篇
2019/10/09 职场文书
JS轻量级函数式编程实现XDM二
2022/06/16 Javascript
clear 万能清除浮动(clearfix:after)
2023/05/21 HTML / CSS