python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python文件操作相关知识点总结整理
Feb 22 Python
Python连接MySQL并使用fetchall()方法过滤特殊字符
Mar 13 Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 Python
Python基于SMTP协议实现发送邮件功能详解
Aug 14 Python
Python关于excel和shp的使用在matplotlib
Jan 03 Python
python笔记_将循环内容在一行输出的方法
Aug 08 Python
Python Django模板之模板过滤器与自定义模板过滤器示例
Oct 18 Python
Ubuntu中配置TensorFlow使用环境的方法
Apr 21 Python
如何在Python对Excel进行读取
Jun 04 Python
简单了解Python多态与属性运行原理
Jun 15 Python
详解python实现可视化的MD5、sha256哈希加密小工具
Sep 14 Python
Python入门之基础语法详解
May 11 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
在Windows中安装Apache2和PHP4的权威指南
2006/10/09 PHP
附件名前加网站名
2008/03/23 PHP
PHP发送AT指令实例代码
2016/05/26 PHP
PHP文件操作实例总结【文件上传、下载、分页】
2018/12/08 PHP
JQuery文本框高亮显示插件代码
2011/04/02 Javascript
JS画线(实例代码)
2013/11/20 Javascript
js arguments,jcallee caller用法总结
2013/11/30 Javascript
js 左右悬浮对联广告特效代码
2014/12/12 Javascript
javascript中hasOwnProperty() 方法使用指南
2015/03/09 Javascript
javascript省市级联功能实现方法实例详解
2015/10/20 Javascript
AngularJS使用ng-repeat指令实现下拉框
2016/08/23 Javascript
ionic开发中点击input时键盘自动弹出
2016/12/23 Javascript
canvas雪花效果核心代码分享
2017/02/19 Javascript
JavaScript在控件上添加倒计时功能的实现代码
2017/07/04 Javascript
浅谈node.js 命令行工具(cli)
2018/05/10 Javascript
解决循环中setTimeout执行顺序的问题
2018/06/20 Javascript
微信小程序实时聊天WebSocket
2018/07/05 Javascript
JS函数进阶之prototy用法实例分析
2020/01/15 Javascript
JS实现横向跑马灯效果代码
2020/04/20 Javascript
Vue单页面应用中实现Markdown渲染
2021/02/14 Vue.js
[01:11:27]2018DOTA2亚洲邀请赛小组赛 A组加赛 Newbee vs Optic
2018/04/03 DOTA
Python2和Python3中print的用法示例总结
2017/10/25 Python
python监控键盘输入实例代码
2018/02/09 Python
Python request设置HTTPS代理代码解析
2018/02/12 Python
python使用 request 发送表单数据操作示例
2019/09/25 Python
python 爬虫百度地图的信息界面的实现方法
2019/10/27 Python
Python实现i人事自动打卡的示例代码
2020/01/09 Python
python 6种方法实现单例模式
2020/12/15 Python
详解HTML5中rel属性的prefetch预加载功能使用
2016/05/06 HTML / CSS
html5默认气泡修改的代码详解
2020/03/13 HTML / CSS
Sperry官网:帆船鞋创始品牌
2016/09/07 全球购物
阿根廷首家户外用品制造商和经销商:Montagne
2018/02/12 全球购物
Wiggle美国:英国骑行、跑步、游泳、铁人三项商店
2018/10/27 全球购物
介绍一下linux的文件系统
2015/10/06 面试题
艺术爱好者的自我评价分享
2013/10/08 职场文书
实习生矿工检讨书
2014/10/13 职场文书