python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python函数参数*args**kwargs用法实例
Dec 04 Python
Python实现可自定义大小的截屏功能
Jan 20 Python
Python 中的 global 标识对变量作用域的影响
Aug 12 Python
Python中使用gflags实例及原理解析
Dec 13 Python
浅谈python的elementtree模块处理中文注意事项
Mar 06 Python
Python实现仿射密码的思路详解
Apr 23 Python
基于打开pycharm有带图片md文件卡死问题的解决
Apr 24 Python
Python中内建模块collections如何使用
May 27 Python
基于python实现音乐播放器代码实例
Jul 01 Python
关于多种方式完美解决Python pip命令下载第三方库的问题
Dec 21 Python
详解python3 GUI刷屏器(附源码)
Feb 18 Python
Python爬虫基础之爬虫的分类知识总结
May 13 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
第五章 php数组操作
2011/12/30 PHP
浅析PHP中Session可能会引起并发问题
2015/07/23 PHP
PHP实现的装箱算法示例
2018/06/23 PHP
java解析json方法总结
2019/05/16 PHP
JavaScript脚本性能优化注意事项
2008/11/18 Javascript
JavaScript中使用构造函数实现继承的代码
2010/08/12 Javascript
jQuery中clearQueue()方法用法实例
2014/12/29 Javascript
IE中鼠标经过option触发mouseout的解决方法
2015/01/29 Javascript
RequireJS入门一之实现第一个例子
2015/09/30 Javascript
jQuery实现ctrl+enter(回车)提交表单
2015/10/19 Javascript
JavaScript运行过程中的“预编译阶段”和“执行阶段”
2015/12/16 Javascript
jQuery Validation Plugin验证插件手动验证
2016/01/26 Javascript
js倒计时小实例(多次定时)
2016/12/08 Javascript
基于JavaScript实现移动端无限加载分页
2017/03/27 Javascript
通过构造函数实例化对象的方法
2017/06/28 Javascript
详解vue-cli项目中的proxyTable跨域问题小结
2018/02/09 Javascript
vue 标签属性数据绑定和拼接的实现方法
2018/05/17 Javascript
Node.js EventEmmitter事件监听器用法实例分析
2019/01/07 Javascript
python标准日志模块logging的使用方法
2013/11/01 Python
Python编程scoketServer实现多线程同步实例代码
2018/01/29 Python
python调用百度地图WEB服务API获取地点对应坐标值
2019/01/16 Python
Python 实现Serial 与STM32J进行串口通讯
2019/12/18 Python
Python实现检测文件的MD5值来查找重复文件案例
2020/03/12 Python
Python3自动生成MySQL数据字典的markdown文本的实现
2020/05/07 Python
python3.7 openpyxl 在excel单元格中写入数据实例
2020/09/01 Python
python调用百度API实现人脸识别
2020/11/17 Python
详解python日志输出使用配置文件格式
2021/02/10 Python
浅析数据存储的三种方式 cookie sessionstorage localstorage 的异同
2020/06/04 HTML / CSS
印度和世界各地的精美产品:Ikka Dukka
2018/02/12 全球购物
Nº21官方在线商店:numeroventuno.com
2019/09/26 全球购物
俄罗斯小米家用电器、电子产品和智能家居商店:Poood.ru
2020/04/03 全球购物
Java平台和其他软件平台有什么不同
2015/06/05 面试题
党委班子对照检查材料
2014/08/19 职场文书
运动会宣传稿50字
2015/07/23 职场文书
2019年国庆祝福语(70句)
2019/09/19 职场文书
vue实现简易音乐播放器
2022/08/14 Vue.js