python如何实现word批量转HTML


Posted in Python onSeptember 30, 2020

今天我们说一下使用python将word内容转换成html文件。下面一起来看一下。

准备工作

使用python类库PyDocX,安装方法(使用pip进行安装),命令如下:

pip install python-docx

类库介绍

python-docx是用于创建和更新Microsoft Word(.docx)文件的Python库。它可以针对word做很多操作。比如打开文件、写入内容、编写内容样式、解析内容、读取内容等等。主要就是针对word做的一款功能库。

说代码

下面一起来说一下代码。首先是做了一个声明的内容,主要是出现过代码工具被网络上的人给进行贩卖,特此说了注释。

1、通过os类库,获取当前目录下的所有文件信息

# 当前目录下的文件
file_path = os.getcwd()
print("当前位置:%s" % file_path)

2、通过函数进行获取数据,并对目录下文件进行判断,只获取.docx类型文档

data = []
for root, dirs, files in os.walk(files_path, topdown=False):
for name in files:
f_p = os.path.join(root, name).replace("\\", "/")
file_type = os.path.splitext(f_p)
if file_type[1] == '.docx':
if " " in file_type[0]:
os.rename(f_p, f_p.replace(" ", ""))
f_p = f_p.replace(" ", "")
data.append(f_p)
return data

这里呢,我们做了一个判断的操作,主要是防止文件名称上出现空格的问题,因为在测试过程中发现了空格的文档名称是否没有办法找到文件的。

3、判断数据情况

if not file_array:
print("此目录下无docx格式word文件")
# 开始转换
print("开始转换")
for v in file_array:
main(v)

如果当前目录下不含有符合的文档,那么程序直接就跳出了,不再向下执行了。

4、开始转换

这里我们使用的是在3中循环调用方法,下面看一下代码

html = PyDocX.to_html(v)
file_name = os.path.splitext(v)
f = open("%s.html" % file_name[0], 'w', encoding="utf-8")
f.write(html)
f.close()

整体来看转换的方法很简单,在类库中已经帮我们做好的功能,只需要简单的调用就可以了。我采用的是保持原有word文件名称来生成html文件。这样方便进行查找。

其实这里也可以不用生成文件的,可以将获取的内容数据直接存入数据库中,在页面直接作出展示。

以上就是python如何实现word批量转HTML的详细内容,更多关于python word转html的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python的内存泄漏及gc模块的使用分析
Jul 16 Python
python字典序问题实例
Sep 26 Python
用Python中的wxPython实现最基本的浏览器功能
Apr 14 Python
不可错过的十本Python好书
Jul 06 Python
人工智能最火编程语言 Python大战Java!
Nov 13 Python
详解用python实现简单的遗传算法
Jan 02 Python
对pandas replace函数的使用方法小结
May 18 Python
Python3批量生成带logo的二维码方法
Jun 24 Python
Python连接mysql数据库及简单增删改查操作示例代码
Aug 03 Python
python实现梯度下降算法的实例详解
Aug 17 Python
Python 必须了解的5种高级特征
Sep 10 Python
pycharm 复制代码出现空格的解决方式
Jan 15 Python
Python识别验证码的实现示例
Sep 30 #Python
Python列表嵌套常见坑点及解决方案
Sep 30 #Python
python实现感知机模型的示例
Sep 30 #Python
python 实现关联规则算法Apriori的示例
Sep 30 #Python
Python之字典添加元素的几种方法
Sep 30 #Python
Python之字典对象的几种创建方法
Sep 30 #Python
python 实现朴素贝叶斯算法的示例
Sep 30 #Python
You might like
php 多个submit提交表单 处理方法
2009/07/07 PHP
php数组函数序列之array_unique() - 去除数组中重复的元素值
2011/10/29 PHP
php正则表达匹配中文问题分析小结
2012/03/25 PHP
将php数组输出html表格的方法
2014/02/24 PHP
ThinkPHP 表单自动验证运用示例
2014/10/13 PHP
php中Ctype函数用法详解
2014/12/09 PHP
PHP Smarty模版简单使用方法
2016/03/30 PHP
php实现页面纯静态的实例代码
2017/06/21 PHP
php中加密解密DES类的简单使用方法示例
2020/03/26 PHP
document.all与WEB标准
2020/05/13 Javascript
Javascript 函数parseInt()转换时出现bug问题
2014/05/20 Javascript
给js文件传参数(详解)
2014/07/13 Javascript
一个不错的仿携程自定义数据下拉选择select
2014/09/01 Javascript
js读取csv文件并使用json显示出来
2015/01/09 Javascript
jquery实现表格隔行换色效果
2015/11/19 Javascript
jquery 动态合并单元格的实现方法
2016/08/26 Javascript
微信小程序 配置文件详细介绍
2016/12/14 Javascript
了解VUE的render函数的使用
2017/06/08 Javascript
Node.js五大应用性能技巧小结(必须收藏)
2017/08/09 Javascript
vue引入ueditor及node后台配置详解
2018/01/03 Javascript
js统计页面上每个标签的数量实例代码
2018/05/29 Javascript
VUE实现可随意拖动的弹窗组件
2018/09/25 Javascript
vue打包npm run build时候界面报错的解决
2020/08/13 Javascript
python scatter散点图用循环分类法加图例
2019/03/19 Python
python3下载抖音视频的完整代码
2019/06/05 Python
Pytorch 中retain_graph的用法详解
2020/01/07 Python
Python实现ATM系统
2020/02/17 Python
python获取整个网页源码的方法
2020/08/03 Python
详解Python中如何将数据存储为json格式的文件
2020/11/18 Python
亚马逊墨西哥站:Amazon.com.mx
2018/08/26 全球购物
介绍下Java的输入输出流
2014/01/22 面试题
《美丽的小路》教学反思
2014/02/26 职场文书
表彰大会策划方案
2014/05/13 职场文书
2015年班主任个人工作总结
2015/03/31 职场文书
《比尾巴》教学反思
2016/02/24 职场文书
用Python生成会跳舞的美女
2022/01/18 Python