python读取word 中指定位置的表格及表格数据


Posted in Python onOctober 23, 2019

1.Word文档如下:

python读取word 中指定位置的表格及表格数据

2.代码

# -*- coding: UTF-8 -*-
from docx import Document
def readSpecTable(filename, specText):
 document = Document(filename)
 paragraphs = document.paragraphs
 allTables = document.tables
 specText = specText.encode('utf-8').decode('utf-8')
 for aPara in paragraphs:
  if aPara.text == specText:
   ele = aPara._p.getnext()
   while (ele.tag != '' and ele.tag[-3:] != 'tbl'):
    ele = ele.getnext()
   if ele.tag != '':
    for aTable in allTables:
     if aTable._tbl == ele:
      for i in range(len(aTable.rows)):
       for j in range(len(aTable.columns)):
        print(aTable.cell(i, j).text)
if __name__ == '__main__':
 readSpecTable('test.docx', '符号约定')

3.结果

符号
符号
含义
数据域取值符号
M
必须填写的域
数据域取值符号
C
某条件成立时必须填写的域
数据域取值符号
O
可选,非必须填写的域
数据域取值符号

必须与先前报文中对应域的值相同的域
数据域取值符号
-
必须去除的域
数据域属性符号
 
基本数据域
数据域属性符号
[]
标识为消息组件名称数据域
数据域属性符号
{}
标识为消息组件中重复的数据域
数据域属性符号

标识为消息组件中包含的基础数据域
数据域属性符号
→[]
标识为消息组件中的子消息组件
数据域属性符号
→{}
标识为子消息组件中重复的数据域块
数据域属性符号
→→
标识为子消息组件中包含的基础数据域

PS:python读取word文档表格里的数据

首先需要安装相应的支持库:

直接在命令行执行pip install python-docx

示例代码如下:

import docx
from docx import Document #导入库
path = "E:\\python_data\\1234.docx" #文件路径
document = Document(path) #读入文件
tables = document.tables #获取文件中的表格集
table = tables[0 ]#获取文件中的第一个表格
for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
 result = table.cell(i,0).text + "" +table.cell(i,1).text+
 table.cell(i,2).text + table.cell(i,3).text
 #cell(i,0)表示第(i+1)行第1列数据,以此类推
 print(result)

总结

以上所述是小编给大家介绍的python读取word 中指定位置的表格及表格数据,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
利用Psyco提升Python运行速度
Dec 24 Python
Python实现矩阵转置的方法分析
Nov 24 Python
python中将字典形式的数据循环插入Excel
Jan 16 Python
Django Admin实现三级联动的示例代码(省市区)
Jun 22 Python
如何在python字符串中输入纯粹的{}
Aug 22 Python
python读取word文档,插入mysql数据库的示例代码
Nov 07 Python
Python在Matplotlib图中显示中文字体的操作方法
Jul 29 Python
Django中的静态文件管理过程解析
Aug 01 Python
python程序中的线程操作 concurrent模块使用详解
Sep 23 Python
PyCharm无法引用自身项目解决方式
Feb 12 Python
Python3标准库glob文件名模式匹配的问题
Mar 13 Python
Python的轻量级ORM框架peewee使用教程
Feb 05 Python
win10下安装Anaconda的教程(python环境+jupyter_notebook)
Oct 23 #Python
pandas按行按列遍历Dataframe的几种方式
Oct 23 #Python
pandas中遍历dataframe的每一个元素的实现
Oct 23 #Python
python list多级排序知识点总结
Oct 23 #Python
python实现的汉诺塔算法示例
Oct 23 #Python
在pandas中遍历DataFrame行的实现方法
Oct 23 #Python
python判断单向链表是否包括环,若包含则计算环入口的节点实例分析
Oct 23 #Python
You might like
压力如何影响浓缩咖啡品质
2021/03/03 咖啡文化
PHP URL地址获取函数代码(端口等) 推荐
2010/05/15 PHP
php原生数据库分页的代码实例
2019/02/18 PHP
jquery 关键字“拖曳搜索”之“拖曳”以及 图片“提示自适应放大”效果 的实现
2010/04/18 Javascript
javascript判断chrome浏览器的方法
2014/03/26 Javascript
模拟一个类似百度google的模糊搜索下拉列表
2014/04/15 Javascript
教你如何使用node.js制作代理服务器
2014/11/26 Javascript
JavaScript整除运算函数ceil和floor的区别分析
2015/04/14 Javascript
bootstrap下拉列表与输入框组结合的样式调整
2016/10/08 Javascript
JS编写函数实现对身份证号码最后一位的验证功能
2016/12/29 Javascript
Base64(二进制)图片编码解析及在各种浏览器的兼容性处理
2017/02/09 Javascript
javascript 删除数组元素和清空数组的简单方法
2017/02/24 Javascript
jquery一键控制checkbox全选、反选或全不选
2017/10/16 jQuery
JS中的函数与对象的创建方式
2019/05/12 Javascript
vue 中 命名视图的用法实例详解
2019/08/14 Javascript
在Vue.js中使用TypeScript的方法
2020/03/19 Javascript
5个你不知道的JavaScript字符串处理库(小结)
2020/06/01 Javascript
python分割和拼接字符串
2013/11/01 Python
Python验证码识别的方法
2015/07/10 Python
python中urllib.unquote乱码的原因与解决方法
2017/04/24 Python
Python 比较两个数组的元素的异同方法
2017/08/17 Python
解读python logging模块的使用方法
2018/04/17 Python
获取python的list中含有重复值的index方法
2018/06/27 Python
python无限生成不重复(字母,数字,字符)组合的方法
2018/12/04 Python
详解opencv Python特征检测及K-最近邻匹配
2019/01/21 Python
Python中单线程、多线程和多进程的效率对比实验实例
2019/05/14 Python
Python pandas用法最全整理
2019/08/04 Python
python编写猜数字小游戏
2019/10/06 Python
Windows+Anaconda3+PyTorch+PyCharm的安装教程图文详解
2020/04/03 Python
Marmot土拨鼠官网:美国专业户外运动品牌
2018/01/11 全球购物
eBay美国官网:eBay.com
2020/10/24 全球购物
学生会竞聘书范文
2014/03/31 职场文书
医学生求职自荐书
2014/06/12 职场文书
月度优秀员工获奖感言
2014/08/16 职场文书
地球上的星星观后感
2015/06/02 职场文书
HTML5基础学习之文本标签控制
2022/03/25 HTML / CSS