• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python读取word 中指定位置的表格及表格数据

python 搞代码 4年前 (2022-01-08) 77次浏览 已收录 0个评论

这篇文章主要介绍了python读取word 中指定位置的表格及表格数据,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友参考下吧

1.Word文档如下:

2.代码

 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document = Document(filename) paragraphs = document.paragraphs allTables = document.tables specText = specText.encode('utf-8').decode('utf-8') for aPara in paragraphs: if aPara.text == specText: ele = aPara._p.getnext() while (ele.tag != '' and ele.tag[-3:] != 'tbl'): ele = ele.getnext() if ele.tag != '': for aTable in allTables: if aTable._tbl == ele: for i in range(len(aTable.rows)): for j in range(len(aTable.columns)): print(aTable.cell(i, j).text) if __name__ == '__main__': readSpecTable('test.docx', '符号约定')

3.结果

符号
符号
含义
数据域取值符号
M
必须填写的域
数据域取值符号
C
某条件成立时必须填写的域
数据域取值符号
O
可选,非必须填写的域
数据域取值符号

必须与先前报文中对应域的值相同的

来源gaodai.ma#com搞##代!^码@网


数据域取值符号

必须去除的域
数据域属性符号
 
基本数据域
数据域属性符号
[]
标识为消息组件名称数据域
数据域属性符号
{}
标识为消息组件中重复的数据域
数据域属性符号

标识为消息组件中包含的基础数据域
数据域属性符号
→[]
标识为消息组件中的子消息组件
数据域属性符号
→{}
标识为子消息组件中重复的数据域块
数据域属性符号
→→
标识为子消息组件中包含的基础数据域

PS:python读取word文档表格里的数据

首先需要安装相应的支持库:

直接在命令行执行pip install python-docx

示例代码如下:

 import docx from docx import Document #导入库 path = "E:\\python_data\\1234.docx" #文件路径 document = Document(path) #读入文件 tables = document.tables #获取文件中的表格集 table = tables[0 ]#获取文件中的第一个表格 for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据 result = table.cell(i,0).text + "" +table.cell(i,1).text+ table.cell(i,2).text + table.cell(i,3).text #cell(i,0)表示第(i+1)行第1列数据,以此类推 print(result)

总结

如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

以上就是python读取word 中指定位置的表格及表格数据的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python读取word 中指定位置的表格及表格数据

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址