从品牌网站建设到网络营销策划,从策略到执行的一站式服务
这期内容当中小编将会给大家带来有关Python中怎么对docx文件进行读写操作,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
创新互联建站坚信:善待客户,将会成为终身客户。我们能坚持多年,是因为我们一直可值得信赖。我们从不忽悠初访客户,我们用心做好本职工作,不忘初心,方得始终。十载网站建设经验创新互联建站是成都老牌网站营销服务商,为您提供成都网站建设、成都网站制作、网站设计、html5、网站制作、品牌网站设计、小程序定制开发服务,给众多知名企业提供过好品质的建站服务。
演示文本
为了方便理解,我们以 python-docx.docx 文件为例,演示如何使用Python 提取其中的文本数据和表格数据,并开发自定义函数以字典的形式提取内容,python-docx.docx文件内容如下:
在使用python-docx 读取word文档中文本之前,我们先了解下python-docx 模块的几个概念。
Document 对象,表示一个Word文档。
Paragraph 对象,表示Word文档中的一个段落。
Paragraph 对象的text属性,表示段落中的文本内容。
提取docx文件中文本信息
使用python-docx 提取docx文件中文本数据,Python实现代码如下:
如上,我们将python-docx.docx 文件中的文本信息,按行提取出来,存储到字典中,字典的Key为行号,Value为文本信息,执行上述代码,输出结果如下:
提取docx文件中表格数据
使用python-docx 提取docx文件中表格数据,Python实现代码如下:
如上,我们将python-docx.docx 文件中的表单信息,按行提取出来,存储到列表中,列表每个元素为一个表格的数据,数据结构为字典,执行上述代码输出结果如下:
写入数据到docx文件中
我们同样可以利用python-docx 模块,实现docx文件的数据写入,如标题、字号、引用、列表、图片插入等等。由于如下代码注释中说明比较详细,此处不做过多介绍,代码如下:
执行上述代码,写入数据保存至testops—docx.docx 文件中,内容如下:
提取包含指定关键字的文本
我们基于上述自定义封装函数 extract_text、extract_form,结合re 模块,就可以实现提取包含关键字的文本内容,代码实现如下:
如上,我们实现了提取docx 文本中包含指定内容的文本信息,并输出该内容所在行,执行上述代码,输出结果为:
上述就是小编为大家分享的Python中怎么对docx文件进行读写操作了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注创新互联行业资讯频道。
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图