python读取docx文件，就是如此简单-快上网网站建设公司

python读取docx文件，就是如此简单

中文编码问题总是让人头疼(尤其是mac本),想要用 Python读取word中的内容。用open()经常报错,通过百度搜索+问身边小伙伴发现了 Python有专门读取.docx的模块python_docx。本篇文章主要来解决一个读取docx文件的基本操作。希望感兴趣的小伙伴可以坚持看下去同时欢迎提出宝贵的意见让我们一起进步！

创新互联公司从2013年成立，是专业互联网技术服务公司，拥有项目成都做网站、网站建设网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元望都做网站,已为上家服务,为望都各地企业和个人服务,联系电话:18982081108

01：问题抛出与引入

import docx
path = "C:\\Users\\qin\\Desktop\\1.docx"
file_object=open(path,'rb')
print(file_object.read())
#输出结果如下所示：
b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00
(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一个很简单的docx文件,打印出来的结果却不是我们想要的。对此引入一个十分好用的docx模块,下面就详细介绍该模块的一些基本操作。

02：安装docx模块

pip install python_docx

03：新建文档对象

import docx
from docx import Document
# 新建文档,并将其保存名为“test.docx”的文件
document = Document()
document.save('test.docx')

04：添加文档内容

import docx
from docx import Document
from docx.shared import Inches
document = Document('C:\\Users\\qin\\Desktop\\1.docx')
document.add_heading('I like python', 0)#插入标题：0表示样式为title标题
document.add_heading('一级标题', level=1)#插入1级标题
p = document.add_paragraph('Python是一种计算机程序设计语言 ')#插入段落
document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加图片并指定宽度
table = document.add_table(rows=1, cols=3)  #添加一个表格，每行三列
hdr_cells = table.rows[0].cells  #获取第一行的单元格列表对象
hdr_cells[0].text = 'ID'    #为每一个单元格赋值
hdr_cells[1].text = 'Name'
hdr_cells[2].text = 'Age'
new_cells = table.add_row().cells #为表格添加一行
new_cells[0].text = '1'
new_cells[1].text = 'Tom'
new_cells[2].text = '15'
document.add_page_break()   #添加分页符

05：保存文档内容

名字相同则将修改的文件内容保存; 名字不同则将修改的文件内容另存为。

import docx
from docx import Document
document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存
document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存为

06：读取文本内容

import docx
from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)
for paragraph in document.paragraphs:
   print(paragraph.text)

07：读取表格内容

import docx
from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)  # 读入文件
tables = document.tables   # 获取文件中的表格集
table = tables[0]  # 获取文件中的第一个表格
for i in range(0, len(table.rows)):  # 从表格第一行开始循环读取表格数据
   result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'
   # cell(i,0)表示第(i+1)行第1列数据,以此类推
   print(result)

想要知道docx模块更多资料参考:https://python-docx.readthedocs.io/en/latest/

名称栏目：python读取docx文件，就是如此简单
分享路径：http://cdkjz.cn/article/pecsec.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python读取docx文件，就是如此简单

01：问题抛出与引入

02：安装docx模块

03：新建文档对象

04：添加文档内容

05：保存文档内容

06：读取文本内容

07：读取表格内容

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python读取docx文件，就是如此简单

01：问题抛出与引入

02：安装docx模块

03：新建文档对象

04：添加文档内容

05：保存文档内容

06：读取文本内容

07：读取表格内容

相关资讯

go语音和c语言 go语言与c语言

windows10路由器 windows10路由器连接

帝国cms弄app 帝国cms app

帝国cms通用api的简单介绍

路由器与无线桥接 路由器无线桥接和无线中继哪个好

c语言delete函数 C语言delete函数

电脑域名和ip地址怎么看 如何查看电脑的域名地址

go语言获取用户输入 go读取输入

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

路由器与无线桥接路由器无线桥接和无线中继哪个好

电脑域名和ip地址怎么看如何查看电脑的域名地址

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接