python读取docx文件，就是如此简单-创新互联-快上网网站建设公司

python读取docx文件，就是如此简单-创新互联

中文编码问题总是让人头疼(尤其是mac本),想要用 Python读取word中的内容。用open()经常报错,通过百度搜索+问身边小伙伴发现了 Python有专门读取.docx的模块python_docx。本篇文章主要来解决一个读取docx文件的基本操作。希望感兴趣的小伙伴可以坚持看下去同时欢迎提出宝贵的意见让我们一起进步！

创新互联建站长期为近千家客户提供的网站建设服务，团队从业经验10年，关注不同地域、不同群体，并针对不同对象提供差异化的产品和服务；打造开放共赢平台，与合作伙伴共同营造健康的互联网生态环境。为驿城企业提供专业的网站制作、成都网站设计，驿城网站改版等技术服务。拥有十年丰富建站经验和众多成功案例,为您定制开发。

01：问题抛出与引入

import docx

path = "C:\\Users\\qin\\Desktop\\1.docx"

file_object=open(path,'rb')

print(file_object.read())

#输出结果如下所示：

b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00

(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一个很简单的docx文件,打印出来的结果却不是我们想要的。对此引入一个十分好用的docx模块,下面就详细介绍该模块的一些基本操作。

02：安装docx模块

pip install python_docx

03：新建文档对象

import docx

from docx import Document

# 新建文档,并将其保存名为“test.docx”的文件

document = Document()

document.save('test.docx')

04：添加文档内容

import docx

from docx import Document

from docx.shared import Inches

document = Document('C:\\Users\\qin\\Desktop\\1.docx')

document.add_heading('I like python', 0)#插入标题：0表示样式为title标题

document.add_heading('一级标题', level=1)#插入1级标题

p = document.add_paragraph('Python是一种计算机程序设计语言 ')#插入段落

document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加图片并指定宽度

table = document.add_table(rows=1, cols=3)  #添加一个表格，每行三列

hdr_cells = table.rows[0].cells  #获取第一行的单元格列表对象

hdr_cells[0].text = 'ID'    #为每一个单元格赋值

hdr_cells[1].text = 'Name'

hdr_cells[2].text = 'Age'

new_cells = table.add_row().cells #为表格添加一行

new_cells[0].text = '1'

new_cells[1].text = 'Tom'

new_cells[2].text = '15'

document.add_page_break()   #添加分页符

05：保存文档内容

名字相同则将修改的文件内容保存; 名字不同则将修改的文件内容另存为。

import docx

from docx import Document

document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存

document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存为

06：读取文本内容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)

for paragraph in document.paragraphs:

   print(paragraph.text)

07：读取表格内容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)  # 读入文件

tables = document.tables   # 获取文件中的表格集

table = tables[0]  # 获取文件中的第一个表格

for i in range(0, len(table.rows)):  # 从表格第一行开始循环读取表格数据

   result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'

   # cell(i,0)表示第(i+1)行第1列数据,以此类推

   print(result)

想要知道docx模块更多资料参考:https://python-docx.readthedocs.io/en/latest/

网页题目：python读取docx文件，就是如此简单-创新互联
本文链接：http://cdkjz.cn/article/dcddgg.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python读取docx文件，就是如此简单-创新互联

01：问题抛出与引入

02：安装docx模块

03：新建文档对象

04：添加文档内容

05：保存文档内容

06：读取文本内容

07：读取表格内容

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python读取docx文件，就是如此简单-创新互联

01：问题抛出与引入

02：安装docx模块

03：新建文档对象

04：添加文档内容

05：保存文档内容

06：读取文本内容

07：读取表格内容

相关资讯

SharedPreferences-创新互联

一部全网最全的JDK发展历史轨迹图-创新互联

cdn页面加速的原理是什么-创新互联

Vue.js混入mixin怎么用-创新互联

ContentProvider浅谈+实例-创新互联

如何利用DataSet部分功能实现网站登录-创新互联

for和while与until的无限循环总结-创新互联

layui如何监听多个radio事件-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接