PyPDF2如何实现按照PDF页码提取后并另存为PDF格式文件？-快上网网站建设公司

PyPDF2如何实现按照PDF页码提取后并另存为PDF格式文件？

事情的经过是这样的，由于现有的PDF文件太多了而我真正需要的内容只有十几页。

网站建设哪家好，找创新互联建站！专注于网页设计、网站建设、微信开发、微信小程序开发、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了田东免费建站欢迎大家使用！

每次查找不方便，另外需要发给自己的小伙伴也太多别人也不容易找到需要的内容，所以产生了一个想法就是把需要的PDF提取出来然后另存为一个PDF文件。

于是就有了这次的PDF页面提取操作，下面进入实战环节。

项目中用到的库主要是PyPDF2用于PDF格式文件的提取等操作，另外还需要os操作库用来做文件的读写、另存为操作。

【阅读全文】

from PyPDF2 import PdfFileReader, PdfFileWriter  # PDF格式文件操作

import os  # 系统文件操作

第一步：初始化在PDF文件操作过程中的相关参数。

# 定义文件的操作路径（需要提取内容的原文件路径）

file_path = 'data.pdf'

# 定义目标文件路径（已经提取好的文件路径）

output_file_path = ''

# 定义开始提取页的页码

begin = '102'

# 定义结束提取页的页码

end = '113'

# 初始化已经提取好的文件路径

output_file_path = output_file_path + f'({begin}~{end}).pdf'

第二步：判断需要操作的原始文件是否存在、判断需要提取的页码是否在合理的范围内。

# 判断pdf文件是否存在，存在则继续读取文件

if os.path.isfile(file_path):
    global pdf_obj_reader
    pdf_obj_reader = PdfFileReader(file_path)  # 读取原始文件所有内容

# 判断一下页码是否在合理的范围内。

if begin < 1 or end > pdf_obj_reader.getNumPages():
    print('请输入合理的页面范围')
else:
    exit(0)

第三步：根据需要提取内容的pdf页码范围提取pdf内容并写入PDF文件写入流。

# 初始化文件写入流。
global pdf_obj_writer

pdf_obj_writer = PdfFileWriter()


# 遍历已经读取的文件流，提取需要的部分并写入文件写入流。

for page_num in range(begin - 1, end):  # 由于读取的页面是从0开始，所以开始页码进行减1操作
    pdf_obj_writer.addPage(pdf_obj_reader.getPage(page_num))  # 将符合条件的页码对应内容写入文件写入流

# 最后，将提取好的文件流对象写入到新定义好的PDF文件中

with open(output_file_path, 'wb') as output_file_pdf:
    pdf_obj_writer.write(output_file_pdf)  # 写入到指定文件

到此，整个PDF内容提取和写入的操作就完成了，感谢大家的支持。

【往期精彩】

浪漫的turtle，送给程序员自己的圣诞树！

PyQt5 GUI：百度图片下载器（文末附源码）

python3中的zip()、zip(*)、list()之间的灵活转换！

python print() 函数的格式化字符串输出

PyQt5 GUI && Requests Api 做一个天气查询系统（文末领取完整代码）！

分享名称：PyPDF2如何实现按照PDF页码提取后并另存为PDF格式文件？
转载来源：http://cdkjz.cn/article/dsojcdg.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

PyPDF2如何实现按照PDF页码提取后并另存为PDF格式文件？

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

PyPDF2如何实现按照PDF页码提取后并另存为PDF格式文件？

相关资讯

c语言返回主界面函数 c语言如何返回到开始

包含sap系统多少钱开口的词条

手机域名纠错怎么解决 手机域名纠错怎么解决的

交换ab的值java代码 交换ab值的程序

linuxsu命令 linux su命令

php怎么统计每天的数据 php中统计单词个数

阿里云换服务器数据 阿里云服务器可以更换地区吗

阿里云怎么申请单独服务器 阿里云怎么申请单独服务器账号

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

手机域名纠错怎么解决手机域名纠错怎么解决的

交换ab的值java代码交换ab值的程序

阿里云换服务器数据阿里云服务器可以更换地区吗

阿里云怎么申请单独服务器阿里云怎么申请单独服务器账号

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接