通过将大型 PDF 文件拆分为多个较小的 PDF 文件,可以显著减小文件尺寸,从而提升文件管理效率,加快文件打开和处理速度,尤其是在共享或上传时。本文将介绍如何使用 Spire.PDF for Python 在 Python 中实现拆分 PDF 文件的方法。
安装 Spire.PDF for Python
本教程需要 Spire.PDF for Python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.PDF
如果您不确定如何安装,请参考此教程: 如何在 Windows 中安装 Spire.PDF for Python
Python 将 PDF 文件拆分为多个单页 PDF 文件
Spire.PDF for Python 提供了一个名为 PdfDocument.Split() 的方法,用于将包含多页内容的 PDF 文档分割成多个各自仅含单页内容的 PDF 文件。以下是拆分的详细步骤:
- 创建一个 PdfDocument 类的实例。
- 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
- 使用 PdfDocument.Split() 方法进行拆分。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建一个 PdfDocument 对象
doc = PdfDocument()
# 加载一个 PDF 文件
doc.LoadFromFile("示例.pdf")
# 将 PDF 文件拆分为多个单页的 PDF 文件
doc.Split("输出/拆分结果-{0}.pdf", 1)
# 关闭 PdfDocument 对象
doc.Close()
Python 按照页面范围拆分 PDF 文件
要将一个 PDF 文件按页码范围拆分为两个或多个 PDF 文件,您需要创建两个或多个新的 PDF 文件,然后通过 InsertPage() 以及 InsertPageRange() 方法从源 PDF 中导出指定的页面或页码范围到新创建的 PDF 文件中。以下是详细的步骤:
- 创建一个 PdfDocument 对象。
- 使用 PdfDocument.LoadFromFile() 方法加载一个 PDF 文档。
- 创建三个 PdfDocument 对象。
- 使用 PdfDocument.InsertPage() 方法将源文件的第一页导出到第一个文档中。
- 使用 PdfDocument.InsertPageRange() 方法将源文件的第 2-4 页导出到第二个文档中。
- 使用 PdfDocument.InsertPageRange() 方法将源文件的剩余页导出到第三个文档中。
- 使用 PdfDocument.SaveToFile() 方法保存这三个文档。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建一个 PdfDocument 对象
doc = PdfDocument()
# 加载一个 PDF 文件
doc.LoadFromFile("示例.pdf")
# 创建三个 PdfDocument 对象
newDoc_1 = PdfDocument()
newDoc_2 = PdfDocument()
newDoc_3 = PdfDocument()
# 将源文件的第一页插入到第一个文档中
newDoc_1.InsertPage(doc, 0)
# 将源文件的第2-4页插入到第二个文档中
newDoc_2.InsertPageRange(doc, 1, 3)
# 将源文件的剩余页插入到第三个文档中
newDoc_3.InsertPageRange(doc, 4, doc.Pages.Count - 1)
# 保存这三个文档
newDoc_1.SaveToFile("输出/拆分结果-1.pdf")
newDoc_2.SaveToFile("输出/拆分结果-2.pdf")
newDoc_3.SaveToFile("输出/拆分结果-3.pdf")
# 关闭 PdfDocument 对象
doc.Close()
newDoc_1.Close()
newDoc_2.Close()
newDoc_3.Close()
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。