量大零散但内容相关的 PDF 文档在处理时非常麻烦,且对这些文档的管理也较为复杂。合并这些 PDF 文档可以很好地解决这些问题。合并 PDF 文档不仅可以简化文档处理流程,还可以方便分享和阅览,从而显著提高工作效率。本文将展示如何使用 Spire.PDF for Python 在 Python 程序中合并 PDF 文件。
安装 Spire.PDF for Python
本教程需要用到 Spire.PDF for Python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.PDF
如果您不确定如何安装,请参考本教程:如何在 Windows 中安装 Spire.PDF for Python
用 MergeFiles() 方法合并 PDF 文档
Spire.PDF for Python 中的 PdfDocument.MergeFiles() 方法可以直接将多个 PDF 文档合并为一个 PDF 文档。以下是详细操作步骤:
- 创建 PDF 文件路径列表。
- 使用 Document.MergeFiles(inputFiles: List[str]) 方法合并 PDF 文件。
- 使用 PdfDocumentBase.Save(filename: str, FileFormat.PDF) 方法保存合并后的文档。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建PDF文件路径列表
inputFile1 = "示例1.pdf"
inputFile2 = "示例2.pdf"
inputFile3 = "示例3.pdf"
files = [inputFile1, inputFile2, inputFile3]
# 合并PDF文档
pdf = PdfDocument.MergeFiles(files)
# 保存结果文档
pdf.Save("output/合并PDF.pdf", FileFormat.PDF)
pdf.Close()
通过复制页面合并 PDF 文档
使用 PdfDocument.AppendPage(PdfDocument) 方法可以通过克隆页面的方式合并PDF文件。具体步骤如下:
- 创建 PDF 文件路径列表。
- 将每个 PDF 文档作为 PdfDocument 对象加载,并将它们添加到列表中。
- 创建一个 PdfDocument 对象以创建新的 PDF 文件。
- 遍历每个加载的 PDF 文档,并使用 PdfDocument.appendPage() 方法将它们的页面插入到新的 PDF 文档中。
- 使用 PdfDocument.SaveToFile() 方法保存新的 PDF 文档。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建PDF文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]
# 加载每个PDF文件并添加到列表中
pdfs = []
for file in files:
pdfs.append(PdfDocument(file))
# 创建一个PdfDocument对象
newPdf = PdfDocument()
# 将加载的PDF文档的页面插入到新的PDF文档中
for pdf in pdfs:
newPdf.AppendPage(pdf)
# 保存新的PDF文档
newPdf.SaveToFile("output/复制页面合并PDF.pdf")
合并不同 PDF 文档的指定页面
Spire.PDF for Python 还支持使用 PdfDocument.InsertPage() 方法和 PdfDocument.InsertPageRange() 方法,从一个 PDF 文档中选择特定页面并插入到另一个 PDF 文档中,从而实现合并不容 PDF 文档的指定页面。具体步骤如下:
- 创建 PDF 文件路径列表。
- 将每个 PDF 文档作为 PdfDocument 对象加载,并将它们添加到列表中。
- 创建一个 PdfDocument 对象以创建新的 PDF 文件。
- 使用 PdfDocument.InsertPage(PdfDocument, pageIndex: int) 方法和 PdfDocument.InsertPageRange(PdfDocument, startIndex: int, endIndex: int) 方法将加载的文档中选择的页面插入到新的 PDF 文档中。
- 使用 PdfDocument.SaveToFile() 方法保存新的 PDF 文档。
- Python
from spire.pdf import *
from spire.pdf.common import *
# 创建PDF文件路径列表
file1 = "示例1.pdf"
file2 = "示例2.pdf"
file3 = "示例3.pdf"
files = [file1, file2, file3]
# 加载每个PDF文件并添加到列表中
pdfs = []
for file in files:
pdfs.append(PdfDocument(file))
# 创建一个PdfDocument对象
newPdf = PdfDocument()
# 将加载的PDF文档中选择的页面插入到新文档中
newPdf.InsertPage(pdfs[0], 0)
newPdf.InsertPage(pdfs[1], 1)
newPdf.InsertPageRange(pdfs[2], 0, 1)
# 保存新的PDF文档
newPdf.SaveToFile("output/合并不同PDF的指定页面.pdf")
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。