在处理 PDF 文件时,有时可能需要裁剪 PDF 中的页面,以去除不必要的页边距、边框或不需要的内容。通过这样做,您可以使文档符合特定的设计要求或页面大小,从而确保输出更美观或功能更优化。本文将介绍如何使用 Spire.PDF for Python 在 Python 中裁剪 PDF 中的页面。
安装 Spire.PDF for Python
本教程需要用到 Spire.PDF for Python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.PDF
如果您不清楚如何安装,请参考: 如何在 Windows 中安装 Spire.PDF for Python
Python 裁剪 PDF 页面
Spire.PDF for Python 允许您指定一个矩形区域,然后使用 PdfPageBase.CropBox 属性裁剪页面中的指定区域。具体步骤如下:
- 创建 PdfDocument 对象。
- 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文件。
- 使用 PdfDocument.Pages[] 属性获取指定页面。
- 使用 PdfPageBase.CropBox 属性将页面裁剪至指定区域。
- 使用 PdfDocument.SaveToFile() 方法保存结果文件。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建PdfDocument对象
pdf = PdfDocument()
# 加载PDF文件
pdf.LoadFromFile("示例文档.pdf")
# 获取第一张页面
page = pdf.Pages[0]
# 按指定区域裁剪页面
page.CropBox = RectangleF(0.0, 50.0, 600.0, 320.0)
# 保存结果文件
pdf.SaveToFile("裁剪PDF.pdf")
pdf.Close()
Python 裁剪 PDF 页面并导出为图片
为了完成这项任务,你可以使用 PdfDocument.SaveAsImage(pageIndex: int) 方法将裁剪了的 PDF 页面转换为图像流,然后再进一步保存为指定的图片格式。具体步骤如下:
- 创建 PdfDocument 对象。
- 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文件。
- 使用 PdfDocument.Pages[] 属性获取指定页面。
- 使用 PdfPageBase.CropBox 属性将页面裁剪至指定区域。
- 使用 PdfDocument.SaveAsImage() 方法将裁剪后的页面转换为图像流。
- 使用 Stream.Save() 方法将图像保存为 PNG、JPG 或 BMP 文件。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建PdfDocument对象
pdf = PdfDocument()
# 加载PDF文件
pdf.LoadFromFile("示例文档.pdf")
# 获取第一张页面
page = pdf.Pages[0]
# 按指定区域裁剪页面
page.CropBox = RectangleF(0.0, 50.0, 600.0, 320.0)
# 将页面转换为图片
with pdf.SaveAsImage(0) as imageS:
# 将图像保存为 PNG 文件
imageS.Save("裁剪PDF导出为图片.png")
pdf.Close()
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。