要获取 PDF 文件的页数,可以在 Adobe 等 PDF 阅读器中打开 PDF 文件,这些阅读器都有内置的页数统计功能。然而,当有一批 PDF 文件时,打开每个文件检查其包含的页数是一项耗时的任务。在本文中,您将学习如何通过使用 Spire.PDF for Python 在 Python 中获取 PDF 文件的页数。
安装 Spire.PDF for Python
本教程需要 Spire.PDF for Python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.PDF
如果您不确定如何安装,请参阅此教程: 如何在 Windows 中安装 Spire.PDF for Python
Python 获取 PDF 文件的页数
Spire.PDF for Python 提供了 PdfDocument.Pages.Count 属性,可在不打开 PDF 文件的情况下快速获取其页数。具体步骤如下:
- 创建一个 PdfDocument 对象。
- 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
- 使用 PdfDocument.Pages.Count 属性获取 PDF 文档的页数。
- 将结果直接打印出来或写入 TXT 文件。
- Python
from spire.pdf.common import *
from spire.pdf import *
def AppendText(fname: str, text: str):
fp = open(fname, "w")
fp.write(text + "\n")
fp.close()
# 指定输入和输出文件
inputFile = "lshort-zh-cn.pdf"
outputFile = "文档页码总数.txt"
# 创建一个PdfDocument对象
pdf = PdfDocument()
# 加载指定的PDF文档
pdf.LoadFromFile(inputFile)
# 获取文档的总页数
count = pdf.Pages.Count
# 输出文档总页数信息
print("总页数:", count)
# 写入页数信息到TXT文件
AppendText(outputFile, "文档总页数: " + str(count))
pdf.Close()
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。