PDF 文件格式能够保留原始文档的格式和布局,非常适合共享和打印。然而,通常情况下,PDF文件是不可编辑的,除非使用专门的软件或工具。通过将 PDF 文档转换为 Word 格式,你可以轻松利用 Word 的功能对文档进行进一步的编辑,例如修改、添加或删除文本,插入图片,添加批注和调整格式等。这篇文章将介绍如何使用 Spire.PDF for Python 在 Python 中将 PDF 文档转换为 Word DOC 或 DOCX 格式。
安装 Spire.PDF for Python
本教程需要用到 Spire.PDF for Python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.PDF
如果您不清楚如何安装,请参考此教程: 如何在 Windows 中安装 Spire.PDF for Python
Python 将 PDF 转换为 Word DOC 或 DOCX
Spire.PDF for Python 提供的 PdfDocument.SaveToFile(filename:str, fileFormat:FileFormat) 方法,可将 PDF 文档转换为 Word DOC 和 DOCX 格式。详细步骤如下:
- 创建 PdfDocument 类的对象。
- 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
- 使用 PdfDocument.SaveToFile(filename:str, fileFormat:FileFormat) 方法将 PDF 文档转换为 Word DOCX 或 DOC 文件。
- Python
from spire.pdf.common import *
from spire.pdf import *
# 创建PdfDocument类的对象
doc = PdfDocument()
# 加载PDF文档
doc.LoadFromFile("示例.pdf")
# 将该PDF文档转换为Word DOCX格式
doc.SaveToFile("Pdf转Docx.docx", FileFormat.DOCX)
# 或将该PDF文档转换为Word DOC格式
doc.SaveToFile("Pdf转Doc.doc", FileFormat.DOC)
# 关闭PdfDocument对象
doc.Close()
Python 将 PDF 转换为 Word 时设置文档属性
文档属性是与文档相关的属性或信息,用于提供文件的详细信息,例如文档的作者、标题、主题、版本、关键词、类别等等。通过这些属性,用户可以更全面地了解文档的内容和特征。
Spire.PDF for Python 提供的 PdfToDocConverter 类,允许开发人员将 PDF 文档转换为 Word DOCX 文件并为文件设置文档属性。具体步骤如下。
- 创建 PdfToDocConverter 类的对象并将输入 PDF 文档的路径作为参数传入该类的构造函数中。
- 使用 PdfToDocConverter 类的属性设置转换后的 Word DOCX 文件的文档属性,例如标题、主题、作者和关键词等。
- 使用 PdfToDocConverter.SaveToDocx()方法将 PDF 文档转换为 Word DOCX 文件。
- Python
from spire.pdf.common import *
from spire.pdf import *
#创建PdfToDocConverter类的对象
converter = PdfToDocConverter("示例.pdf")
# 为转换后的DOCX文件设置文档属性,如标题、主题、作者和关键词等
converter.DocxOptions.Title = "Spire.PDF for Python"
converter.DocxOptions.Subject = "该文档提供了Spire.PDF for Python产品的概述。"
converter.DocxOptions.Tags = "PDF, Python"
converter.DocxOptions.Categories = " PDF处理库"
converter.DocxOptions.Commments = " Spire.PDF是一个多平台的通用库,支持.NET、Java、Python和C++等多种平台。"
converter.DocxOptions.Authors = "肖恩"
converter.DocxOptions.LastSavedBy = "亚楠"
converter.DocxOptions.Revision = 8
converter.DocxOptions.Version = "4.0"
converter.DocxOptions.ProgramName = "Spire.PDF for Python"
converter.DocxOptions.Company = "E-iceblue"
converter.DocxOptions.Manager = "E-iceblue"
# 将PDF文档转换为Word DOCX文件
converter.SaveToDocx("转Word并设置文档属性.docx")
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。