Word 文档中通常包含称为文档属性的元数据,涵盖了标题、作者、主题及关键词等信息。对这些属性进行操作对于文档维护、文档检索,以及在协作编辑时确保正确的归属认定极为重要。借助 Spire.Doc for Python,开发者能够自动化执行在 Word 文档中设置、读取及删除文档属性的任务,从而简化文档管理流程,并使这些流程能融入更大型的自动化系统中。本文将通过详尽的步骤说明与代码示例,展示如何利用 Spire.Doc for Python 高效地管理 Word 文件中的内置文档属性。
安装 Spire.Doc for Python
本教程需要 Spire.Doc for Python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.Doc
如果您不确定如何安装,请参考:如何在 Windows 中安装 Spire.Doc for Python
设置 Word 文档内置文档属性
Spire.Doc for Python 为开发者提供了 Document.BuiltinDocumentProperties 属性,以便访问 Word 文档的内置文档属性。这些属性的值可通过 BuiltinDocumentProperties 类下的相应属性进行设置。
以下是向 Word 文档中添加主要内置属性的步骤:
- 创建一个 Document 类的实例。
- 使用 Document.LoadFromFile() 方法加载 Word 文档。
- 通过 Document.BuiltinDocumentProperties 属性获取内置文档属性。
- 利用 BuiltinDocumentProperties 属性下的各属性添加信息到各内置文档属性。
- 使用 Document.SaveToFile() 方法保存文档。
- Python
from spire.doc import *
from spire.doc.common import *
# 创建Document类实例
doc = Document()
# 载入Word文档
doc.LoadFromFile("示例.docx")
# 设置文档预设属性
builtinProperty = doc.BuiltinDocumentProperties
builtinProperty.Title = "人工智能革命"
builtinProperty.Subject = "人工智能中神经网络的高级应用和未来方向"
builtinProperty.Author = "西蒙"
builtinProperty.Manager = "艾莉"
builtinProperty.Company = "AI研究工作室"
builtinProperty.Category = "研究"
builtinProperty.Keywords = "机器学习;神经网络;人工智能"
builtinProperty.Comments = "本文介绍的是人工智能的发展现状。"
builtinProperty.HyperLinkBase = "www.e-iceblue.com"
# Save the document
doc.SaveToFile("output/添加内置文档属性到Word文档.docx", FileFormat.Docx2019)
doc.Close()
读取 Word 文档中的内置文档属性
除了添加信息之外,BuiltinDocumentProperties 类下的属性还可以直接读取 Word 文档中已存在的内置属性信息,从而方便实现文档搜索、信息提取及文档分析等多种功能。
使用 Spire.Doc for Python 读取文档内置属性的具体步骤如下:
- 创建一个 Document 类的实例。
- 利用 Document.LoadFromFile() 方法加载 Word 文档。
- 通过 Document.BuiltinDocumentProperties 属性获取文档的内置属性。
- 调用 BuiltinDocumentProperties 类下相应的属性来获取各内置属性的信息。
- 输出文档的内置属性信息。
- Python
from spire.doc import *
from spire.doc.common import *
# 创建Document类实例
doc = Document()
# 载入Word文档
doc.LoadFromFile("output/添加内置文档属性到Word文档.docx")
# 获取文档预设属性
builtinProperties = doc.BuiltinDocumentProperties
# 获取文档预设属性信息
properties = [
"作者:" + builtinProperties.Author,
"单位:" + builtinProperties.Company,
"标题:" + builtinProperties.Title,
"主题:" + builtinProperties.Subject,
"关键词:" + builtinProperties.Keywords,
"类别:" + builtinProperties.Category,
"主管:" + builtinProperties.Manager,
"备注:" + builtinProperties.Comments,
"超链接基础:" + builtinProperties.HyperLinkBase,
"字数:" + str(builtinProperties.WordCount),
"页数:" + str(builtinProperties.PageCount),
]
# 输出预设属性信息
for i in range(0, len(properties)):
print(properties[i])
doc.Close()
删除 Word 文档中的内置文档属性
若要移除含有特定内容的文档内置属性以保护隐私信息,同时保留必要细节,可以通过将其设置为空值来实现。
从 Word 文档中移除特定内置文档属性的详细步骤如下:
- 创建一个 Document 类的实例。
- 使用 Document.LoadFromFile() 方法加载 Word 文档。
- 通过 Document.BuiltinDocumentProperties 属性获取文档的内置属性。
- 针对需要移除的属性,利用 BuiltinDocumentProperties 类下的相应属性将其值设置为 None。
- 调用 Document.SaveToFile() 方法保存更改后的文档。
- Python
from spire.doc import *
from spire.doc.common import *
# 创建Document类实例
doc = Document()
# 载入Word文档
doc.LoadFromFile("output/添加内置文档属性到Word文档.docx")
# 获取文档的预设属性
builtinProperties = doc.BuiltinDocumentProperties
# 通过将属性设置为空来移除预设属性
builtinProperties.Author = None
builtinProperties.Company = None
builtinProperties.Title = None
builtinProperties.Subject = None
builtinProperties.Keywords = None
builtinProperties.Comments = None
builtinProperties.Category = None
builtinProperties.Manager = None
# 保存文档
doc.SaveToFile("output/移除Word文档预设属性.docx", FileFormat.Docx)
doc.Close()
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。