比较两个 Word 文档以发现差异是审查修改、确保准确性及内容协作时的一项关键任务。此过程使您能够识别不同文档版本间所做的添加、删除和修改。通过比较版本,您可以高效地追踪变更、验证更新并维护文档的完整性。本文将向您介绍如何使用 Spire.Doc for Python 比较两个 Word 文档。
安装 Spire.Doc for Python
本教程需要 Spire.Doc for Python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 Windows 中。
pip install Spire.Doc
如果您不确定如何安装,请参考此教程: 如何在 Windows 中安装 Spire.Doc for Python
Python 比较两个 Word 文档
MS Word 自带“比较”功能,可直接对比文档的两个版本,并生成一份突出显示两者差异的新文档。使用 Spire.Doc for Python 提供的 Document.Compare() 方法可以实现类似的对比。以下是详细步骤:
- 创建第一个 Document 类的对象并加载原始文档。
- 创建第二个 Document 类的对象并加载修订文档。
- 调用 Document.Compare(document:'Document',author:str) 方法将两个文档进行对比。
- 调用 Document.SaveToFile() 方法保存比较后的文档。
- Python
from spire.doc import *
# 初始化Document对象并加载第一个Word文档
firstDoc = Document("会议通知A.docx")
# 初始化Document对象并加载第二个Word文档
secondDoc = Document("会议通知B.docx")
# 对比两个文档并指定比较结果中差异标注的作者名称
firstDoc.Compare(secondDoc, "冰蓝科技")
# 保存比较后的文档
firstDoc.SaveToFile("对比文档1.docx", FileFormat.Docx2016)
# 释放资源
firstDoc.Dispose() secondDoc.Dispose()
Python 比较两个 Word 文档时设置比较选项
当您的目标是专注于文本内容的变动而非格式时,无格式比较 Word 文档就显得尤为实用。Spire.Doc for Python 为此提供了 CompareOptions 类,其中包含一个 IgnoreFormatting 属性,将其设定为 True 即可忽视所有格式变化。在执行 Compare() 方法之际,只需将配置了该属性的 CompareOptions 对象作为参数传递,系统即会按需执行比较操作,确保只凸显文本差异。下面是具体的操作步骤:
- 创建第一个 Document 类的对象并加载原始文档。
- 创建第二个 Document 类的对象并加载修订文档。
- 创建 CompareOptions 对象并设置 IgnoreFormatting 属性为 True 以忽略格式比较。
- 调用 Compare(document:'Document',author:str, options:CompareOptions) 方法比较两个文档。
- 使用 Document.SaveToFile() 方法保存文档。
- Python
from spire.doc import *
# 初始化Document对象并加载第一个Word文档
firstDoc = Document("会议通知A.docx")
# 初始化Document对象并加载第二个Word文档
secondDoc = Document("会议通知B.docx")
# 设置比较选项以忽略格式比较
compareOptions = CompareOptions() compareOptions.IgnoreFormatting = True
# 对比文档
firstDoc.Compare(secondDoc, "冰蓝科技", compareOptions)
# 保存比较后的结果
firstDoc.SaveToFile("对比文档2.docx", FileFormat.Docx2016)
# 释放资源
firstDoc.Dispose() secondDoc.Dispose()
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。