HTML 格式是网页文件的标准格式,专门用于浏览器中展示网页的各种内容。由于 Word 无法支持 HTML 中的全部元素,所以大多数 HTML 都不能在 Word 中进行很好地呈现。如果你想要在转换HTML文件为Word时保留其排版布局,就需要更改HTML代码,避免使用Word不支持HTML标签、层叠样式、 JavaScript 等元素。本文将展示如何使用 Spire.Doc for .NET 将 HTML 转为 Word 。
安装 Spire.Doc for .NET
首先,您需要将 Spire.Doc for.NET 包含的 DLL 文件作为引用添加到您的 .NET 项目中。DLL 文件可以从 此链接 下载,也可以通过 NuGet 安装。
PM> Install-Package Spire.Doc
将 HTML 文件转为 Word
详细操作步骤如下:
- 创建 Document 对象。
- 用 Document.LoadFormFile() 从磁盘加载 HTML 文件。
- 用 Document.SaveToFile() 方法将 HTML 文件转为 Word 并保存。
- C#
- VB.NET
using System;
using Spire.Doc;
using Spire.Doc.Documents;
namespace ConvertHTMLtoWord
{
internal class Program
{
static void Main(string[] args)
{
//创建 Document 对象
Document document = new Document();
//从磁盘加载 HTML 文件
document.LoadFromFile(@"D:\testp\示例.html", FileFormat.Html, XHTMLValidationType.None);
//将 HTML 文件转为 Word 并保存
String result = "HtmltoWord.docx";
document.SaveToFile(result, FileFormat.Docx2013);
}
}
}
Imports System
Imports Spire.Doc
Imports Spire.Doc.Documents
Module Program
Sub Main(args As String())
'创建 Document 对象
Dim document As New Document()
'从磁盘加载 HTML 文件
document.LoadFromFile("D:\testp\示例.html", FileFormat.Html, XHTMLValidationType.None)
'将 HTML 文件转为 Word 并保存
Dim result As String = "Html转Word.docx"
document.SaveToFile(result, FileFormat.Docx2013)
End Sub
End Module
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。