C#/VB.NET 读取 Word 文档的文本内容

//加载Word文档 Document doc = new Document(); document.LoadFromFile(@"测试文档.docx"); //使用GetText方法获取文档中的所有文本 string s = doc.GetText(); File.WriteAllText("文本1.txt", s.ToString());

直接获取所有文本： VB '加载Word文档 Dim doc As New Document doc.LoadFromFile("测试文档.docx") '使用GetText方法获取文档中的所有文本 Dim s As String = doc.GetText() File.WriteAllText("文本1.txt", s.ToString())

//加载Word文档 Document document = new Document(); document.LoadFromFile(@"测试文档.docx"); StringBuilder sb = new StringBuilder(); //遍历节和段落，获取段落中的文本 foreach (Section section in document.Sections) { foreach (Paragraph paragraph in section.Paragraphs) { sb.AppendLine(paragraph.Text); } } File.WriteAllText("文本2.txt", sb.ToString());

'加载Word文档 Dim doc As New Document doc.LoadFromFile("测试文档.docx") Dim sb As StringBuilder = New StringBuilder() '遍历节和段落，获取段落中的文本 For Each section As Section In doc.Sections For Each paragraph As Paragraph In section.Paragraphs sb.AppendLine(paragraph.Text) Next Next File.WriteAllText("文本2.txt", sb.ToString)