当将包含大量媒体文件和图像的 PowerPoint 文档发送给他人进行文本校对时,您可能会发现由于文件大小太大,传输速度相当慢。在这种情况下,最好先将 PowerPoint 中的文本提取到 MS Word 或记事本中,然后只发送文本内容。此外,还可以对提取的文本内容进行存档或备份,以备将来参考。在本文中,您将学习如何使用 Spire.Presentation for .NET 在 PowerPoint 演示文稿中提取文本。
安装 Spire.Presentation for .NET
首先,您需要添加 Spire.Presentation for .NET 包中包含的 DLL 文件作为 .NET 项目中的引用。DLL 文件可以从此链接下载或通过 NuGet 安装。
PM> Install-Package Spire.Presentation
从 PowerPoint 演示文稿中提取文本
为了便于在 PowerPoint 文档中共享或传递文本信息,有时需要进行文本提取操作。以下是从所有演示文稿幻灯片中提取文本并保存在 TXT 文件中的步骤。
- 初始化 Presentation 类的实例。
- 使用 Presentation.LoadFromFile() 方法加载 PowerPoint 文档示例。
- 创建 StringBuilder 实例。
- 遍历文档中的每张幻灯片,然后遍历每张幻灯片中的所有形状。
- 确定形状是否为 IAutoShape 类型。如果是,则遍历每个形状中的所有段落,并使用 TextParagraph.Text 属性获取段落文本。
- 使用 StringBuilder.AppendLine() 方法将提取的文本附加到StringBuilder实例
- 创建一个新的txt文件,并使用 File.WriteAllText() 方法将提取的文本写入该文件。
- C#
- VB.NET
using Spire.Presentation;
using Spire.Presentation.Charts;
using Spire.Presentation.Converter.Equation.Word;
using System;
using System.IO;
using System.Text;
namespace ExtractText
{
class Program
{
static void Main(string[] args)
{
//初始化Presentation类的实例
Presentation presentation = new Presentation();
//载PowerPoint文档示例
presentation.LoadFromFile("呼吁反虐待动物立法.pptx");
//创建StringBuilder实例
StringBuilder sb = new StringBuilder();
//遍历文档中的每张幻灯片
foreach (ISlide slide in presentation.Slides)
{
//遍历每张幻灯片中的每个形状
foreach (IShape shape in slide.Shapes)
{
//检查形状是否为IAutoShape类型
if (shape is IAutoShape)
{
//以每种形状遍历所有段落
foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
{
//提取文本并保存到StringBuilder实例
sb.AppendLine(tp.Text);
}
}
}
}
//创建一个新的txt文件以保存提取的文本
File.WriteAllText("提取文本.txt", sb.ToString());
presentation.Dispose();
}
}
}
Imports Spire.Presentation
Imports Spire.Presentation.Charts
Imports Spire.Presentation.Converter.Equation.Word
Imports System.IO
Imports System.Text
Namespace ExtractText
Friend Class Program
Private Shared Sub Main(ByVal args As String())
'初始化Presentation类的实例
Dim presentation As Presentation = New Presentation()
'载PowerPoint文档示例
presentation.LoadFromFile("呼吁反虐待动物立法.pptx")
'创建StringBuilder实例
Dim sb As StringBuilder = New StringBuilder()
'遍历文档中的每张幻灯片
For Each slide As ISlide In presentation.Slides
'遍历每张幻灯片中的每个形状
For Each shape As IShape In slide.Shapes
'检查形状是否为IAutoShape类型
If TypeOf shape Is IAutoShape Then
'以每种形状遍历所有段落
For Each tp As TextParagraph In TryCast(shape, IAutoShape).TextFrame.Paragraphs
'提取文本并保存到StringBuilder实例
sb.AppendLine(tp.Text)
Next
End If
Next
Next
'创建一个新的txt文件以保存提取的文本
Call File.WriteAllText("提取文本.txt", sb.ToString())
presentation.Dispose()
End Sub
End Class
End Namespace
申请临时 License
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该Email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用JavaScript。获取有效期 30 天的临时许可证。