提取PowerPoint文本

如何使用 .NET REST API 从 PowerPoint 中提取文本。

在现代信息处理领域,PowerPoint 演示文稿已成为共享信息、提供有影响力的演示和传达想法的普遍手段。现在,如果您想发现隐藏的趋势、重新利用内容或获得更深入的了解,从 PowerPoint 中提取文本的能力是一项了不起的技能。然而,从这些演示文稿中提取文本可能是一项具有挑战性的任务,尤其是在处理大型或复杂文件时。本文介绍了从 PowerPoint 中提取文本的强大解决方案,并解释了 Aspose.Slides Cloud SDK for .NET 的创新功能。

用于提取 PowerPoint 文本的 REST API

当谈到从 PowerPoint 演示文稿中提取文本时,Aspose.Slides Cloud SDK for .NET 是一款功能强大且多功能的工具。凭借其丰富的功能和全面的 API,该 SDK 使开发人员能够轻松、精确、高效地从演示文稿中提取文本。

第一步是安装SDK。因此,我们需要首先在 NuGet 包管理器中搜索“Aspose.Slides-Cloud”,然后单击“添加包”按钮。如果您没有 云仪表板 上的现有帐户,只需按照[快速启动](https://docs.aspose 上指定的说明创建一个免费帐户即可.cloud/slides/quickstart/)。

使用 C# .NET 从 PowerPoint 中提取文本

让我们详细探讨如何使用 C# .NET 代码片段从完整的 PowerPoint 中高效提取文本。

// 有关更多示例,请访问 https://github.com/aspose-slides-cloud
// 从 https://dashboard.aspose.cloud/ 获取客户端凭据
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// 创建 SlidesApi 的实例
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// 输入 PowerPoint 演示文稿的名称
string sourcePPTX = "Inspirational bookmarks.pptx";

// 调用API从PowerPoint演示文稿中提取所有文本
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// 创建一个StreamWriter对象,以便我们可以保存提取的内容
StreamWriter sw = new StreamWriter("Test.txt");

// 迭代提取文本的每个实例
foreach (var textItem in textItems.Items)
{
    // 将每次出现的文本写入系统上的文本文件
    sw.WriteLine(textItem.Text);
}
// 关闭 StreamWriter 
sw.Close();

现在让我们加深对上述代码片段的理解。

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

创建 SlidesApi 类的对象,我们将客户端凭据作为参数传递到其中。

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

调用 API 从云存储中可用的 PowerPoint 演示文稿中提取所有文本内容。

StreamWriter sw = new StreamWriter("Test.txt");

创建 StreamWriter 它将帮助我们将提取的内容保存在本地驱动器上。

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

迭代每次出现的提取文本并将输出保存在文本文件中。

从 PowerPoint 中提取文本

PowerPoint 文本提取预览。

您可以考虑从 Inspirational bookmarks.pptx 下载上述示例中使用的示例 PowerPoint 。

使用 cURL 命令从特定幻灯片中提取文本

从 PowerPoint 幻灯片中提取文本的另一种方法是使用 cURL 命令。借助 cURL,您可以直接通过 HTTP 请求与 Aspose.Slides Cloud API 进行交互,使其成为文本提取功能的灵活且可访问的选项。因此,通过构建适当的 API 端点并指定所需的参数,您可以发送 cURL 命令来从特定幻灯片或整个演示文稿中检索文本。

此方法的第一步是生成 JWT 访问令牌。因此,请执行以下命令:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

现在,执行以下命令从 PowerPoint 演示文稿的第二张幻灯片中提取文本。

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

sourceFile 替换为云存储中可用的输入 PowerPoint 的名称,将 accessToken 替换为上面生成的 JWT 访问令牌。

结论

总之,我们了解到从 PowerPoint 幻灯片中提取文本的能力是一项很有价值的功能,它使我们能够出于各种目的访问和利用演示文稿中的文本内容。无论是用于数据分析、内容解析还是任何其他应用程序,从 PowerPoint 幻灯片中提取文本都使我们能够解锁这些文件中包含的信息。通过利用Aspose.Slides Cloud SDK for .NET,我们可以在.NET应用程序中轻松高效地执行文本提取操作,或者使用cURL命令提供独立于平台的便捷方法。

有用的链接

相关文章

我们强烈建议访问以下博客: