提取PowerPoint文本

如何使用 .NET REST API 從 PowerPoint 中提取文字。

在現代資訊處理領域,PowerPoint 簡報已成為分享資訊、提供有影響力的簡報和傳達想法的普遍手段。現在,如果您想發現隱藏的趨勢、重新利用內容或獲得更深入的了解,從 PowerPoint 中提取文字的能力是一項了不起的技能。然而,從這些簡報中提取文字可能是一項具有挑戰性的任務,尤其是在處理大型或複雜文件時。本文介紹了從 PowerPoint 中提取文字的強大解決方案,並解釋了 Aspose.Slides Cloud SDK for .NET 的創新功能。

用於提取 PowerPoint 文字的 REST API

當涉及從 PowerPoint 簡報中提取文字時,Aspose.Slides Cloud SDK for .NET 是一款功能強大且多功能的工具。憑藉其豐富的功能和全面的 API,該 SDK 使開發人員能夠輕鬆、精確、高效地從簡報中提取文字。

第一步是安裝SDK。因此,我們需要先在 NuGet 套件管理器中搜尋“Aspose.Slides-Cloud”,然後點擊“新增套件”按鈕。如果您沒有雲端儀表板 上的現有帳戶,只需按照[快速啟動](https://docs.aspose 上指定的說明建立免費帳戶即可.cloud/slides/quickstart/)。

使用 C# .NET 從 PowerPoint 中提取文本

讓我們詳細探討如何使用 C# .NET 程式碼片段從完整的 PowerPoint 中高效提取文字。

// 有關更多範例,請造訪 https://github.com/aspose-slides-cloud
// 從 https://dashboard.aspose.cloud/ 取得客戶端憑證
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// 建立 SlidesApi 的實例
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// 輸入 PowerPoint 簡報的名稱
string sourcePPTX = "Inspirational bookmarks.pptx";

// 呼叫API從PowerPoint簡報中提取所有文本
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// 建立一個StreamWriter對象,以便我們可以保存提取的內容
StreamWriter sw = new StreamWriter("Test.txt");

// 迭代提取文字的每個實例
foreach (var textItem in textItems.Items)
{
    // 將每次出現的文字寫入系統上的文字文件
    sw.WriteLine(textItem.Text);
}
// 關閉 StreamWriter 
sw.Close();

現在讓我們加深對上述程式碼片段的理解。

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

建立 SlidesApi 類別的對象,我們在其中傳遞客戶端憑證作為參數。

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

呼叫 API 從雲端儲存中可用的 PowerPoint 簡報中提取所有文字內容。

StreamWriter sw = new StreamWriter("Test.txt");

建立 StreamWriter 它將幫助我們將提取的內容保存在本機磁碟機上。

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

迭代每次出現的提取文字並將輸出保存在文字檔案中。

從 PowerPoint 中提取文本

PowerPoint 文字擷取預覽。

您可以考慮從 Inspirational bookmarks.pptx 下載上述範例中使用的範例 PowerPoint 。

使用 cURL 命令從特定幻燈片中提取文本

從 PowerPoint 投影片中提取文字的另一種方法是使用 cURL 命令。透過 cURL,您可以直接透過 HTTP 請求與 Aspose.Slides Cloud API 進行交互,使其成為文字擷取功能的靈活且可存取的選項。因此,透過建立適當的 API 端點並指定所需的參數,您可以傳送 cURL 命令來從特定投影片或整個簡報中擷取文字。

此方法的第一步是產生 JWT 存取令牌。因此,請執行以下命令:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

現在,執行以下命令從 PowerPoint 簡報的第二張投影片中提取文字。

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

sourceFile 替換為雲端儲存中可用的輸入 PowerPoint 的名稱,將 accessToken 替換為上面產生的 JWT 存取權杖。

結論

總而言之,我們了解到,從 PowerPoint 投影片中提取文字的能力是一項很有價值的功能,它使我們能夠出於各種目的存取和利用簡報中的文字內容。無論是用於數據分析、內容解析或任何其他應用程序,從 PowerPoint 幻燈片中提取文字都使我們能夠解鎖這些文件中包含的資訊。透過利用Aspose.Slides Cloud SDK for .NET,我們可以在.NET應用程式中輕鬆有效率地執行文字擷取操作,或使用cURL指令提供獨立於平台的便捷方法。

有用的連結

相關文章

我們強烈建議您造訪以下部落格: