Powerpoint-Text extrahieren

So extrahieren Sie Text aus PowerPoint mithilfe der .NET REST API.

Im Bereich der modernen Informationsverarbeitung sind PowerPoint-Präsentationen zu einem allgegenwärtigen Mittel geworden, um Informationen auszutauschen, wirkungsvolle Präsentationen zu liefern und Ideen zu vermitteln. Wenn Sie nun verborgene Trends aufdecken, Inhalte umfunktionieren oder ein tieferes Verständnis erlangen möchten, ist die Fähigkeit, Text aus PowerPoint zu extrahieren, eine erstaunliche Fähigkeit. Allerdings kann das Extrahieren des Textes aus diesen Präsentationen eine anspruchsvolle Aufgabe sein, insbesondere wenn es sich um große oder komplexe Dateien handelt. In diesem Artikel wird eine leistungsstarke Lösung zum Extrahieren von Text aus PowerPoint vorgestellt und die innovativen Funktionen des Aspose.Slides Cloud SDK für .NET erläutert.

REST-API zum Extrahieren von PowerPoint-Text

Wenn es darum geht, Text aus PowerPoint-Präsentationen zu extrahieren, ist Aspose.Slides Cloud SDK für .NET ein leistungsstarkes und vielseitiges Tool. Mit seinem umfangreichen Funktionsumfang und der umfassenden API ermöglicht dieses SDK Entwicklern, mühelos und präzise Text aus Präsentationen zu extrahieren.

Der erste Schritt ist die Installation des SDK. Daher müssen wir zunächst im NuGet-Paketmanager nach „Aspose.Slides-Cloud“ suchen und auf die Schaltfläche „Paket hinzufügen“ klicken. Falls Sie noch kein Konto über Cloud-Dashboard haben, erstellen Sie einfach ein kostenloses Konto, indem Sie den Anweisungen unter Schnellstart folgen .cloud/slides/quickstart/).

Extrahieren Sie Text aus PowerPoint mit C# .NET

Lassen Sie uns die Details untersuchen, wie wir den Text mithilfe des C# .NET-Codeausschnitts effizient aus vollständigem PowerPoint extrahieren können.

// Weitere Beispiele finden Sie unter https://github.com/aspose-slides-cloud
// Holen Sie sich Client-Anmeldeinformationen von https://dashboard.aspose.cloud/
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// Erstellen Sie eine Instanz von SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// Name der eingegebenen PowerPoint-Präsentation
string sourcePPTX = "Inspirational bookmarks.pptx";

// Rufen Sie die API auf, um den gesamten Text aus der PowerPoint-Präsentation zu extrahieren
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// Erstellen Sie ein StreamWriter-Objekt, damit wir extrahierte Inhalte speichern können
StreamWriter sw = new StreamWriter("Test.txt");

// Durchlaufen Sie alle Instanzen des extrahierten Texts
foreach (var textItem in textItems.Items)
{
    // Schreiben Sie jedes Vorkommen von Text in eine Textdatei im System
    sw.WriteLine(textItem.Text);
}
// Schließen Sie den StreamWriter 
sw.Close();

Lassen Sie uns nun unser Verständnis für den oben genannten Codeausschnitt entwickeln.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

Erstellen Sie ein Objekt der SlidesApi-Klasse, bei dem wir die Client-Anmeldeinformationen als Argumente übergeben.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

Rufen Sie die API auf, um alle im Cloud-Speicher verfügbaren Textinhalte aus der PowerPoint-Präsentation zu extrahieren.

StreamWriter sw = new StreamWriter("Test.txt");

Erstellen Sie StreamWriter, der uns dabei hilft, den extrahierten Inhalt auf dem lokalen Laufwerk zu speichern.

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

Durchlaufen Sie jedes Vorkommen des extrahierten Texts und speichern Sie die Ausgabe in einer Textdatei.

Extrahieren Sie Text aus PowerPoint

Vorschau der PowerPoint-Textextraktion.

Sie können das im obigen Beispiel verwendete PowerPoint-Beispiel von Inspirational bookmarks.pptx herunterladen. .

Extrahieren Sie Text aus einer bestimmten Folie mit cURL-Befehlen

Eine weitere Alternative zum Extrahieren von Text aus PowerPoint-Folien ist die Verwendung von cURL-Befehlen. Mit cURL können Sie direkt über HTTP-Anfragen mit der Aspose.Slides Cloud-API interagieren, was es zu einer flexiblen und zugänglichen Option für Textextraktionsfunktionen macht. Indem Sie also den entsprechenden API-Endpunkt erstellen und die gewünschten Parameter angeben, können Sie einen cURL-Befehl senden, um Text von bestimmten Folien oder der gesamten Präsentation abzurufen.

Der erste Schritt bei diesem Ansatz besteht darin, ein JWT-Zugriffstoken zu generieren. Führen Sie daher bitte den folgenden Befehl aus:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Führen Sie nun den folgenden Befehl aus, um Text aus der zweiten Folie einer PowerPoint-Präsentation zu extrahieren.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

Ersetzen Sie „sourceFile“ durch den Namen einer PowerPoint-Eingabe, die im Cloud-Speicher verfügbar ist, und „accessToken“ durch das oben generierte JWT-Zugriffstoken.

Abschluss

Zusammenfassend haben wir gelernt, dass die Möglichkeit, Text aus PowerPoint-Folien zu extrahieren, eine wertvolle Funktion ist, die es uns ermöglicht, auf den Textinhalt in Präsentationen zuzugreifen und ihn für verschiedene Zwecke zu nutzen. Ganz gleich, ob es sich um Datenanalysen, Inhaltsanalysen oder andere Anwendungen handelt: Durch das Extrahieren von Text aus PowerPoint-Folien können wir die in diesen Dateien enthaltenen Informationen freigeben. Durch die Nutzung des Aspose.Slides Cloud SDK für .NET können wir Textextraktionsvorgänge in .NET-Anwendungen einfach und effizient durchführen oder die Verwendung von cURL-Befehlen bietet einen plattformunabhängigen und bequemen Ansatz.

In Verbindung stehende Artikel

Wir empfehlen Ihnen dringend, die folgenden Blogs zu besuchen: