wyodrębnij tekst programu Powerpoint

Jak wyodrębnić tekst z programu PowerPoint przy użyciu interfejsu API REST platformy .NET.

W dziedzinie nowoczesnego przetwarzania informacji prezentacje programu PowerPoint stały się wszechobecnym sposobem udostępniania informacji, dostarczania efektownych prezentacji i przekazywania pomysłów. Jeśli chcesz odkryć ukryte trendy, zmienić przeznaczenie treści lub uzyskać głębsze zrozumienie, możliwość wyodrębnienia tekstu z programu PowerPoint to niesamowita umiejętność. Jednak wyodrębnienie tekstu z takich prezentacji może być trudnym zadaniem, szczególnie w przypadku dużych lub złożonych plików. W tym artykule przedstawiono potężne rozwiązanie do wyodrębniania tekstu z programu PowerPoint, a także wyjaśniono innowacyjne możliwości pakietu Aspose.Slides Cloud SDK dla .NET.

API REST do wyodrębniania tekstu programu PowerPoint

Jeśli chodzi o wyodrębnianie tekstu z prezentacji programu PowerPoint, Aspose.Slides Cloud SDK dla .NET wyróżnia się jako potężne i wszechstronne narzędzie. Dzięki bogatemu zestawowi funkcji i wszechstronnemu interfejsowi API ten zestaw SDK umożliwia programistom łatwe wyodrębnianie tekstu z prezentacji z precyzją i wydajnością.

Pierwszym krokiem jest instalacja pakietu SDK. Musimy więc najpierw wyszukać „Aspose.Slides-Cloud” w menedżerze pakietów NuGet i kliknąć przycisk „Dodaj pakiet”. Jeśli nie masz konta w panelu chmury, po prostu utwórz bezpłatne konto, postępując zgodnie z instrukcjami podanymi w [szybkim uruchomieniu](https://docs.aspose .cloud/slides/szybki start/).

Wyodrębnij tekst z programu PowerPoint przy użyciu języka C# .NET

Przyjrzyjmy się szczegółom, w jaki sposób możemy efektywnie wyodrębnić tekst z całego programu PowerPoint przy użyciu fragmentu kodu C# .NET.

// Więcej przykładów można znaleźć na stronie https://github.com/aspose-slides-cloud
// Uzyskaj dane uwierzytelniające klienta z https://dashboard.aspose.cloud/
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// utwórz instancję SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// nazwa wejściowej prezentacji PowerPoint
string sourcePPTX = "Inspirational bookmarks.pptx";

// Wywołaj interfejs API, aby wyodrębnić cały tekst z prezentacji programu PowerPoint
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// Utwórz obiekt StreamWriter, abyśmy mogli zapisać wyodrębnioną zawartość
StreamWriter sw = new StreamWriter("Test.txt");

// Iteruj po każdym wystąpieniu wyodrębnionego tekstu
foreach (var textItem in textItems.Items)
{
    // zapisz każde wystąpienie tekstu do pliku tekstowego w systemie
    sw.WriteLine(textItem.Text);
}
// zamknij StreamWriter 
sw.Close();

Teraz rozwińmy naszą wiedzę na temat powyższego fragmentu kodu.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

Utwórz obiekt klasy SlidesApi, w którym przekazujemy referencje klienta jako argumenty.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

Wywołaj interfejs API, aby wyodrębnić całą zawartość tekstową z prezentacji programu PowerPoint dostępnej w chmurze.

StreamWriter sw = new StreamWriter("Test.txt");

Utwórz StreamWriter, który pomoże nam zapisać wypakowaną zawartość na dysku lokalnym.

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

Wykonaj iterację po każdym wystąpieniu wyodrębnionego tekstu i zapisz wynik w pliku tekstowym.

Wyodrębnij tekst z programu PowerPoint

Podgląd ekstrakcji tekstu w programie PowerPoint.

Możesz rozważyć pobranie przykładowego programu PowerPoint użytego w powyższym przykładzie z Inspirational bookmarks.pptx .

Wyodrębnij tekst z konkretnego slajdu za pomocą poleceń cURL

Inną alternatywą wyodrębnienia tekstu ze slajdów programu PowerPoint jest użycie poleceń cURL. Dzięki cURL możesz wchodzić w interakcję z interfejsem API Aspose.Slides Cloud bezpośrednio poprzez żądania HTTP, co czyni go elastyczną i dostępną opcją ekstrakcji tekstu. Zatem konstruując odpowiedni punkt końcowy API i określając żądane parametry, możesz wysłać polecenie cURL w celu pobrania tekstu z określonych slajdów lub całej prezentacji.

Pierwszym krokiem w tym podejściu jest wygenerowanie tokena dostępu JWT. Wykonaj więc następujące polecenie:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Teraz wykonaj następujące polecenie, aby wyodrębnić tekst z drugiego slajdu prezentacji programu PowerPoint.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

Zamień „sourceFile” na nazwę wejściowego pliku PowerPoint dostępnego w chmurze, a „accessToken” na token dostępu JWT wygenerowany powyżej.

Wniosek

Podsumowując, dowiedzieliśmy się, że możliwość wyodrębnienia tekstu ze slajdów programu PowerPoint to cenna funkcja, która pozwala nam uzyskać dostęp do treści tekstowych w prezentacjach i wykorzystać je do różnych celów. Niezależnie od tego, czy chodzi o analizę danych, analizowanie treści, czy jakąkolwiek inną aplikację, wyodrębnianie tekstu ze slajdów programu PowerPoint umożliwia nam odblokowanie informacji zawartych w tych plikach. Wykorzystując pakiet Aspose.Slides Cloud SDK dla .NET, możemy łatwo i efektywnie wykonywać operacje wyodrębniania tekstu w aplikacji .NET lub użycie poleceń cURL zapewnia niezależne od platformy i wygodne podejście.

Przydatne linki

Powiązane artykuły

Gorąco polecamy odwiedzenie następujących blogów: