извлечь текст PowerPoint

Как извлечь текст из PowerPoint с помощью .NET REST API.

В сфере современной обработки информации презентации PowerPoint стали повсеместным средством обмена информацией, проведения эффективных презентаций и передачи идей. Теперь, если вы хотите раскрыть скрытые тенденции, перепрофилировать контент или получить более глубокое понимание, способность извлекать текст из PowerPoint — это потрясающий навык. Однако извлечение текста из этих презентаций может оказаться сложной задачей, особенно при работе с большими или сложными файлами. В этой статье представлено мощное решение для извлечения текста из PowerPoint, а также объяснены инновационные возможности Aspose.Slides Cloud SDK для .NET.

REST API для извлечения текста PowerPoint

Когда дело доходит до извлечения текста из презентаций PowerPoint, Aspose.Slides Cloud SDK для .NET выделяется как мощный и универсальный инструмент. Благодаря богатому набору функций и комплексному API этот SDK позволяет разработчикам легко и точно и эффективно извлекать текст из презентаций.

Первым шагом является установка SDK. Поэтому нам нужно сначала выполнить поиск Aspose.Slides-Cloud в диспетчере пакетов NuGet и нажать кнопку «Добавить пакет». Если у вас нет существующей учетной записи в облачной панели, просто создайте бесплатную учетную запись, следуя инструкциям, указанным в быстром запуске. .cloud/slides/quickstart/).

Извлечение текста из PowerPoint с помощью C# .NET

Давайте подробно рассмотрим, как можно эффективно извлечь текст из полной версии PowerPoint с помощью фрагмента кода C# .NET.

// Дополнительные примеры можно найти на https://github.com/aspose-slides-cloud.
// Получите учетные данные клиента с https://dashboard.aspose.cloud/.
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// создать экземпляр SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// название ввода презентация PowerPoint
string sourcePPTX = "Inspirational bookmarks.pptx";

// Вызовите API, чтобы извлечь весь текст из презентации PowerPoint.
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// Создайте объект StreamWriter, чтобы мы могли сохранить извлеченный контент.
StreamWriter sw = new StreamWriter("Test.txt");

// Перебирать каждый экземпляр извлеченного текста.
foreach (var textItem in textItems.Items)
{
    // записывать каждое появление текста в текстовый файл в системе
    sw.WriteLine(textItem.Text);
}
// закрыть StreamWriter 
sw.Close();

Теперь давайте разовьем наше понимание приведенного выше фрагмента кода.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

Создайте объект класса SlidesApi, куда мы передаем учетные данные клиента в качестве аргументов.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

Вызовите API, чтобы извлечь весь текстовый контент из презентации PowerPoint, доступный в облачном хранилище.

StreamWriter sw = new StreamWriter("Test.txt");

Создайте StreamWriter, который поможет нам сохранить извлеченный контент на локальном диске.

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

Переберите каждое вхождение извлеченного текста и сохраните результат в текстовом файле.

Извлечь текст из PowerPoint

Предварительный просмотр извлечения текста PowerPoint.

Вы можете загрузить образец PowerPoint, использованный в приведенном выше примере, из Inspirational bookmarks.pptx. .

Извлечение текста из определенного слайда с помощью команд cURL

Другая альтернатива извлечению текста из слайдов PowerPoint — использование команд cURL. С помощью cURL вы можете взаимодействовать с облачным API Aspose.Slides напрямую через HTTP-запросы, что делает его гибким и доступным вариантом для извлечения текста. Таким образом, создав соответствующую конечную точку API и указав нужные параметры, вы можете отправить команду cURL для получения текста из определенных слайдов или всей презентации.

Первым шагом в этом подходе является создание токена доступа JWT. Итак, выполните следующую команду:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Теперь выполните следующую команду, чтобы извлечь текст из второго слайда презентации PowerPoint.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

Замените «sourceFile» именем входного файла PowerPoint, доступного в облачном хранилище, а «accessToken» — токеном доступа JWT, созданным выше.

Заключение

В заключение мы узнали, что возможность извлекать текст из слайдов PowerPoint — это ценная функция, которая позволяет нам получать доступ к текстовому содержимому презентаций и использовать его для различных целей. Будь то анализ данных, анализ контента или любое другое приложение, извлечение текста из слайдов PowerPoint позволяет нам раскрыть информацию, содержащуюся в этих файлах. Используя Aspose.Slides Cloud SDK для .NET, мы можем легко и эффективно выполнять операции извлечения текста в приложении .NET, а использование команд cURL обеспечивает независимый от платформы и удобный подход.

Полезные ссылки

Статьи по Теме

Мы настоятельно рекомендуем посетить следующие блоги: