PowerPoint presentations обычно используются для бизнес‑отчетов, учебных материалов и визуального повествования. Во многих сценариях автоматизации — таких как индексация контента, анализ документов или миграционные рабочие процессы — вам может потребоваться извлекать текст из слайдов PowerPoint вместо ручного копирования содержимого каждого слайда.
Этот учебник объясняет, как извлекать текст из презентаций PowerPoint с использованием C# .NET REST API, позволяя разработчикам программно получать содержимое слайдов без установки Microsoft PowerPoint или других настольных инструментов.
- API обработки PowerPoint
- Извлечение текста из PowerPoint с использованием C# .NET
- Извлечение текста из конкретного слайда PowerPoint с помощью cURL
PowerPoint Processing API
The Aspose.Slides Cloud SDK for .NET предоставляет надёжное и масштабируемое решение на основе REST для извлечения текста из презентаций PowerPoint. API обеспечивает точный доступ к тексту слайдов, сохраняя производительность и безопасность в облачных средах.
Поскольку обработка происходит в облаке, этот подход идеален для кроссплатформенных приложений, фоновых сервисов и масштабных задач автоматизации.
Ключевые особенности
- Извлекать текст из файлов PPT и PPTX.
- Облачный REST API с аутентификацией OAuth.
- Не требует наличия Microsoft PowerPoint.
- Поддерживает полные презентации или отдельные слайды.
- Простая интеграция с проектами C# .NET.
Чтобы начать, установите Aspose.Slides-Cloud через NuGet Package Manager и создайте бесплатный аккаунт на Aspose Cloud Dashboard, чтобы получить ваши учетные данные API.
- Вы можете рассмотреть возможность посетить эту статью для получения информации о создании учетной записи и получении клиентских учетных данных.
Извлечение текста из PowerPoint с помощью C# .NET
В следующем примере показано, как извлечь весь текст из презентации PowerPoint, хранящейся в облачном хранилище, с использованием C#.
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);
Создайте экземпляр класса SlidesApi, используя учетные данные клиента.
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);
Запросите все текстовые элементы из презентации.
foreach (var textItem in textItems.Items)
{
// save each occurrence of text to the text file.
sw.WriteLine(textItem.Text);
}
Пройдите по извлеченному тексту и сохраните его локально.
Предпросмотр текста, извлеченного из PowerPoint.
Извлечение текста из конкретного слайда PowerPoint с помощью cURL
Если вы предпочитаете работать напрямую с REST‑конечными точками, вы можете извлечь текст из конкретного слайда, используя команды cURL. Этот подход особенно полезен, когда вы предпочитаете пакетную обработку через командную строку.
Создание JWT‑токена доступа
Первый шаг в этом подходе — создать JWT‑токен доступа. Пожалуйста, выполните следующую команду:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=XXXXX-XXXXXX-XXXXXX&client_secret=XXXXXXXXX" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Извлечение текста из отдельного слайда
Теперь выполните следующую команду, чтобы извлечь текст со второго слайда презентации PowerPoint.
curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "Extracted.txt"
Замените sourceFile именем файла PowerPoint, хранящегося в облачном хранилище, а ACCESS_TOKEN — на сгенерированный токен.
Заключение
Извлечение текста из презентаций PowerPoint с использованием C# .NET REST API позволяет разработчикам автоматизировать получение содержимого слайдов, выполнять анализ текста и интегрировать данные презентаций в современные приложения. С помощью Aspose.Slides Cloud SDK for .NET вы можете эффективно извлекать текст из целых презентаций или отдельных слайдов, используя рабочие процессы на основе SDK или REST.
Полезные ссылки
Часто задаваемые вопросы (FAQ) ❓
-
Могу ли я извлекать текст из файлов PPT и PPTX?
Да. API поддерживает извлечение текста как из устаревших форматов PPT, так и из современных форматов PPTX. -
Нужен ли установленный Microsoft PowerPoint?
Нет. Всё извлечение текста выполняется в облаке без какого-либо настольного программного обеспечения. -
Можно ли извлечь текст с отдельного слайда?
Да. Вы можете извлекать текст с отдельных слайдов, используя REST API‑конечные точки или команды cURL. -
Могу ли я бесплатно протестировать извлечение текста из PowerPoint?
Да. Aspose предоставляет бесплатную пробную версию, чтобы вы могли оценить возможности извлечения текста перед обновлением.
Связанные статьи
Настоятельно рекомендуется посетить следующие сообщения блога для получения информации о: