В сфере современной обработки информации презентации PowerPoint стали повсеместным средством обмена информацией, проведения эффективных презентаций и передачи идей. Теперь, если вы хотите раскрыть скрытые тенденции, перепрофилировать контент или получить более глубокое понимание, способность извлекать текст из PowerPoint — это потрясающий навык. Однако извлечение текста из этих презентаций может оказаться сложной задачей, особенно при работе с большими или сложными файлами. В этой статье представлено мощное решение для извлечения текста из PowerPoint, а также объяснены инновационные возможности Aspose.Slides Cloud SDK для .NET.
- REST API для извлечения текста PowerPoint
- Извлечение текста из PowerPoint с помощью C# .NET
- Извлечение текста из определенного слайда с помощью команд cURL
REST API для извлечения текста PowerPoint
Когда дело доходит до извлечения текста из презентаций PowerPoint, Aspose.Slides Cloud SDK для .NET выделяется как мощный и универсальный инструмент. Благодаря богатому набору функций и комплексному API этот SDK позволяет разработчикам легко и точно и эффективно извлекать текст из презентаций.
Первым шагом является установка SDK. Поэтому нам нужно сначала выполнить поиск Aspose.Slides-Cloud в диспетчере пакетов NuGet и нажать кнопку «Добавить пакет». Если у вас нет существующей учетной записи в облачной панели, просто создайте бесплатную учетную запись, следуя инструкциям, указанным в быстром запуске. .cloud/slides/quickstart/).
Извлечение текста из PowerPoint с помощью C# .NET
Давайте подробно рассмотрим, как можно эффективно извлечь текст из полной версии PowerPoint с помощью фрагмента кода C# .NET.
// Дополнительные примеры можно найти на https://github.com/aspose-slides-cloud.
// Получите учетные данные клиента с https://dashboard.aspose.cloud/.
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";
// создать экземпляр SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);
// название ввода презентация PowerPoint
string sourcePPTX = "Inspirational bookmarks.pptx";
// Вызовите API, чтобы извлечь весь текст из презентации PowerPoint.
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);
// Создайте объект StreamWriter, чтобы мы могли сохранить извлеченный контент.
StreamWriter sw = new StreamWriter("Test.txt");
// Перебирать каждый экземпляр извлеченного текста.
foreach (var textItem in textItems.Items)
{
// записывать каждое появление текста в текстовый файл в системе
sw.WriteLine(textItem.Text);
}
// закрыть StreamWriter
sw.Close();
Теперь давайте разовьем наше понимание приведенного выше фрагмента кода.
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);
Создайте объект класса SlidesApi, куда мы передаем учетные данные клиента в качестве аргументов.
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);
Вызовите API, чтобы извлечь весь текстовый контент из презентации PowerPoint, доступный в облачном хранилище.
StreamWriter sw = new StreamWriter("Test.txt");
Создайте StreamWriter, который поможет нам сохранить извлеченный контент на локальном диске.
foreach (var textItem in textItems.Items)
{
sw.WriteLine(textItem.Text);
}
sw.Close();
Переберите каждое вхождение извлеченного текста и сохраните результат в текстовом файле.
Вы можете загрузить образец PowerPoint, использованный в приведенном выше примере, из Inspirational bookmarks.pptx. .
Извлечение текста из определенного слайда с помощью команд cURL
Другая альтернатива извлечению текста из слайдов PowerPoint — использование команд cURL. С помощью cURL вы можете взаимодействовать с облачным API Aspose.Slides напрямую через HTTP-запросы, что делает его гибким и доступным вариантом для извлечения текста. Таким образом, создав соответствующую конечную точку API и указав нужные параметры, вы можете отправить команду cURL для получения текста из определенных слайдов или всей презентации.
Первым шагом в этом подходе является создание токена доступа JWT. Итак, выполните следующую команду:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Теперь выполните следующую команду, чтобы извлечь текст из второго слайда презентации PowerPoint.
curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-o "Extracted.txt"
Замените «sourceFile» именем входного файла PowerPoint, доступного в облачном хранилище, а «accessToken» — токеном доступа JWT, созданным выше.
Заключение
В заключение мы узнали, что возможность извлекать текст из слайдов PowerPoint — это ценная функция, которая позволяет нам получать доступ к текстовому содержимому презентаций и использовать его для различных целей. Будь то анализ данных, анализ контента или любое другое приложение, извлечение текста из слайдов PowerPoint позволяет нам раскрыть информацию, содержащуюся в этих файлах. Используя Aspose.Slides Cloud SDK для .NET, мы можем легко и эффективно выполнять операции извлечения текста в приложении .NET, а использование команд cURL обеспечивает независимый от платформы и удобный подход.
Полезные ссылки
Статьи по Теме
Мы настоятельно рекомендуем посетить следующие блоги: