витягти текст PowerPoint

Як витягти текст із PowerPoint за допомогою .NET REST API.

У сфері сучасної обробки інформації презентації PowerPoint стали повсюдним засобом обміну інформацією, проведення вражаючих презентацій і передачі ідей. Тепер, якщо ви прагнете виявити приховані тенденції, змінити призначення вмісту або отримати глибше розуміння, здатність видобувати текст із PowerPoint — це дивовижна навичка. Однак вилучення тексту з цих презентацій може бути складним завданням, особливо коли ви маєте справу з великими або складними файлами. Ця стаття розкриває потужне рішення для вилучення тексту з PowerPoint, а також пояснює інноваційні можливості Aspose.Slides Cloud SDK для .NET.

REST API для вилучення тексту PowerPoint

Коли справа доходить до вилучення тексту з презентацій PowerPoint, Aspose.Slides Cloud SDK для .NET виділяється як потужний і універсальний інструмент. Завдяки багатому набору функцій і комплексному API, цей SDK дає змогу розробникам без особливих зусиль отримувати текст із презентацій з точністю та ефективністю.

Першим кроком є встановлення SDK. Отже, нам потрібно спочатку знайти Aspose.Slides-Cloud в менеджері пакетів NuGet і натиснути кнопку Додати пакет. Якщо у вас немає облікового запису на хмарній інформаційній панелі, просто створіть безкоштовний обліковий запис, дотримуючись інструкцій, указаних у швидкому запуску. .cloud/slides/quickstart/).

Витягніть текст із PowerPoint за допомогою C# .NET

Давайте детально розглянемо, як ми можемо ефективно витягти текст із повного PowerPoint за допомогою фрагмента коду C# .NET.

// Щоб отримати більше прикладів, відвідайте https://github.com/aspose-slides-cloud
// Отримайте облікові дані клієнта з https://dashboard.aspose.cloud/
string clientSecret = "7f098199230fc5f2175d494d48f2077c";
string clientID = "ee170169-ca49-49a4-87b7-0e2ff815ea6e";

// створити екземпляр SlidesApi
SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

// назва вхідної презентації PowerPoint
string sourcePPTX = "Inspirational bookmarks.pptx";

// Викличте API, щоб отримати весь текст із презентації PowerPoint
var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

// Створіть об’єкт StreamWriter, щоб ми могли зберегти витягнутий вміст
StreamWriter sw = new StreamWriter("Test.txt");

// Переглядайте кожен екземпляр витягнутого тексту
foreach (var textItem in textItems.Items)
{
    // записувати кожне входження тексту в текстовий файл у системі
    sw.WriteLine(textItem.Text);
}
// закрийте StreamWriter 
sw.Close();

Тепер давайте розвинемо наше розуміння вищезазначеного фрагмента коду.

SlidesApi slidesApi = new SlidesApi(clientID, clientSecret);

Створіть об’єкт класу SlidesApi, де ми передаємо облікові дані клієнта як аргументи.

var textItems = slidesApi.GetPresentationTextItems(sourcePPTX, true, null);

Викличте API, щоб отримати весь текстовий вміст із презентації PowerPoint, доступної в хмарному сховищі.

StreamWriter sw = new StreamWriter("Test.txt");

Створіть StreamWriter, який допоможе нам зберегти видобутий вміст на локальному диску.

foreach (var textItem in textItems.Items)
{
    sw.WriteLine(textItem.Text);
}
sw.Close();

Переглядайте кожне входження вилученого тексту та зберігайте результат у текстовому файлі.

Витягніть текст із PowerPoint

Попередній перегляд вилучення тексту PowerPoint.

Ви можете завантажити зразок PowerPoint, використаний у наведеному вище прикладі, з Inspirational bookmarks.pptx .

Витягніть текст із певного слайда за допомогою команд cURL

Ще одна альтернатива для отримання тексту зі слайдів PowerPoint — це використання команд cURL. За допомогою cURL ви можете взаємодіяти з API Aspose.Slides Cloud безпосередньо через HTTP-запити, що робить його гнучким і доступним варіантом для можливостей вилучення тексту. Таким чином, створивши відповідну кінцеву точку API і вказавши потрібні параметри, ви можете надіслати команду cURL для отримання тексту з конкретних слайдів або всієї презентації.

Першим кроком у цьому підході є створення маркера доступу JWT. Отже, виконайте таку команду:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Тепер виконайте наступну команду, щоб витягнути текст із другого слайда презентації PowerPoint.

curl -v "https://api.aspose.cloud/v3.0/slides/{sourceFile}/slides/2/textItems?withEmpty=false" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-o "Extracted.txt"

Замініть sourceFile на назву вхідного PowerPoint, доступного в хмарному сховищі, а accessToken на згенерований вище маркер доступу JWT.

Висновок

Підсумовуючи, ми дізналися, що можливість видобувати текст із слайдів PowerPoint є цінною функцією, яка дозволяє нам отримувати доступ до текстового вмісту в презентаціях і використовувати його для різних цілей. Для аналізу даних, синтаксичного аналізу вмісту чи будь-якої іншої програми вилучення тексту зі слайдів PowerPoint дає нам змогу розблокувати інформацію, що міститься в цих файлах. Використовуючи Aspose.Slides Cloud SDK для .NET, ми можемо легко й ефективно виконувати операції вилучення тексту в програмі .NET або використання команд cURL забезпечує незалежний від платформи та зручний підхід.

корисні посилання

Схожі статті

Ми настійно рекомендуємо відвідати такі блоги: