pdf в xml

Перетворіть PDF у XML за допомогою .NET REST API.

У цифровому середовищі необхідність перетворення PDF на XML (розширювана мова розмітки) ) ніколи не було настільки критичним. Хоча PDF чудово підходить для збереження формату та спільного використання, він часто створює труднощі, коли справа доходить до вилучення та структурування даних. З іншого боку, XML — це універсальна мова розмітки, призначена для організації, зберігання та транспортування даних. Перетворюючи PDF-файли на XML, ми подолаємо розрив між неструктурованим вмістом і структурованими даними, забезпечуючи безліч додатків, починаючи від аналізу даних і закінчуючи повторним використанням вмісту.

Давайте докладніше розглянемо, як конвертувати PDF у XML за допомогою .NET REST API.

REST API для перетворення PDF у XML

Завдяки використанню можливостей Aspose.PDF Cloud SDK для .NET конвертація стає легкою та ефективною. Окрім простого перетворення PDF у XML, цей потужний SDK пропонує цілий спектр можливостей — від обробки документів до вилучення даних. Давайте дослідимо процес перетворення PDF у XML, щоб революціонізувати спосіб обробки та використання даних документів.

Будь ласка, знайдіть Aspose.PDF-Cloud в диспетчері пакетів NuGet у Visual Studio IDE та натисніть кнопку Додати пакет, щоб посилання на SDK було додано в проект.

Вам також потрібно отримати облікові дані клієнта з хмарної інформаційної панелі. Якщо у вас немає облікового запису, просто створіть безкоштовний обліковий запис, дотримуючись інструкцій, наведених у швидкому запуску.

Розробіть конвертер файлів PDF у XML на C# .NET

Будь ласка, дотримуйтеся наведених нижче інструкцій, щоб перетворити PDF-файл у XML для структурованого представлення даних.

// Для отримання додаткових прикладів https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Отримайте облікові дані клієнта з https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// створити екземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// Спеціальний метод збереження вмісту потоку у файл на локальному диску
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

Нижче наведено короткі відомості про вказаний вище фрагмент коду.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Створіть об’єкт класу PdfApi, передаючи облікові дані клієнта як вхідні аргументи.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

Тепер викличте API для перетворення тегованого файлу PDF у формат XML. Потім ми використовуємо спеціальний метод, щоб зберегти вихід на локальний диск.

Перетворіть PDF на XML за допомогою команд cURL

Конвертація з PDF у XML стає надзвичайно ефективною та гнучкою, якщо використовується Aspose.PDF Cloud API у поєднанні з командами cURL. Ця потужна комбінація не тільки спрощує процес перетворення, але й покращує доступність даних і зручність використання в різних програмах. Тепер давайте розглянемо додаткові відомості про це перетворення, оскільки воно полегшує витяг даних, обмін та інтерпретацію.

Першим кроком у цьому підході є генерація маркера доступу JWT. Отже, виконайте таку команду:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Після створення маркера JWT нам потрібно виконати наступну команду, щоб перетворити тегований файл PDF у формат XML. Після перетворення результуючий XML зберігається на локальному диску.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

Замініть sourceFile на назву вхідного PDF-файлу, який уже доступний у хмарному сховищі, і замініть accessToken на маркер доступу JWT, згенерований вище.

Висновок

Підсумовуючи, незалежно від того, чи обираєте ви надійний пакет Aspose.PDF Cloud SDK для .NET чи використовуєте команди cURL у тандемі з Aspose.PDF Cloud, ми можемо легко досягти нашої мети безперебійного перетворення формату PDF у формат XML для покращеного використання даних. Таким чином, незалежно від обраного методу, обидва підходи є потужними інструментами, кардинально змінюючи структуру та вилучення даних із PDF-файлів.

корисні посилання

Схожі статті

Ми настійно рекомендуємо відвідати такі блоги: