У цифровому середовищі необхідність перетворення PDF на XML (розширювана мова розмітки) ) ніколи не було настільки критичним. Хоча PDF чудово підходить для збереження формату та спільного використання, він часто створює труднощі, коли справа доходить до вилучення та структурування даних. З іншого боку, XML — це універсальна мова розмітки, призначена для організації, зберігання та транспортування даних. Перетворюючи PDF-файли на XML, ми подолаємо розрив між неструктурованим вмістом і структурованими даними, забезпечуючи безліч додатків, починаючи від аналізу даних і закінчуючи повторним використанням вмісту.
Давайте докладніше розглянемо, як конвертувати PDF у XML за допомогою .NET REST API.
- REST API для перетворення PDF у XML
- Розробіть конвертер файлів PDF у XML на C# .NET
- Перетворіть PDF на XML за допомогою команд cURL
REST API для перетворення PDF у XML
Завдяки використанню можливостей Aspose.PDF Cloud SDK для .NET конвертація стає легкою та ефективною. Окрім простого перетворення PDF у XML, цей потужний SDK пропонує цілий спектр можливостей — від обробки документів до вилучення даних. Давайте дослідимо процес перетворення PDF у XML, щоб революціонізувати спосіб обробки та використання даних документів.
Будь ласка, знайдіть Aspose.PDF-Cloud
в диспетчері пакетів NuGet у Visual Studio IDE та натисніть кнопку Додати пакет
, щоб посилання на SDK було додано в проект.
Вам також потрібно отримати облікові дані клієнта з хмарної інформаційної панелі. Якщо у вас немає облікового запису, просто створіть безкоштовний обліковий запис, дотримуючись інструкцій, наведених у швидкому запуску.
Розробіть конвертер файлів PDF у XML на C# .NET
Будь ласка, дотримуйтеся наведених нижче інструкцій, щоб перетворити PDF-файл у XML для структурованого представлення даних.
// Для отримання додаткових прикладів https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples
// Отримайте облікові дані клієнта з https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";
// створити екземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
if (response != null)
{
Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");
// Спеціальний метод збереження вмісту потоку у файл на локальному диску
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
Нижче наведено короткі відомості про вказаний вище фрагмент коду.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Створіть об’єкт класу PdfApi, передаючи облікові дані клієнта як вхідні аргументи.
pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
Тепер викличте API для перетворення тегованого файлу PDF у формат XML. Потім ми використовуємо спеціальний метод, щоб зберегти вихід на локальний диск.
Перетворіть PDF на XML за допомогою команд cURL
Конвертація з PDF у XML стає надзвичайно ефективною та гнучкою, якщо використовується Aspose.PDF Cloud API у поєднанні з командами cURL. Ця потужна комбінація не тільки спрощує процес перетворення, але й покращує доступність даних і зручність використання в різних програмах. Тепер давайте розглянемо додаткові відомості про це перетворення, оскільки воно полегшує витяг даних, обмін та інтерпретацію.
Першим кроком у цьому підході є генерація маркера доступу JWT. Отже, виконайте таку команду:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Після створення маркера JWT нам потрібно виконати наступну команду, щоб перетворити тегований файл PDF у формат XML. Після перетворення результуючий XML зберігається на локальному диску.
curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.xml"
Замініть sourceFile
на назву вхідного PDF-файлу, який уже доступний у хмарному сховищі, і замініть accessToken
на маркер доступу JWT, згенерований вище.
Висновок
Підсумовуючи, незалежно від того, чи обираєте ви надійний пакет Aspose.PDF Cloud SDK для .NET чи використовуєте команди cURL у тандемі з Aspose.PDF Cloud, ми можемо легко досягти нашої мети безперебійного перетворення формату PDF у формат XML для покращеного використання даних. Таким чином, незалежно від обраного методу, обидва підходи є потужними інструментами, кардинально змінюючи структуру та вилучення даних із PDF-файлів.
корисні посилання
Схожі статті
Ми настійно рекомендуємо відвідати такі блоги: