pdf do xml

Konwertuj pliki PDF na XML za pomocą interfejsu API .NET REST.

W środowisku cyfrowym potrzeba konwersji [PDF] (https://docs.fileformat.com/pdf/) na [XML] (https://docs.fileformat.com/web/xml/) (Extensible Markup Language ) nigdy nie był bardziej krytyczny. Chociaż plik PDF doskonale nadaje się do zachowywania formatu i udostępniania, często stanowi wyzwanie, jeśli chodzi o wyodrębnianie i porządkowanie danych. Z drugiej strony XML jest wszechstronnym językiem znaczników przeznaczonym do organizowania, przechowywania i transportu danych. Konwertując pliki PDF na XML, wypełniamy lukę pomiędzy nieustrukturyzowaną treścią a ustrukturyzowanymi danymi, umożliwiając mnóstwo zastosowań, od analizy danych po ponowne wykorzystanie treści.

Przyjrzyjmy się szczegółom konwersji pliku PDF na XML za pomocą interfejsu API .NET REST.

API REST do konwersji plików PDF na XML

Wykorzystując możliwości Aspose.PDF Cloud SDK dla .NET, konwersja staje się płynna i skuteczna. Oprócz samej konwersji plików PDF na XML, ten potężny zestaw SDK oferuje spektrum możliwości — od manipulacji dokumentami po ekstrakcję danych. Przyjrzyjmy się procesowi konwersji pliku PDF na XML, aby zrewolucjonizować sposób, w jaki obsługujemy i wykorzystujemy dane dokumentów.

Wyszukaj „Aspose.PDF-Cloud” w menedżerze pakietów NuGet w Visual Studio IDE i kliknij przycisk „Dodaj pakiet”, aby w projekcie zostało dodane odwołanie do SDK.

Musisz także uzyskać dane uwierzytelniające klienta z panelu chmury. Jeśli nie masz istniejącego konta, po prostu utwórz bezpłatne konto, postępując zgodnie z instrukcjami podanymi w szybkim starcie.

Opracuj konwerter plików PDF na XML w C# .NET

Aby przekształcić plik PDF w format XML w celu ustrukturyzowanej reprezentacji danych, postępuj zgodnie z instrukcjami podanymi poniżej.

// Więcej przykładów można znaleźć na stronie https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Uzyskaj dane uwierzytelniające klienta z https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// utwórz instancję PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// Niestandardowa metoda zapisywania zawartości strumienia do pliku na dysku lokalnym
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

Poniżej podano krótkie szczegóły dotyczące powyższego fragmentu kodu.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Utwórz obiekt klasy PdfApi, przekazując poświadczenia klienta jako argumenty wejściowe.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

Teraz wywołaj interfejs API, aby przekonwertować oznaczony plik PDF na format XML. Następnie używamy niestandardowej metody, aby zapisać dane wyjściowe na dysku lokalnym.

Konwertuj pliki PDF na XML za pomocą poleceń cURL

Konwersja z formatu PDF na XML staje się niezwykle wydajna i elastyczna w przypadku wykorzystania Aspose.PDF Cloud API w połączeniu z poleceniami cURL. To potężne połączenie nie tylko upraszcza proces konwersji, ale także zwiększa dostępność i użyteczność danych w całym spektrum zastosowań. Przyjrzyjmy się teraz bliżej szczegółom tej konwersji, ponieważ ułatwia ona ekstrakcję, udostępnianie i interpretację danych.

Pierwszym krokiem w tym podejściu jest wygenerowanie tokena dostępu JWT. Wykonaj więc następujące polecenie:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Po wygenerowaniu tokena JWT musimy wykonać następujące polecenie, aby przekonwertować oznaczony plik PDF na format XML. Po konwersji powstały plik XML jest przechowywany na dysku lokalnym.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

Zastąp „sourceFile” nazwą wejściowego pliku PDF już dostępnego w chmurze i zamień „accessToken” na token dostępu JWT wygenerowany powyżej.

Wniosek

Podsumowując, niezależnie od tego, czy zdecydujemy się na solidny pakiet Aspose.PDF Cloud SDK dla .NET, czy też wykorzystamy polecenia cURL w połączeniu z Aspose.PDF Cloud, możemy z łatwością osiągnąć nasz cel, jakim jest płynna konwersja z formatu PDF na XML w celu lepszego wykorzystania danych. Zatem niezależnie od wybranej metody oba podejścia są potężnymi narzędziami, rewolucjonizującymi sposób strukturyzowania i wyodrębniania danych z plików PDF.

Przydatne linki

Powiązane artykuły

Gorąco polecamy odwiedzenie następujących blogów: