pdf în xml

Convertiți PDF în XML cu .NET REST API.

În peisajul digital, necesitatea de a converti PDF în XML (Extensible Markup Language) ) nu a fost niciodată mai critică. Deși PDF-ul este excelent în păstrarea formatului și partajarea, dar adesea reprezintă o provocare atunci când vine vorba de extragerea și structurarea datelor. Pe de altă parte, XML este un limbaj de marcare versatil conceput pentru a organiza, stoca și transporta date. Prin conversia PDF-urilor în XML, facem puntea dintre conținutul nestructurat și datele structurate, permițând o multitudine de aplicații, de la analiza datelor până la reutilizarea conținutului.

Să analizăm detaliile despre cum să convertiți PDF în XML folosind .NET REST API.

API-ul REST pentru conversia PDF în XML

Folosind capacitățile Aspose.PDF Cloud SDK pentru .NET, conversia devine perfectă și eficientă. Dincolo de doar conversia PDF în XML, acest SDK puternic oferă o gamă largă de capabilități — de la manipularea documentelor până la extragerea datelor. Să explorăm procesul de conversie a PDF-ului în XML pentru a revoluționa modul în care gestionăm și utilizăm datele documentelor.

Căutați „Aspose.PDF-Cloud” în managerul de pachete NuGet din Visual Studio IDE și faceți clic pe butonul „Adăugați pachet”, astfel încât referința SDK să fie adăugată în proiect.

De asemenea, trebuie să obțineți acreditările de client de la cloud dashboard. În cazul în care nu aveți un cont existent, pur și simplu creați un cont gratuit urmând instrucțiunile specificate în pornire rapidă.

Dezvoltați PDF to XML File Converter în C# .NET

Vă rugăm să urmați instrucțiunile de mai jos pentru a transforma un fișier PDF în XML pentru reprezentarea structurată a datelor.

// Pentru mai multe exemple, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Obțineți acreditările client de la https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// creați o instanță de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// Metodă personalizată pentru a salva conținutul fluxului într-un fișier pe unitatea locală
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

Mai jos sunt prezentate detaliile rapide cu privire la fragmentul de cod menționat mai sus.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Creați un obiect din clasa PdfApi în timp ce treceți acreditările clientului ca argumente de intrare.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

Acum, apelați API-ul pentru a converti fișierul PDF etichetat în format XML. Apoi folosim metoda personalizată pentru a salva rezultatul pe unitatea locală.

Convertiți PDF în XML cu comenzile cURL

Conversia din PDF în XML devine remarcabil de eficientă și flexibilă atunci când se utilizează Aspose.PDF Cloud API împreună cu comenzile cURL. Această combinație puternică nu numai că simplifică procesul de conversie, dar îmbunătățește și accesibilitatea datelor și capacitatea de utilizare într-un spectru de aplicații. Acum haideți să explorăm câteva detalii suplimentare despre această conversie, deoarece facilitează extragerea, partajarea și interpretarea ușoară a datelor.

Primul pas în această abordare este generarea unui token de acces JWT. Deci, vă rugăm să executați următoarea comandă:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Odată ce simbolul JWT este generat, trebuie să executăm următoarea comandă pentru a converti un fișier PDF etichetat în format XML. După conversie, XML rezultat este stocat pe o unitate locală.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

Înlocuiți sourceFile cu numele fișierului PDF de intrare deja disponibil în stocarea în cloud și înlocuiți accessToken cu tokenul de acces JWT generat mai sus.

Concluzie

În concluzie, fie că optăm pentru solidul SDK Aspose.PDF Cloud pentru .NET sau utilizăm comenzile cURL în tandem cu Aspose.PDF Cloud, ne putem atinge cu ușurință obiectivul de conversie fără întreruperi din format PDF în format XML pentru o utilizare îmbunătățită a datelor. Deci, indiferent de metoda aleasă, ambele abordări sunt instrumente puternice, revoluționând modul în care structurem și extragem datele din PDF-uri.

Articole similare

Vă recomandăm să vizitați următoarele bloguri: