Nel panorama digitale, la necessità di convertire PDF in XML (Extensible Markup Language ) non è mai stato così critico. Sebbene il PDF sia eccellente nel preservare il formato e nella condivisione, spesso rappresenta una sfida quando si tratta di estrarre e strutturare i dati. D’altra parte, XML è un linguaggio di markup versatile progettato per organizzare, archiviare e trasportare dati. Convertendo i PDF in XML, colmiamo il divario tra contenuto non strutturato e dati strutturati, consentendo una vasta gamma di applicazioni, che vanno dall’analisi dei dati alla riusabilità dei contenuti.
Approfondiamo i dettagli su come convertire PDF in XML utilizzando l’API REST .NET.
- API REST per la conversione da PDF a XML
- Sviluppa convertitore di file da PDF a XML in C# .NET
- Converti PDF in XML con i comandi cURL
API REST per la conversione da PDF a XML
Sfruttando le funzionalità di Aspose.PDF Cloud SDK per .NET, la conversione diventa semplice ed efficace. Oltre alla semplice conversione da PDF a XML, questo potente SDK offre una vasta gamma di funzionalità, dalla manipolazione dei documenti all’estrazione dei dati. Esploriamo il processo di conversione da PDF a XML per rivoluzionare il modo in cui gestiamo e utilizziamo i dati dei documenti.
Cerca “Aspose.PDF-Cloud” nel gestore pacchetti NuGet all’interno dell’IDE di Visual Studio e fai clic sul pulsante “Aggiungi pacchetto”, in modo che il riferimento SDK venga aggiunto al progetto.
È inoltre necessario ottenere le credenziali del cliente da dashboard cloud. Nel caso in cui non disponi di un account esistente, crea semplicemente un account gratuito seguendo le istruzioni specificate in avvio rapido.
Sviluppa convertitore di file da PDF a XML in C# .NET
Seguire le istruzioni fornite di seguito per trasformare un file PDF in XML per la rappresentazione strutturata dei dati.
// Per ulteriori esempi, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples
// Ottieni le credenziali del cliente da https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";
// creare un'istanza di PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
if (response != null)
{
Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");
// Metodo personalizzato per salvare il contenuto dello streaming in un file sull'unità locale
public static void saveToDisk(Stream responseStream, String resultantFile)
{
var fileStream = File.Create(resultantFile);
responseStream.Seek(0, SeekOrigin.Begin);
responseStream.CopyTo(fileStream);
fileStream.Close();
}
Di seguito sono riportati i dettagli rapidi relativi allo snippet di codice sopra indicato.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Crea un oggetto della classe PdfApi passando le credenziali del client come argomenti di input.
pdfApi.GetPdfInStorageToXml("Hardy02.pdf");
Ora chiama l’API per convertire il file PDF con tag in formato XML. Quindi utilizziamo un metodo personalizzato per salvare l’output sull’unità locale.
Converti PDF in XML con i comandi cURL
La conversione da PDF a XML diventa straordinariamente efficiente e flessibile quando si utilizza Aspose.PDF Cloud API insieme ai comandi cURL. Questa potente combinazione non solo semplifica il processo di conversione, ma migliora anche l’accessibilità e l’usabilità dei dati in un’ampia gamma di applicazioni. Esploriamo ora alcuni ulteriori dettagli su questa conversione in quanto facilita l’estrazione, la condivisione e l’interpretazione dei dati.
Il primo passo in questo approccio è la generazione di un token di accesso JWT. Quindi, esegui il seguente comando:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Una volta generato il token JWT, dobbiamo eseguire il seguente comando per convertire un file PDF con tag in formato XML. Dopo la conversione, l’XML risultante viene archiviato su un’unità locale.
curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.xml"
Sostituisci “sourceFile” con il nome del file PDF di input già disponibile nell’archivio cloud e sostituisci “accessToken” con il token di accesso JWT generato sopra.
Conclusione
In conclusione, sia che optiamo per il robusto Aspose.PDF Cloud SDK per .NET o che utilizziamo i comandi cURL in tandem con Aspose.PDF Cloud, possiamo facilmente raggiungere il nostro obiettivo di conversione senza soluzione di continuità dal formato PDF al formato XML per un migliore utilizzo dei dati. Pertanto, indipendentemente dal metodo scelto, entrambi gli approcci rappresentano strumenti potenti, rivoluzionando il modo in cui strutturiamo ed estraiamo i dati dai PDF.
link utili
articoli Correlati
Consigliamo vivamente di visitare i seguenti blog: