pdf en xml

Convertissez un PDF en XML avec l’API .NET REST.

Dans le paysage numérique, la nécessité de convertir PDF en XML (Extensible Markup Language ) n’a jamais été aussi critique. Bien que le format PDF soit excellent pour préserver le format et le partage, il pose souvent un défi lorsqu’il s’agit d’extraire et de structurer des données. D’un autre côté, XML est un langage de balisage polyvalent conçu pour organiser, stocker et transporter des données. En convertissant les PDF en XML, nous comblons le fossé entre le contenu non structuré et les données structurées, permettant ainsi une multitude d’applications, allant de l’analyse des données à la réutilisabilité du contenu.

Examinons en détail comment convertir un PDF en XML à l’aide de l’API .NET REST.

API REST pour la conversion PDF en XML

En tirant parti des capacités du Aspose.PDF Cloud SDK for .NET, la conversion devient transparente et efficace. Au-delà de la simple conversion PDF vers XML, ce puissant SDK offre un éventail de fonctionnalités, de la manipulation de documents à l’extraction de données. Explorons le processus de conversion de PDF en XML pour révolutionner la façon dont nous traitons et utilisons les données des documents.

Veuillez rechercher « Aspose.PDF-Cloud » dans le gestionnaire de packages NuGet dans Visual Studio IDE et cliquez sur le bouton « Ajouter un package » afin que la référence du SDK soit ajoutée dans le projet.

Vous devez également obtenir vos informations d’identification client à partir du tableau de bord cloud. Si vous n’avez pas de compte existant, créez simplement un compte gratuit en suivant les instructions spécifiées dans démarrage rapide.

Développer un convertisseur de fichiers PDF en XML en C# .NET

Veuillez suivre les instructions ci-dessous pour transformer un fichier PDF en XML pour une représentation structurée des données.

// Pour plus d'exemples, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Obtenez les informations d'identification du client sur https://dashboard.aspose.cloud/
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// créer une instance de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// Méthode personnalisée pour enregistrer le contenu du flux dans un fichier sur le disque local
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

Vous trouverez ci-dessous les détails rapides concernant l’extrait de code indiqué ci-dessus.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Créez un objet de la classe PdfApi tout en transmettant les informations d’identification du client comme arguments d’entrée.

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

Maintenant, appelez l’API pour convertir le fichier PDF balisé au format XML. Ensuite, nous utilisons une méthode personnalisée pour enregistrer la sortie sur le disque local.

Convertir un PDF en XML avec les commandes cURL

La conversion de PDF en XML devient remarquablement efficace et flexible lors de l’utilisation de Aspose.PDF Cloud API en conjonction avec les commandes cURL. Cette puissante combinaison simplifie non seulement le processus de conversion, mais améliore également l’accessibilité et la convivialité des données dans un large éventail d’applications. Explorons maintenant quelques détails supplémentaires sur cette conversion, car elle facilite l’extraction, le partage et l’interprétation des données.

La première étape de cette approche est la génération d’un jeton d’accès JWT. Alors, veuillez exécuter la commande suivante :

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Une fois le jeton JWT généré, nous devons exécuter la commande suivante pour convertir un fichier PDF balisé au format XML. Après la conversion, le XML résultant est stocké sur un lecteur local.

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

Remplacez « sourceFile » par le nom du fichier PDF d’entrée déjà disponible dans le stockage Cloud et remplacez « accessToken » par le jeton d’accès JWT généré ci-dessus.

Conclusion

En conclusion, que ce soit en optant pour le robuste SDK Aspose.PDF Cloud pour .NET ou en utilisant les commandes cURL en tandem avec Aspose.PDF Cloud, nous pouvons facilement atteindre notre objectif de conversion transparente du format PDF au format XML pour une meilleure utilisation des données. Ainsi, quelle que soit la méthode choisie, les deux approches constituent des outils puissants, révolutionnant la façon dont nous structurons et extrayons les données des PDF.

Liens utiles

Articles Liés

Nous vous recommandons fortement de visiter les blogs suivants :