PDF en HTML

Convertissez un PDF en HTML à l’aide de l’API .NET REST.

Les documents PDF sont un choix populaire pour partager des informations en raison de leur formatage cohérent sur différents appareils et plates-formes. Mais lorsqu’il s’agit d’afficher du contenu sur un site Web, les fichiers PDF ne constituent pas toujours l’option la plus conviviale. Cependant, la conversion de fichiers PDF au format HTML ouvre un monde de possibilités pour les développeurs Web et les créateurs de contenu. Une autre raison de cette conversion est que la présentation et l’accessibilité du contenu sont des facteurs cruciaux pour le succès en ligne, car il devient indexable par les moteurs de recherche.

Dans cet article, nous examinerons en détail comment convertir un PDF en HTML à l’aide de l’API .NET REST.

API REST pour la conversion PDF en HTML

La conversion du PDF en HTML est facilitée grâce aux puissantes capacités du Aspose.PDF Cloud SDK for .NET. Cette API vous permet d’intégrer de manière transparente la fonctionnalité de conversion PDF dans vos applications et flux de travail .NET. Avec seulement quelques lignes de code, vous pouvez facilement convertir des documents PDF au format HTML, les rendant ainsi adaptés à l’affichage et à l’interaction sur le Web. L’API REST fournit un large éventail de fonctionnalités pour contrôler le processus de conversion. Vous pouvez également personnaliser le HTML de sortie en spécifiant le nom de la police par défaut, le type de document, la mise en page, la résolution de l’image et diverses autres configurations.

Pour commencer ce processus de conversion, nous devons d’abord ajouter la référence du SDK dans notre projet et pour cela, veuillez rechercher « Aspose.PDF-Cloud » dans le gestionnaire de packages NuGet dans Visual Studio IDE et cliquez sur le bouton « Ajouter un package ». . Vous devez également obtenir vos informations d’identification client à partir du tableau de bord cloud. Si vous n’avez pas de compte existant, créez simplement un compte gratuit en suivant les instructions spécifiées dans démarrage rapide.

Convertir un PDF en HTML à l’aide de C# .NET

Nous devons maintenant exécuter l’extrait de code suivant pour effectuer la conversion afin de pouvoir restituer le PDF sur le site Web.

// Pour plus d'exemples, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Obtenez les informations d'identification du client sur https://dashboard.aspose.cloud/
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// créer une instance de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Saisissez le nom du fichier PDF
String inputFile = "Binder1-1.pdf";
// lire le contenu du fichier PDF d'entrée
var pdfFile = System.IO.File.OpenRead(inputFile);

// Appelez l'API pour convertir le fichier PDF en HTML et enregistrer la sortie sur le stockage cloud
// Nous avons spécifié le format HTML de sortie comme « HTML5 » 
// L'indicateur permettant d'enregistrer chaque page PDF en tant que fichier HTML distinct est activé
// La sortie sera générée sous forme d'archive .ZIP
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF en HTML

Aperçu de la conversion PDF en HTML.

Vous trouverez ci-dessous des détails rapides concernant l’extrait de code indiqué ci-dessus.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Tout d’abord, créez un objet de la classe PdfApi tout en transmettant les informations d’identification du client comme arguments d’entrée.

var pdfFile = System.IO.File.OpenRead(inputFile);

Lisez le contenu du fichier PDF à partir du lecteur local.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Appelez l’API pour convertir le PDF du flux d’entrée au format HTML. Lors de la conversion, nous avons spécifié la valeur pour enregistrer chaque page PDF dans un fichier HTML individuel.

Veuillez visiter PutPdfInRequestToHtml pour une liste complète des arguments pris en charge par cet appel d’API et leurs détails associés.

Le document PDF d’entrée utilisé dans l’exemple ci-dessus peut être téléchargé à partir de Binder1.pdf.

PDF en HTML en ligne à l’aide des commandes cURL

La conversion de PDF en HTML à l’aide des commandes cURL en combinaison avec Aspose.PDF Cloud est également une approche polyvalente et efficace. En tirant parti de la puissance des commandes cURL, vous pouvez facilement intégrer l’API Aspose.PDF Cloud dans vos applications et automatiser le processus de conversion PDF en HTML. De plus, l’utilisation des commandes cURL permet une interaction facile avec les points de terminaison RESTful, permettant une communication et un échange de données transparents. Ainsi, pour afficher le PDF dans le navigateur HTML, nous devons simplement convertir les fichiers PDF en HTML en appelant quelques commandes cURL, ce qui réduit considérablement le temps et les efforts de développement.

La première étape de cette approche est la génération d’un jeton d’accès JWT. Alors, veuillez exécuter la commande suivante :

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Nous devons maintenant exécuter la commande cURL suivante qui charge le fichier PDF à partir du stockage cloud, convertit l’intégralité du document au format HTML et enregistre la sortie sous forme d’archive .ZIP sur le lecteur local (nom spécifié avec l’argument -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Remplacez « inputPDF » par le nom d’un document PDF d’entrée disponible dans le stockage cloud, et « accessToken » par le jeton d’accès JWT généré ci-dessus.

Conclusion

En conclusion, la conversion de PDF en HTML avec l’API Aspose.PDF Cloud fournit une solution complète et polyvalente. Qu’il s’agisse de l’API .NET REST pour une intégration transparente ou des commandes cURL pour une conversion efficace, le SDK Aspose.PDF Cloud offre des fonctionnalités et des options de personnalisation étendues. Ces approches garantissent un rendu précis du contenu PDF en HTML réactif, préservant la mise en page et le formatage pour une expérience utilisateur optimale. De plus, la possibilité d’intégrer du contenu PDF dans des pages HTML permet de créer des applications Web polyvalentes et interactives, améliorant ainsi l’accessibilité et l’engagement des utilisateurs.

Liens utiles

Articles Liés

Nous vous recommandons fortement de visiter les blogs suivants :