pdf en html

Apprenez à convertir un PDF en HTML à l’aide de Python

Dans le monde numérique actuel, qui évolue à un rythme effréné, l’accessibilité des documents est une préoccupation majeure pour les entreprises comme pour les particuliers. La nécessité de convertir des documents PDF en HTML n’a jamais été aussi prononcée. Bien que les fichiers PDF soient excellents pour préserver la mise en forme des documents, leur utilisation sur le Web peut s’avérer fastidieuse. Ils manquent souvent de l’interactivité et de l’adaptabilité requises pour les expériences en ligne modernes. C’est là que l’API REST de Python intervient pour combler le fossé. Cet article explore la demande croissante de conversion PDF en HTML et comment l’API REST de Python peut révolutionner ce processus.

API REST Python pour la conversion PDF en HTML

La conversion de documents PDF au format HTML est une tâche simplifiée et efficace grâce au SDK Aspose.PDF Cloud pour Python. Ce puissant SDK offre un éventail de fonctionnalités pour relever les défis de la conversion PDF en HTML de manière transparente. Que vous ayez besoin de présenter vos documents sur le Web, de partager du contenu sur différentes plateformes ou d’améliorer l’accessibilité des documents, Aspose.PDF Cloud est là pour vous.

Le Python Cloud SDK est entièrement capable de créer, d’éditer ou de transformer des fichiers PDF en divers formats, notamment EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.

Le SDK est disponible en téléchargement sur les référentiels PIP et GitHub. Exécutez maintenant la commande suivante sur le terminal/l’invite de commande pour installer la dernière version du SDK sur le système.

pip install asposepdfcloud

Si vous devez ajouter directement la référence dans votre projet Python dans l’IDE de Visual Studio, recherchez asposepdfcloud en tant que package dans la fenêtre d’environnement Python. Veuillez suivre les étapes numérotées dans l’image ci-dessous pour terminer le processus d’installation.

API pdftohtml

Image 1 : API de conversion PDF en HTML.

Convertir un PDF en HTML en Python

Veuillez suivre les instructions ci-dessous pour convertir un format PDF au format HTML.

  • Tout d’abord, créez une instance de la classe ApiClient tout en transmettant les détails du ClinetID et du secret client comme arguments.
  • Deuxièmement, créez un objet de PdfApi où nous passons l’objet ApiClient comme argument.
  • Troisièmement, spécifiez le nom du PDF d’entrée et du PDF de sortie résultant.
  • Enfin, appelez la méthode putpdfinstoragetohtml(…) de la classe PdfApi pour lancer la conversion. La sortie est stockée dans un stockage cloud.
# pour des exemples de code complets, veuillez visiter https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # créer une instance PdfApi en passant PdfApiClient comme argument
        pdf_api = PdfApi(pdf_api_client)

        # Document PDF source
        input_file_name = 'completeWorkbook.pdf'

        # nom du fichier résultant
        resultant_file_name = 'CodeConversion.zip'
    
        # Appeler l'API pour effectuer la conversion
        # nous avons défini le format de sortie comme zip et le type de document comme xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # imprimer un message dans la console (facultatif)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

Conversion de PDF en HTML à l’aide de la commande cURL

La conversion de PDF en HTML peut également être simplifiée à l’aide des commandes cURL en combinaison avec Aspose.PDF Cloud. Cette approche offre un moyen pratique d’exploiter les capacités d’Aspose.PDF Cloud pour vos besoins de conversion de PDF en HTML. Cette approche répond parfaitement à vos besoins lorsque vous recherchez une approche indépendante de la plate-forme et de la langue pour mettre en œuvre un processus de conversion PDF en HTML transparent.

Nous devons d’abord générer un jeton d’accès JWT basé sur les informations d’identification du client. Veuillez exécuter la commande suivante pour générer le jeton JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Une fois que nous avons le jeton JWT, nous pouvons exécuter la commande suivante pour convertir un fichier PDF disponible dans le stockage Cloud au format HTML et, par conséquent, la sortie est renvoyée sous forme de réponse de flux.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

Si vous devez convertir le fichier PDF en HTML et souhaitez également enregistrer la sortie dans le stockage cloud, essayez d’utiliser la commande suivante.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
Aperçu PDF vers HTML

Image 2 : Aperçu de la conversion PDF en HTML.

Conclusion

En conclusion, le passage du PDF au HTML n’a jamais été aussi simple. Nous avons exploré la puissance de transformation des API REST Python et l’efficacité d’Aspose.PDF Cloud avec les commandes cURL pour convertir vos documents PDF en HTML dynamique et prêt pour le Web. Ces méthodes garantissent non seulement l’intégrité des documents, mais améliorent également l’accessibilité et la partageabilité. Il est donc temps de rendre votre contenu accessible à un public plus large et d’améliorer votre présence en ligne.

Si vous rencontrez des problèmes lors de l’utilisation de l’API ou si vous avez d’autres questions, n’hésitez pas à nous contacter via le forum d’assistance produit gratuit.

Articles connexes

Nous vous recommandons vivement de visiter les liens suivants pour en savoir plus sur :