Développer un convertisseur PDF en Excel à l’aide de Python Cloud SDK.

Convertir un PDF en Excel

Comment convertir un PDF en Excel | Exporter un PDF vers Excel à l’aide du SDK Python

Les fichiers PDF sont parfaits pour préserver la mise en forme des documents, mais l’extraction et l’utilisation des données qu’ils contiennent peuvent s’avérer complexes. C’est là qu’il devient évident de devoir convertir un PDF en Excel. Le classeur Excel, avec son format de feuille de calcul, offre une manière structurée d’organiser et de traiter les données. Imaginez pouvoir extraire de manière transparente des tableaux, des figures et du texte d’un PDF et les disposer soigneusement dans des cellules Excel, prêtes à être analysées. Cette conversion simplifie non seulement la gestion des données, mais améliore également l’efficacité et la productivité.

De plus, Excel est principalement utilisé pour stocker et organiser des données telles que les revenus, la paie et les informations comptables. Ils permettent à l’utilisateur d’effectuer des calculs avec ces données et de produire des graphiques et des diagrammes. Dans cet article, nous allons maintenant discuter des détails sur la façon de transformer un PDF au format Excel.

SDK Python Cloud pour le traitement PDF

Aspose.PDF Cloud SDK for Python apparaît comme un outil puissant pour rationaliser le processus de conversion PDF en XLS. Non seulement il facilite la conversion transparente de « PDF en Excel », mais il offre également une myriade d’autres fonctionnalités. Imaginez exploiter la capacité de manipuler des PDF, d’extraire des données spécifiques et de générer des fichiers compatibles Excel sans effort.

La première étape consiste à installer le SDK Python Cloud, disponible en téléchargement sur les référentiels PIP et GitHub. Veuillez donc exécuter la commande suivante sur le terminal/l’invite de commande pour installer la dernière version du SDK Cloud.

pip install asposepdfcloud

MS Visual Studio

Si vous devez ajouter directement la référence dans votre projet Python dans l’IDE de Visual Studio, recherchez asposepdfcloud en tant que package dans la fenêtre d’environnement Python. Veuillez suivre les étapes numérotées dans l’image ci-dessous pour terminer le processus d’installation.

Enregistrer un PDF dans Excel

Image 1 : Package Aspose.PDF Cloud SDK pour Python.

PyCharm

PyCharm est un IDE populaire pour le développement Python. Dans cette section, nous allons discuter des paramètres de PyCharm sur la plateforme Windows.

  • Cliquez sur le menu Fichier et sélectionnez l’élément de menu Paramètres…
Paramètres de PyCharm

Image 2 : élément de menu Paramètres de PyCharm.

  • Développez l’arborescence du projet à partir de la gauche et sélectionnez l’option Interpréteur Python.
  • Cliquez sur le signe + (plus) dans la section de droite et entrez asposepdfcloud dans le champ de recherche au-dessus de la boîte de dialogue des packages disponibles.
  • Cliquez maintenant sur le bouton Installer le package.
Convertir un PDF en Excel SDK

Image 3 : Package Aspose.PDF Cloud pour Python.

Une fois le SDK installé, le message de réussite s’affiche.

SDK PDF vers Excel

Image 4 : Message de réussite une fois Aspose.PDF Cloud pour Python installé.

  • Si vous n’avez pas de compte existant sur tableau de bord cloud, vous pouvez créer un compte gratuit en utilisant les identifiants GitHub ou Google. Connectez-vous maintenant au tableau de bord et obtenez vos identifiants client personnalisés.
Informations d'identification du client

Image 5 : Informations d’identification du client sur le tableau de bord Aspose.Cloud.

Convertir un PDF en Excel en Python

Veuillez suivre les instructions ci-dessous pour transformer un fichier PDF en classeur Excel (XLSX) à l’aide d’un extrait de code Python. Veuillez noter que les extraits de code suivants supposent que le fichier PDF d’entrée est disponible dans le stockage cloud.

  • Tout d’abord, créez une instance de la classe ApiClient tout en fournissant l’ID client et le secret client comme arguments.
  • Deuxièmement, créez une instance de la classe PdfApi qui prend l’objet ApiClient comme argument.
  • Spécifiez maintenant le nom du fichier PDF d’entrée et le nom du fichier XLSX résultant.
  • Enfin, appelez la méthode putpdfinstoragetoxlsx(..) qui prend le fichier PDF d’entrée, le nom du fichier XLSX résultant et un paramètre facultatif pour générer des feuilles de calcul uniformes.
# Pour plus d'exemples de code, veuillez visiter https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Pour les informations d'identification du client, veuillez visiter https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # créer une instance PdfApi en passant PdfApiClient comme argument
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # nom du classeur Excel résultant
        resultant_file_name = 'Resultant.xlsx'
    
        # Appeler l'API pour convertir un PDF au format Excel
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # imprimer un message dans la console (facultatif)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
Aperçu PDF vers XLSX

Image 6 : Aperçu de la conversion PDF en Excel.

Les fichiers d’exemple utilisés dans l’exemple ci-dessus peuvent être téléchargés à partir de awesomeTable.pdf et Resultant.xlsx.

Conversion PDF en XLS à l’aide de la commande cURL

La transformation d’un PDF en XLS peut être facilement réalisée à l’aide d’Aspose.PDF Cloud et des commandes cURL, car il s’agit d’une approche simplifiée et automatisée. En utilisant les commandes cURL en conjonction avec Aspose.PDF Cloud, nous simplifions non seulement le processus de conversion, mais permettons également une intégration transparente dans divers flux de travail.

La première étape de cette approche consiste à générer un jeton Web JSON (JWT) basé sur les informations d’identification du client. Veuillez donc exécuter la commande suivante pour générer le jeton JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Une fois que nous avons le jeton JWT, veuillez exécuter la commande suivante pour convertir le format PDF au format XLS.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Conclusion

En conclusion, que vous optiez pour le puissant SDK Aspose.PDF Cloud pour Python ou que vous utilisiez les commandes cURL en tandem avec Aspose.PDF Cloud, vous pouvez facilement atteindre votre objectif de transformer un PDF au format Excel. Le SDK Aspose.PDF Cloud pour Python offre une solution complète et conviviale pour les développeurs, vous offrant un éventail de fonctionnalités au-delà de la conversion. D’autre part, l’exploitation des commandes cURL offre une approche polyvalente et scriptable. Quelle que soit la méthode choisie, les deux approches constituent des outils puissants, révolutionnant la façon dont nous structurons et extrayons les données des PDF.

Articles connexes

Nous vous recommandons de consulter les articles suivants pour en savoir plus sur :