Développer un convertisseur PDF en Excel à l’aide de Python Cloud SDK.

Comment convertir un PDF en Excel | Exporter un PDF vers Excel à l’aide du SDK Python
Les fichiers PDF sont parfaits pour préserver la mise en forme des documents, mais l’extraction et l’utilisation des données qu’ils contiennent peuvent s’avérer complexes. C’est là qu’il devient évident de devoir convertir un PDF en Excel. Le classeur Excel, avec son format de feuille de calcul, offre une manière structurée d’organiser et de traiter les données. Imaginez pouvoir extraire de manière transparente des tableaux, des figures et du texte d’un PDF et les disposer soigneusement dans des cellules Excel, prêtes à être analysées. Cette conversion simplifie non seulement la gestion des données, mais améliore également l’efficacité et la productivité.
De plus, Excel est principalement utilisé pour stocker et organiser des données telles que les revenus, la paie et les informations comptables. Ils permettent à l’utilisateur d’effectuer des calculs avec ces données et de produire des graphiques et des diagrammes. Dans cet article, nous allons maintenant discuter des détails sur la façon de transformer un PDF au format Excel.
- SDK Python Cloud pour le traitement PDF
- Convertir un PDF en Excel en Python
- Conversion PDF en XLS à l’aide de la commande cURL
SDK Python Cloud pour le traitement PDF
Aspose.PDF Cloud SDK for Python apparaît comme un outil puissant pour rationaliser le processus de conversion PDF en XLS. Non seulement il facilite la conversion transparente de « PDF en Excel », mais il offre également une myriade d’autres fonctionnalités. Imaginez exploiter la capacité de manipuler des PDF, d’extraire des données spécifiques et de générer des fichiers compatibles Excel sans effort.
La première étape consiste à installer le SDK Python Cloud, disponible en téléchargement sur les référentiels PIP et GitHub. Veuillez donc exécuter la commande suivante sur le terminal/l’invite de commande pour installer la dernière version du SDK Cloud.
pip install asposepdfcloud
MS Visual Studio
Si vous devez ajouter directement la référence dans votre projet Python dans l’IDE de Visual Studio, recherchez asposepdfcloud en tant que package dans la fenêtre d’environnement Python. Veuillez suivre les étapes numérotées dans l’image ci-dessous pour terminer le processus d’installation.

Image 1 : Package Aspose.PDF Cloud SDK pour Python.
PyCharm
PyCharm est un IDE populaire pour le développement Python. Dans cette section, nous allons discuter des paramètres de PyCharm sur la plateforme Windows.
- Cliquez sur le menu Fichier et sélectionnez l’élément de menu Paramètres…

Image 2 : élément de menu Paramètres de PyCharm.
- Développez l’arborescence du projet à partir de la gauche et sélectionnez l’option Interpréteur Python.
- Cliquez sur le signe + (plus) dans la section de droite et entrez asposepdfcloud dans le champ de recherche au-dessus de la boîte de dialogue des packages disponibles.
- Cliquez maintenant sur le bouton Installer le package.

Image 3 : Package Aspose.PDF Cloud pour Python.
Une fois le SDK installé, le message de réussite s’affiche.

Image 4 : Message de réussite une fois Aspose.PDF Cloud pour Python installé.
- Si vous n’avez pas de compte existant sur tableau de bord cloud, vous pouvez créer un compte gratuit en utilisant les identifiants GitHub ou Google. Connectez-vous maintenant au tableau de bord et obtenez vos identifiants client personnalisés.

Image 5 : Informations d’identification du client sur le tableau de bord Aspose.Cloud.
Convertir un PDF en Excel en Python
Veuillez suivre les instructions ci-dessous pour transformer un fichier PDF en classeur Excel (XLSX) à l’aide d’un extrait de code Python. Veuillez noter que les extraits de code suivants supposent que le fichier PDF d’entrée est disponible dans le stockage cloud.
- Tout d’abord, créez une instance de la classe ApiClient tout en fournissant l’ID client et le secret client comme arguments.
- Deuxièmement, créez une instance de la classe PdfApi qui prend l’objet ApiClient comme argument.
- Spécifiez maintenant le nom du fichier PDF d’entrée et le nom du fichier XLSX résultant.
- Enfin, appelez la méthode putpdfinstoragetoxlsx(..) qui prend le fichier PDF d’entrée, le nom du fichier XLSX résultant et un paramètre facultatif pour générer des feuilles de calcul uniformes.
# Pour plus d'exemples de code, veuillez visiter https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Pour les informations d'identification du client, veuillez visiter https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# créer une instance PdfApi en passant PdfApiClient comme argument
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# nom du classeur Excel résultant
resultant_file_name = 'Resultant.xlsx'
# Appeler l'API pour convertir un PDF au format Excel
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# imprimer un message dans la console (facultatif)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

Image 6 : Aperçu de la conversion PDF en Excel.
Les fichiers d’exemple utilisés dans l’exemple ci-dessus peuvent être téléchargés à partir de awesomeTable.pdf et Resultant.xlsx.
Conversion PDF en XLS à l’aide de la commande cURL
La transformation d’un PDF en XLS peut être facilement réalisée à l’aide d’Aspose.PDF Cloud et des commandes cURL, car il s’agit d’une approche simplifiée et automatisée. En utilisant les commandes cURL en conjonction avec Aspose.PDF Cloud, nous simplifions non seulement le processus de conversion, mais permettons également une intégration transparente dans divers flux de travail.
La première étape de cette approche consiste à générer un jeton Web JSON (JWT) basé sur les informations d’identification du client. Veuillez donc exécuter la commande suivante pour générer le jeton JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Une fois que nous avons le jeton JWT, veuillez exécuter la commande suivante pour convertir le format PDF au format XLS.
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Conclusion
En conclusion, que vous optiez pour le puissant SDK Aspose.PDF Cloud pour Python ou que vous utilisiez les commandes cURL en tandem avec Aspose.PDF Cloud, vous pouvez facilement atteindre votre objectif de transformer un PDF au format Excel. Le SDK Aspose.PDF Cloud pour Python offre une solution complète et conviviale pour les développeurs, vous offrant un éventail de fonctionnalités au-delà de la conversion. D’autre part, l’exploitation des commandes cURL offre une approche polyvalente et scriptable. Quelle que soit la méthode choisie, les deux approches constituent des outils puissants, révolutionnant la façon dont nous structurons et extrayons les données des PDF.
- Si vous rencontrez un problème lors de l’utilisation du Python Cloud SDK, n’hésitez pas à nous contacter via le forum d’assistance client gratuit.
Articles connexes
Nous vous recommandons de consulter les articles suivants pour en savoir plus sur :