Entwickeln Sie einen PDF zu Excel-Konverter mit dem Python Cloud SDK.

Konvertieren Sie PDF in Excel

So konvertieren Sie PDF in Excel | Exportieren Sie PDF mit dem Python SDK nach Excel

PDF Dateien eignen sich hervorragend zum Beibehalten der Dokumentformatierung, aber das Extrahieren und Verwenden von Daten aus ihnen kann komplex sein. Hier wird die Notwendigkeit der Konvertierung von PDF in Excel deutlich. Die Excel-Arbeitsmappe mit ihrem Tabellenkalkulationsformat bietet eine strukturierte Möglichkeit, Daten zu organisieren und zu verarbeiten. Stellen Sie sich vor, Sie extrahieren nahtlos Tabellen, Abbildungen und Text aus einer PDF-Datei und haben sie übersichtlich in Excel-Zellen angeordnet, bereit zur Analyse. Diese Konvertierung vereinfacht nicht nur die Datenverarbeitung, sondern steigert auch die Effizienz und Produktivität.

Darüber hinaus wird Excel hauptsächlich zum Speichern und Organisieren von Daten wie Umsatz-, Lohn und Buchhaltungsinformationen verwendet. Der Benutzer kann mit diesen Daten Berechnungen durchführen und Grafiken und Diagramme erstellen. In diesem Artikel besprechen wir nun die Einzelheiten zur Konvertierung von PDF in das Excel-Format.

Python Cloud SDK für die PDF-Verarbeitung

Aspose.PDF Cloud SDK für Python erweist sich als leistungsstarkes Tool zur Optimierung des Konvertierungsprozesses von PDF in XLS. Es ermöglicht nicht nur die nahtlose Konvertierung von PDF in Excel, sondern bietet auch eine Vielzahl anderer Funktionen. Stellen Sie sich vor, Sie könnten PDFs bearbeiten, bestimmte Daten extrahieren und mühelos Excel-fähige Dateien erstellen.

Der erste Schritt besteht darin, das Python Cloud SDK zu installieren, das über das PIP und GitHub-Repository zum Download bereitsteht. Führen Sie daher bitte den folgenden Befehl im Terminal/in der Eingabeaufforderung aus, um die neueste Version des Cloud SDK zu installieren.

pip install asposepdfcloud

MS Visual Studio

Falls Sie die Referenz direkt in Ihrem Python-Projekt in der Visual Studio IDE hinzufügen müssen, suchen Sie bitte im Python-Umgebungsfenster nach asposepdfcloud als Paket. Befolgen Sie die im Bild unten nummerierten Schritte, um den Installationsvorgang abzuschließen.

PDF in Excel speichern

Bild 1: – Aspose.PDF Cloud SDK für Python-Paket.

PyCharm

PyCharm ist eine beliebte IDE für die Python-Entwicklung. In diesem Abschnitt besprechen wir die PyCharm-Einstellungen auf der Windows-Plattform.

  • Klicken Sie auf das Menü „Datei“ und wählen Sie den Menüpunkt „Einstellungen …“
PyCharm-Einstellungen

Bild 2: – Menüpunkt „PyCharm-Einstellungen“.

  • Erweitern Sie den Projektbaum von links und wählen Sie die Option „Python-Interpreter“.
  • Klicken Sie im rechten Bereich auf das + (Plus)-Zeichen und geben Sie „asposepdfcloud“ in das Suchfeld über dem Dialogfeld „Verfügbare Pakete“ ein.
  • Klicken Sie nun auf die Schaltfläche „Paket installieren“.
Konvertieren von PDF in Excel SDK

Bild 3: – Aspose.PDF Cloud für Python-Paket.

Sobald das SDK installiert ist, wird die Erfolgsmeldung angezeigt.

PDF zu Excel SDK

Bild 4: – Erfolgsmeldung, sobald Aspose.PDF Cloud für Python installiert ist.

  • Falls Sie noch kein Konto auf dem Cloud Dashboard haben, können Sie mit GitHub oder Google-Anmeldeinformationen ein kostenloses Konto erstellen. Melden Sie sich nun beim Dashboard an und erhalten Sie Ihre personalisierten Client-Anmeldeinformationen.
Client-Anmeldeinformationen

Bild 5: – Client-Anmeldeinformationen auf dem Aspose.Cloud-Dashboard.

Konvertieren Sie PDF in Excel in Python

Befolgen Sie die nachstehenden Anweisungen, um PDF mithilfe eines Python-Codeausschnitts in eine Excel-Arbeitsmappe (XLSX) umzuwandeln. Bitte beachten Sie, dass die folgenden Codeausschnitte voraussetzen, dass die Eingabe-PDF im Cloud-Speicher verfügbar ist.

  • Erstellen Sie zunächst eine Instanz der Klasse ApiClient und geben Sie als Argumente die Client-ID und das Client-Geheimnis an.
  • Zweitens erstellen Sie eine Instanz der PdfApi Klasse, die das ApiClient Objekt als Argument verwendet.
  • Geben Sie nun den Namen der Eingabe-PDF und den resultierenden XLSX-Dateinamen an.
  • Rufen Sie abschließend die Methode putpdfinstoragetoxlsx(..) auf, die die Eingabe-PDF-Datei, den resultierenden XLSX-Dateinamen und einen optionalen Parameter übernimmt, um einheitliche Arbeitsblätter zu generieren.
# Weitere Codebeispiele finden Sie unter https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Die Client-Anmeldeinformationen finden Sie unter https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # Erstellen Sie eine PdfApi-Instanz und übergeben Sie dabei PdfApiClient als Argument
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # Name der resultierenden Excel-Arbeitsmappe
        resultant_file_name = 'Resultant.xlsx'
    
        # Rufen Sie die API auf, um PDF in das Excel-Format zu konvertieren
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # Nachricht in der Konsole drucken (optional)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
PDF zu XLSX-Vorschau

Bild 6: Vorschau der Konvertierung von PDF in Excel.

Die im obigen Beispiel verwendeten Beispieldateien können von awesomeTable.pdf und Resultant.xlsx heruntergeladen werden.

PDF zu XLS-Konvertierung mit dem cURL-Befehl

Die Konvertierung von PDF in XLS kann problemlos mit Aspose.PDF Cloud zusammen mit cURL-Befehlen durchgeführt werden, da dies einen optimierten und automatisierten Ansatz darstellt. Durch die Verwendung von cURL-Befehlen in Verbindung mit Aspose.PDF Cloud vereinfachen wir nicht nur den Konvertierungsprozess, sondern ermöglichen auch eine nahtlose Integration in verschiedene Arbeitsabläufe.

Der erste Schritt bei diesem Ansatz besteht darin, ein JSON Web Token (JWT) basierend auf den Clientanmeldeinformationen zu generieren. Führen Sie daher den folgenden Befehl aus, um das JWT-Token zu generieren.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Sobald wir das JWT-Token haben, führen Sie bitte den folgenden Befehl aus, um PDF in das XLS-Format zu konvertieren.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Abschluss

Zusammenfassend lässt sich sagen, dass wir unser Ziel, PDF in das Excel-Format zu konvertieren, problemlos erreichen können, egal ob wir uns für das robuste Aspose.PDF Cloud SDK für Python entscheiden oder cURL-Befehle in Verbindung mit Aspose.PDF Cloud verwenden. Das Aspose.PDF Cloud SDK für Python bietet eine umfassende und entwicklerfreundliche Lösung, die Ihnen eine Reihe von Funktionen über die Konvertierung hinaus bietet. Andererseits bietet die Nutzung von cURL-Befehlen einen vielseitigen und skriptfähigen Ansatz. Unabhängig von der gewählten Methode sind beide Ansätze leistungsstarke Tools, die die Art und Weise revolutionieren, wie wir Daten aus PDFs strukturieren und extrahieren.

  • Falls Sie bei der Verwendung des Python Cloud SDK auf Probleme stoßen, können Sie uns gerne über das kostenlose Kundensupportforum kontaktieren.

Verwandte Artikel

Wir empfehlen Ihnen, die folgenden Artikel zu lesen, um mehr über Folgendes zu erfahren: