Αναπτύξτε τον μετατροπέα PDF σε Excel χρησιμοποιώντας το Python Cloud SDK.

Μετατροπή PDF σε Excel

Πώς να μετατρέψετε PDF σε Excel | Εξαγωγή PDF σε Excel χρησιμοποιώντας Python SDK

Τα αρχεία PDF είναι εξαιρετικά για τη διατήρηση της μορφοποίησης εγγράφων, αλλά η εξαγωγή και η χρήση δεδομένων από αυτά μπορεί να είναι πολύπλοκη. Εδώ γίνεται εμφανής η ανάγκη για μετατροπή PDF σε Excel. Το βιβλίο εργασίας Excel, με τη μορφή υπολογιστικού φύλλου, προσφέρει έναν δομημένο τρόπο οργάνωσης και επεξεργασίας δεδομένων. Φανταστείτε να εξάγετε απρόσκοπτα πίνακες, σχήματα και κείμενο από ένα PDF και να τα έχετε τακτοποιημένα σε κελιά του Excel, έτοιμα για ανάλυση. Αυτή η μετατροπή όχι μόνο απλοποιεί τον χειρισμό δεδομένων αλλά ενισχύει επίσης την αποτελεσματικότητα και την παραγωγικότητα.

Επιπλέον, το excel χρησιμοποιείται κυρίως για την αποθήκευση και την οργάνωση δεδομένων όπως έσοδα, μισθοδοσία και λογιστικές πληροφορίες. Επιτρέπουν στο χρήστη να κάνει υπολογισμούς με αυτά τα δεδομένα και να παράγει γραφήματα και γραφήματα. Τώρα σε αυτό το άρθρο, θα συζητήσουμε τις λεπτομέρειες σχετικά με τον τρόπο μετατροπής PDF σε μορφή Excel.

Python Cloud SDK για επεξεργασία PDF

Το Aspose.PDF Cloud SDK για Python αναδύεται ως ένα ισχυρό εργαλείο για τον εξορθολογισμό της διαδικασίας μετατροπής PDF σε XLS. Όχι μόνο διευκολύνει την απρόσκοπτη μετατροπή «pdf σε excel», αλλά προσφέρει επίσης μυριάδες άλλες δυνατότητες. Φανταστείτε να αξιοποιείτε την ικανότητα χειρισμού αρχείων PDF, εξαγωγής συγκεκριμένων δεδομένων και δημιουργίας αρχείων έτοιμα για Excel χωρίς κόπο.

Το πρώτο βήμα είναι να εγκαταστήσετε το Python Cloud SDK το οποίο είναι διαθέσιμο για λήψη μέσω του αποθετηρίου PIP και GitHub. Επομένως, εκτελέστε την ακόλουθη εντολή στο τερματικό/γραμμή εντολών για να εγκαταστήσετε την πιο πρόσφατη έκδοση του Cloud SDK.

pip install asposepdfcloud

MS Visual Studio

Σε περίπτωση που χρειαστεί να προσθέσετε απευθείας την αναφορά στο έργο Python στο Visual Studio IDE, αναζητήστε το asposepdfcloud ως πακέτο κάτω από το παράθυρο περιβάλλοντος Python. Ακολουθήστε τα βήματα που αριθμούνται στην παρακάτω εικόνα για να ολοκληρώσετε τη διαδικασία εγκατάστασης.

Αποθήκευση PDF στο Excel

Εικόνα 1:- Aspose.PDF Cloud SDK για πακέτο Python.

PyCharm

Το PyCharm είναι ένα δημοφιλές IDE για ανάπτυξη Python. Σε αυτήν την ενότητα, θα συζητήσουμε τις ρυθμίσεις PyCharm στην πλατφόρμα των Windows.

  • Κάντε κλικ στο μενού Αρχείο και επιλέξτε το στοιχείο μενού Ρυθμίσεις….
Ρυθμίσεις PyCharm

Εικόνα 2: - Στοιχείο μενού Ρυθμίσεις PyCharm.

  • Αναπτύξτε το δέντρο Project από τα αριστερά και επιλέξτε την επιλογή Python Interpreter.
  • Κάντε κλικ στο σύμβολο + (συν) στη δεξιά ενότητα και εισαγάγετε asposepdfcloud στο πεδίο αναζήτησης στο παράθυρο διαλόγου διαθέσιμων πακέτων.
  • Τώρα κάντε κλικ στο κουμπί Εγκατάσταση πακέτου.
Μετατροπή PDF σε Excel SDK

Εικόνα 3:- Aspose.PDF Cloud for Python πακέτο.

Μόλις εγκατασταθεί το SDK, εμφανίζεται το μήνυμα επιτυχίας.

PDF σε Excel SDK

Εικόνα 4:- Μήνυμα επιτυχίας μόλις εγκατασταθεί το Aspose.PDF Cloud for Python.

  • Σε περίπτωση που δεν έχετε υπάρχοντα λογαριασμό στο σύννεφο dashboard, μπορείτε να δημιουργήσετε έναν δωρεάν λογαριασμό χρησιμοποιώντας τα διαπιστευτήρια GitHub ή Google. Τώρα συνδεθείτε στον πίνακα ελέγχου και αποκτήστε τα εξατομικευμένα διαπιστευτήρια πελάτη.
Διαπιστευτήρια πελάτη

Εικόνα 5:- Διαπιστευτήρια πελάτη στον πίνακα ελέγχου Aspose.Cloud.

Μετατροπή PDF σε Excel σε Python

Ακολουθήστε τις παρακάτω οδηγίες για να μετατρέψετε το PDF σε βιβλίο εργασίας Excel (XLSX) χρησιμοποιώντας ένα απόσπασμα κώδικα Python. Λάβετε υπόψη ότι τα αποσπάσματα κώδικα που ακολουθούν αναμένουν ότι το PDF εισόδου θα είναι διαθέσιμο στο χώρο αποθήκευσης cloud.

  • Αρχικά, δημιουργήστε μια παρουσία της κλάσης ApiClient ενώ παρέχετε ως ορίσματα Client ID Client Secret.
  • Δεύτερον, δημιουργήστε μια παρουσία της κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα.
  • Τώρα καθορίστε το όνομα του εισαγόμενου PDF και το όνομα του αρχείου XLSX που προκύπτει.
  • Τέλος, καλέστε τη μέθοδο putpdfinstoragetoxlsx(..) που λαμβάνει το αρχείο εισόδου PDF, το όνομα του αρχείου XLSX που προκύπτει και μια προαιρετική παράμετρο για τη δημιουργία ομοιόμορφων φύλλων εργασίας.
# Για περισσότερα δείγματα κώδικα, επισκεφθείτε τη διεύθυνση https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Για τα διαπιστευτήρια πελάτη, επισκεφθείτε τη διεύθυνση https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # όνομα του προκύπτοντος βιβλίου εργασίας excel
        resultant_file_name = 'Resultant.xlsx'
    
        # Καλέστε το API για μετατροπή PDF σε μορφή Excel
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
Προεπισκόπηση PDF σε XLSX

Εικόνα 6: - Προεπισκόπηση μετατροπής PDF σε Excel.

Μπορείτε να λάβετε τα δείγματα αρχείων που χρησιμοποιούνται στο παραπάνω παράδειγμα από το awesomeTable.pdf και το Resultant.xlsx.

Μετατροπή PDF σε XLS με χρήση της εντολής cURL

Ο μετασχηματισμός του PDf σε XLS μπορεί εύκολα να επιτευχθεί χρησιμοποιώντας το Aspose.PDF Cloud μαζί με εντολές cURL, καθώς αντιπροσωπεύει μια βελτιωμένη και αυτοματοποιημένη προσέγγιση. Χρησιμοποιώντας εντολές cURL σε συνδυασμό με το Aspose.PDF Cloud, όχι μόνο απλοποιούμε τη διαδικασία μετατροπής αλλά και επιτρέπουμε την απρόσκοπτη ενσωμάτωση σε διάφορες ροές εργασίας.

Το πρώτο σε αυτήν την προσέγγιση είναι η δημιουργία ενός JSON Web Token (JWT) με βάση τα διαπιστευτήρια πελάτη. Επομένως, εκτελέστε την ακόλουθη εντολή για να δημιουργήσετε το διακριτικό JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Μόλις έχουμε το διακριτικό JWT, εκτελέστε την ακόλουθη εντολή για να μετατρέψετε το PDF σε μορφή XLS.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Σύναψη

Συμπερασματικά, είτε επιλέγουμε το ισχυρό Aspose.PDF Cloud SDK για Python είτε χρησιμοποιώντας εντολές cURL σε συνδυασμό με το Aspose.PDF Cloud, μπορούμε εύκολα να επιτύχουμε τον στόχο μας να μετατρέψουμε το PDF σε μορφή Excel. Το Aspose.PDF Cloud SDK για Python προσφέρει μια ολοκληρωμένη και φιλική προς τους προγραμματιστές λύση, δίνοντάς σας τη δυνατότητα με μια σειρά λειτουργιών πέρα από τη μετατροπή. Από την άλλη πλευρά, η αξιοποίηση των εντολών cURL παρέχει μια ευέλικτη και με δυνατότητα σεναρίου προσέγγιση. Ανεξάρτητα από την επιλεγμένη μέθοδο, και οι δύο προσεγγίσεις αποτελούν ισχυρά εργαλεία, φέρνοντας επανάσταση στον τρόπο με τον οποίο δομούμε και εξάγουμε δεδομένα από αρχεία PDF.

Σχετικά Άρθρα

Συνιστούμε να επισκεφθείτε τα ακόλουθα άρθρα για να μάθετε σχετικά: