Εξαγωγή συνημμένων PDF

Το αρχείο PDF αποτελείται από κείμενο και γραφικά και μπορεί να περιέχει ολόκληρα αρχεία μέσα σε αυτά ως συνημμένα. Αυτό καθιστά την ανταλλαγή συνόλων εγγράφων ευκολότερη και πιο αξιόπιστη. Το παράθυρο Συνημμένα σάς παρέχει ένα κεντρικό μέρος για προβολή, εισαγωγή, διαγραφή και εξαγωγή συνημμένων. Λάβετε επίσης υπόψη ότι εάν μετακινήσετε το αρχείο PDF σε μια νέα θέση, τα συνημμένα μέσα σε αυτό μετακινούνται επίσης μαζί του. Τα συνημμένα μπορεί να περιλαμβάνουν συνδέσμους προς ή από το γονικό έγγραφο ή προς άλλα συνημμένα. Μην συγχέετε τα συνημμένα σχόλια με τα συνημμένα αρχεία.

Σε αυτό το άρθρο, θα συζητήσουμε τις λεπτομέρειες σχετικά με το πώς μπορούμε να διαβάσουμε τις πληροφορίες σχετικά με τα συνημμένα σε έγγραφα PDF, καθώς και πώς μπορούμε να κατεβάσουμε συνημμένα από PDF χρησιμοποιώντας Python. Δεν απαιτείται λήψη και εγκατάσταση συγκεκριμένου λογισμικού και εκτελέστε όλες τις απαιτούμενες λειτουργίες στο cloud.

API επεξεργασίας PDF

Το Aspose.PDF Cloud είναι το API που βασίζεται σε REST που προσφέρει τις δυνατότητες δημιουργίας, επεξεργασίας και μετατροπής διαφόρων μορφών σε PDF, καθώς και απόδοσης αρχείων PDF σε μορφές όπως XLSX, PPTX, DOCX, EPUB, HTML, JPEG και πολλά άλλα. Λόγω της αρχιτεκτονικής REST, το API είναι προσβάσιμο σε οποιαδήποτε πλατφόρμα. Επομένως, μπορείτε να εφαρμόσετε δυνατότητες επεξεργασίας PDF σε εφαρμογές Desktop, Web, Mobile, Cloud και Hybrid.

Python SDK για επεξεργασία PDF

Προκειμένου να διευκολύνουμε περαιτέρω τους πελάτες μας, έχουμε δημιουργήσει συγκεκριμένα SDK προγραμματισμού, ώστε να έχετε όλες τις δυνατότητες επεξεργασίας PDF στη γλώσσα της επιλογής σας. Ομοίως, για να διευκολύνουμε τους προγραμματιστές Python, δημιουργήσαμε το SDK προγραμματισμού Python με το όνομα Aspose.PDF Cloud SDK for Python το οποίο είναι ένα περιτύλιγμα γύρω από το Aspose.PDF Cloud API. Τώρα για να ξεκινήσετε, το πρώτο βήμα είναι η εγκατάστασή του. Το SDK είναι διαθέσιμο για δωρεάν λήψη μέσω του αποθετηρίου PIP και GitHub. Τώρα εκτελέστε την ακόλουθη εντολή στο τερματικό/γραμμή εντολών για να εγκαταστήσετε την πιο πρόσφατη έκδοση του SDK στο σύστημα.

pip install asposepdfcloud

PyCharm IDE

Εάν χρησιμοποιείτε PyCharm IDE, μπορείτε να προσθέσετε απευθείας το SDK ως εξάρτηση στο έργο σας.

Αρχείο ->Ρυθμίσεις ->Έργο ->Διερμηνέας Python ->asposepdfcloud

λεζάντα

Image 1:- PyCharm settings option.

Aspose.PDF πακέτο Python

Εικόνα 2: - Πακέτο Aspose.Pdf Cloud Python.

Δωρεάν λογαριασμός Cloud Dashboard

Μετά την εγκατάσταση, το επόμενο σημαντικό βήμα είναι μια δωρεάν συνδρομή στις υπηρεσίες cloud μας μέσω του Aspose.Cloud dashboard. Ο σκοπός αυτής της συνδρομής είναι να επιτρέπεται μόνο σε εξουσιοδοτημένα άτομα να έχουν πρόσβαση στις υπηρεσίες επεξεργασίας αρχείων μας. Εάν έχετε λογαριασμό GitHub ή Google, απλώς Εγγραφείτε ή κάντε κλικ στο κουμπί Δημιουργία νέου λογαριασμού και δώστε τις απαιτούμενες πληροφορίες. Τώρα συνδεθείτε στον πίνακα εργαλείων χρησιμοποιώντας διαπιστευτήρια και αναπτύξτε την ενότητα Εφαρμογές από τον πίνακα εργαλείων και μετακινηθείτε προς τα κάτω προς την ενότητα Διαπιστευτήρια πελάτη για να δείτε στοιχεία Client ID και Client Secret.

Διαπιστευτήρια πελάτη

Εικόνα 3:- Διαπιστευτήρια πελάτη στο Aspose.Cloud Dashboard.

Διαβάστε τις πληροφορίες συνημμένων από PDF

Ακολουθήστε τις παρακάτω οδηγίες για να διαβάσετε τις πληροφορίες των συνημμένων στο έγγραφο PDF.

  • Πρώτον, πρέπει να δημιουργήσουμε μια παρουσία της κλάσης ApiClient ενώ παρέχουμε ως ορίσματα Client ID Client Secret.
  • Δεύτερον, δημιουργήστε ένα στιγμιότυπο κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα εισόδου.
  • Τώρα καλέστε τη μέθοδο getdocumentattachments(…) του PdfApi για να ανακτήσετε τις λεπτομέρειες του συνημμένου PDF.
def readAttachmentDetails():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # καλέστε το API για να εξαγάγετε τις λεπτομέρειες του συνημμένου
        response = pdf_api.get_document_attachments(name = input_file)
        print(response)
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF Attachment details successfully retrieved !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Για λόγους αναφοράς, το δείγμα εγγράφου PDF που χρησιμοποιείται στο παραπάνω παράδειγμα μπορεί να ληφθεί από το PdfWithEmbeddedFiles.pdf.

Διαβάστε τις Ειδικές Πληροφορίες Συνημμένου

Το API μας διευκολύνει επίσης να διαβάσουμε τις πληροφορίες συγκεκριμένων συνημμένων στο έγγραφο PDF. Για το σκοπό αυτό, δοκιμάστε να χρησιμοποιήσετε τη μέθοδο GetDocumentAttachmentByIndex. Δείτε παρακάτω τις λεπτομέρειες του πρώτου συνημμένου που ανακτήθηκε.

{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
                'creation_date': '11/24/2008 02:02:36.000 PM',
                'description': None,
                'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
                           'rel': 'self',
                           'title': None,
                           'type': None}],
                'mime_type': 'application/pdf',
                'modification_date': '05/03/2007 10:37:41.000 AM',
                'name': 'example1.pdf',
                'size': 10984},
 'code': 200,
 'status': 'OK'}

Κατεβάστε το συγκεκριμένο συνημμένο από PDF

Ακολουθήστε τις οδηγίες που καθορίζονται παρακάτω για να πραγματοποιήσετε λήψη συγκεκριμένων συνημμένων από το έγγραφο PDF.

  • Πρώτον, πρέπει να δημιουργήσουμε μια παρουσία της κλάσης ApiClient ενώ παρέχουμε ως ορίσματα Client ID Client Secret.
  • Δεύτερον, δημιουργήστε ένα στιγμιότυπο κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα εισόδου.
  • Τώρα καλέστε τη μέθοδο GetDownloadDocumentAttachmentByIndex(…) για να πραγματοποιήσετε λήψη του συνημμένου από το αρχείο PDF.
def downloadAttachment():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # καλέστε το API για λήψη του πρώτου συνημμένου από το αρχείο PDF
        response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
        print(response)
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF Attachment successfully downloaded !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Διαβάστε τις πληροφορίες συνημμένου χρησιμοποιώντας την εντολή cURL

Τα REST API είναι εύκολα προσβάσιμα μέσω εντολών cURL και μπορούμε να χρησιμοποιήσουμε μια απλή εφαρμογή τερματικού για να τα εκτελέσουμε. Δεδομένου ότι το Aspose.PDF Cloud έχει αναπτυχθεί σύμφωνα με την αρχιτεκτονική REST, μπορούμε επίσης να έχουμε πρόσβαση σε αυτά μέσω εντολών cURL. Ωστόσο, ως προαπαιτούμενο, πρέπει να δημιουργήσουμε ένα JSON Web Token (JWT) με βάση τα μεμονωμένα διαπιστευτήρια πελάτη που καθορίζονται στον πίνακα ελέγχου Aspose.Cloud. Είναι υποχρεωτικό επειδή τα API μας είναι προσβάσιμα μόνο σε εγγεγραμμένους χρήστες. Εκτελέστε την ακόλουθη εντολή για να δημιουργήσετε το διακριτικό JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Τώρα που έχουμε το διακριτικό JWT, μπορούμε να εκτελέσουμε την ακόλουθη εντολή για να ανακτήσουμε 7 πληροφορίες για συγκεκριμένα συνημμένα από έγγραφα PDF.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Λήψη συγκεκριμένου συνημμένου χρησιμοποιώντας την εντολή cURL

Εκτελέστε την ακόλουθη εντολή για να κάνετε λήψη του 2ου συνημμένου του αρχείου PDF και να το αποθηκεύσετε στην τοπική μονάδα δίσκου.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o Attachment.txt

Σύναψη

Αυτό το άρθρο εξηγεί τις λεπτομέρειες και τα βήματα σχετικά με τον τρόπο ανάγνωσης και λήψης συνημμένων από έγγραφα PDF. Εξερευνήσαμε τα βήματα χρησιμοποιώντας αποσπάσματα κώδικα Python καθώς και χρησιμοποιώντας τις εντολές cURL. Εκτός από την επεξεργασία συνημμένων, το API παρέχει επίσης μια πληθώρα λειτουργιών που σχετίζονται με άλλα στοιχεία αρχείων PDF και οι λεπτομέρειες τους βρίσκονται στον Οδηγό προγραμματιστή. Επιπλέον, ο πλήρης πηγαίος κώδικας του Aspose.PDF Cloud SDK για Python έχει γίνει διαθέσιμος για λήψη μέσω GitHub. Σε περίπτωση που αντιμετωπίσετε προβλήματα κατά τη χρήση του API ή έχετε περαιτέρω απορίες, μη διστάσετε να επικοινωνήσετε μαζί μας μέσω του Δωρεάν φόρουμ υποστήριξης προϊόντων.

Σχετικά Άρθρα

Συνιστούμε επίσης να επισκεφθείτε τους παρακάτω συνδέσμους για να μάθετε περισσότερα σχετικά με: