Οι φόρμες PDF είναι μεταξύ των διάσημων τύπων αρχείων όπου μπορείτε να εισαγάγετε πληροφορίες, να επιλέξετε στοιχεία από αναπτυσσόμενα πλαίσια και επίσης να ελέγξετε τα πεδία όπως απαιτείται. Το PDF υποστηρίζει επί του παρόντος δύο διαφορετικές μεθόδους για την ενοποίηση δεδομένων και φορμών PDF, π.χ. φόρμες AcroForms (γνωστές και ως φόρμες Acrobat) και XML Forms Architecture (XFA).Για να συμπληρώσετε τις φόρμες, μπορείτε είτε να συμπληρώσετε τη φόρμα ηλεκτρονικά είτε να αποθηκεύσετε ένα αντίγραφο της φόρμας στον υπολογιστή σας και να χρησιμοποιήσετε το Adobe Acrobat Reader για να συμπληρώσετε τη φόρμα. Μόλις συμπληρωθεί η φόρμα, θα σας ενδιαφέρει να χρησιμοποιήσετε τα δεδομένα που συμπληρώνονται μέσα στα έγγραφα και για το σκοπό αυτό, ίσως χρειαστεί να τα εξαγάγετε σε μορφές XML, FDF και XFDF. Σε αυτό το άρθρο, θα συζητήσουμε τις λεπτομέρειες σχετικά με το πώς μπορούμε να εξάγουμε μέσω προγραμματισμού PDF σε XML χρησιμοποιώντας Python καθώς και άλλες υποστηριζόμενες μορφές.

API επεξεργασίας PDF

Το Aspose.PDF Cloud είναι ένα βραβευμένο REST API που προσφέρει τις δυνατότητες δημιουργίας, επεξεργασίας και μετατροπής διαφόρων μορφών αρχείων σε μορφή PDF. Ταυτόχρονα, υποστηρίζει επίσης τη δυνατότητα εξαγωγής αρχείων PDF σε XLSX, PPTX, DOCX, EPUB, HTML, κ.λπ., και σε διάφορες άλλες μορφές υποστήριξης.

Σας δίνει επίσης τη δυνατότητα να εργαστείτε με φόρμες PDF όπου μπορείτε:

Δεδομένου ότι το API βασίζεται σε REST, επομένως μπορεί να προσπελαστεί σε οποιαδήποτε πλατφόρμα και σε οποιαδήποτε εφαρμογή, π.χ. Επιτραπέζιος υπολογιστής, Κινητό, Ιστός, Υβριδικό κ.λπ. Τώρα για να διευκολύνουμε περαιτέρω τους χρήστες μας, δημιουργήσαμε SDK ειδικά για τη γλώσσα προγραμματισμού, ώστε να έχετε όλες τις δυνατότητες επεξεργασίας PDF στη γλώσσα της επιλογής σας.

Τώρα, προκειμένου να υλοποιήσουμε τις δυνατότητες επεξεργασίας PDF στην εφαρμογή Python, δημιουργήσαμε το Aspose.PDF Cloud SDK για Python που είναι ένα περιτύλιγμα γύρω από το Aspose.PDF Cloud. Επομένως, όταν χρησιμοποιείτε αυτό το SDK, έχετε όλες τις δυνατότητες επεξεργασίας PDF στην εφαρμογή Python. Τώρα για να ξεκινήσετε με αυτό το SDK, το πρώτο βήμα είναι η εγκατάστασή του. Το SDK είναι διαθέσιμο για δωρεάν λήψη μέσω του αποθετηρίου PIP και GitHub. Απλώς εκτελέστε την ακόλουθη εντολή στο τερματικό/γραμμή εντολών για να εγκαταστήσετε την πιο πρόσφατη έκδοση του SDK στο σύστημα.

pip install asposepdfcloud

Δωρεάν λογαριασμός Cloud Dashboard

Το επόμενο σημαντικό βήμα είναι μια δωρεάν συνδρομή στις υπηρεσίες cloud μας μέσω του Aspose.Cloud dashboard. Ο σκοπός αυτής της συνδρομής είναι να επιτρέπεται μόνο σε εξουσιοδοτημένα άτομα να έχουν πρόσβαση στις υπηρεσίες επεξεργασίας αρχείων μας. Εάν έχετε λογαριασμό GitHub ή Google, απλώς Εγγραφείτε ή κάντε κλικ στο κουμπί Δημιουργία νέου λογαριασμού και δώστε τις απαιτούμενες πληροφορίες. Τώρα συνδεθείτε στον πίνακα εργαλείων χρησιμοποιώντας διαπιστευτήρια και αναπτύξτε την ενότητα Εφαρμογές από τον πίνακα εργαλείων και μετακινηθείτε προς τα κάτω προς την ενότητα Διαπιστευτήρια πελάτη για να δείτε στοιχεία Client ID και Client Secret.

Διαπιστευτήρια πελάτη

Εικόνα 1:- Διαπιστευτήρια πελάτη στο Aspose.Cloud Dashboard.

Εξαγωγή PDF σε XML χρησιμοποιώντας Python

Ακολουθήστε τις οδηγίες που καθορίζονται παρακάτω για να εξαγάγετε PDF σε XML χρησιμοποιώντας Python. Έχουμε παράσχει δύο API για την εκπλήρωση αυτής της απαίτησης

| API | Τύπος | URL | Περιγραφή |

| ——————- | —– | —– | ———— |

| /pdf/{name}/export/xml | ΠΑΡΕ | GetExportFieldsFromPdfToXmlInStorage | Εξαγωγή πεδίων από αρχείο PDF σε αποθήκευση σε αρχείο XML. |

| /pdf/{name}/export/xml | ΒΑΛΤΕ | PutExportFieldsFromPdfToXmlInStorage | Εξαγωγή πεδίων από το PDF στον αποθηκευτικό χώρο σε ένα αρχείο XML στον αποθηκευτικό χώρο. |

  • Πρώτον, δημιουργήστε μια παρουσία της κλάσης ApiClient ενώ παρέχετε ως ορίσματα Client ID Client Secret.
  • Δεύτερον, δημιουργήστε ένα στιγμιότυπο κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα εισόδου.
  • Τώρα καλέστε τη μέθοδο putexportfieldsfrompdftoxmlinstorage(..) για να εξαγάγετε δεδομένα φόρμας PDF σε XML και να αποθηκεύσετε το αρχείο που προκύπτει στο χώρο αποθήκευσης Cloud.
def exportPDFtoXML():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        # πηγή αρχείου PDF
        input_file = 'FormData-Filled.pdf'

        # όνομα XML που προκύπτει
        outputXML = 'exportedData.xml'
        
        # Εξαγωγή δεδομένων φόρμας PDF σε XML και αποθήκευση εξόδου στο χώρο αποθήκευσης Cloud
        response = pdf_api.put_export_fields_from_pdf_to_xml_in_storage(name = input_file, xml_output_file_path=outputXML)
        
        # απόκριση εκτύπωσης στην κονσόλα
        print(response)
        
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF Form data successfully exported to XML !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
Προεπισκόπηση εξαγωγής PDF σε XML

Εικόνα 2: - Εξάγονται δεδομένα PDF ως XML.

Εξαγωγή PDF σε FDF χρησιμοποιώντας Python

Ακολουθήστε τις παρακάτω οδηγίες για να εξαγάγετε δεδομένα φόρμας PDF σε μορφή FDF και να αποθηκεύσετε την έξοδο στο χώρο αποθήκευσης Cloud.

  • Δημιουργήστε μια παρουσία της κλάσης ApiClient ενώ παρέχετε ως ορίσματα Client ID Client Secret.
  • Τώρα δημιουργήστε ένα στιγμιότυπο της κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα εισόδου.
  • Τέλος, καλέστε τη μέθοδο putexportfieldsfrompdftofdfinstorage(..) για να εξαγάγετε δεδομένα φόρμας PDF στο FDF και να αποθηκεύσετε το προκύπτον αρχείο στο χώρο αποθήκευσης Cloud.
def exportPDFtoFDF():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        # πηγή αρχείου PDF
        input_file = 'FormData-Filled.pdf'

        # προκύπτον όνομα FDF
        outputFDF = 'exportedData.fdf'
        
        # Εξαγωγή δεδομένων φόρμας PDF σε FDF και αποθήκευση εξόδου στο χώρο αποθήκευσης Cloud
        response = pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(name = input_file, fdf_output_file_path=outputFDF)
        
        # απόκριση εκτύπωσης στην κονσόλα
        print(response)
        
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF Form data successfully exported to FDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Επισκεφτείτε τους παρακάτω συνδέσμους για λήψη της πηγής FormData-Filled.pdf και της εξαγωγής exportedData.fdf.

Εξαγωγή PDF σε XFDF χρησιμοποιώντας Python

Το αρχείο XFDF είναι ένα αρχείο εγγράφου Acrobat Forms που αποθηκεύει πληροφορίες που μπορούν να χρησιμοποιηθούν από ένα αρχείο PDF, επομένως το αρχείο XFDF εισάγει αυτά τα δεδομένα απευθείας στο PDF. Επομένως, ενδέχεται να απαιτείται η εξαγωγή δεδομένων από μία φόρμα PDF και η συμπλήρωση άλλων φορμών PDF. Έτσι, σε αυτήν την ενότητα, θα συζητήσουμε τα βήματα για τον τρόπο εξαγωγής δεδομένων φόρμας PDF σε μορφή XFDF.

  • Δημιουργήστε μια παρουσία της κλάσης ApiClient ενώ παρέχετε ως ορίσματα Client ID Client Secret.
  • Τώρα δημιουργήστε ένα στιγμιότυπο της κλάσης PdfApi που λαμβάνει το αντικείμενο ApiClient ως όρισμα εισόδου.
  • Τέλος, καλέστε τη μέθοδο putexportfieldsfrompdftoxfdfinstorage(..) για να εξαγάγετε δεδομένα φόρμας PDF στο XFDF και να αποθηκεύσετε το αρχείο που προκύπτει στο χώρο αποθήκευσης Cloud.
def exportPDFtoXFDF():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # δημιουργήστε την παρουσία PdfApi ενώ μεταβιβάζετε το PdfApiClient ως όρισμα
        pdf_api = PdfApi(pdf_api_client)

        # πηγή αρχείου PDF
        input_file = 'FormData-Filled.pdf'

        # προκύπτον όνομα XFDF
        outputXFDF = 'exportedData.xfdf'
        
        # Εξάγετε δεδομένα φόρμας PDF σε XFDF και αποθηκεύστε την έξοδο στο χώρο αποθήκευσης Cloud
        response = pdf_api.put_export_fields_from_pdf_to_xfdf_in_storage(name = input_file, xml_output_file_path=outputXFDF)
        
        # απόκριση εκτύπωσης στην κονσόλα
        print(response)
        
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('PDF Form data successfully exported to XFDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Το δείγμα εξόδου που δημιουργείται στον παραπάνω κώδικα μπορεί να ληφθεί από το exportedData.xfdf.

Εξαγωγή PDF σε XFDF

Εικόνα 3: - Εξάγονται δεδομένα PDF σε XFDF

PDF σε XML χρησιμοποιώντας εντολές cURL

Τα API REST μπορούν επίσης να προσπελαστούν μέσω εντολών cURL και μπορούν να προσπελαστούν χρησιμοποιώντας την εφαρμογή τερματικού σε οποιαδήποτε πλατφόρμα. Δεδομένου ότι το Aspose.PDF Cloud έχει αναπτυχθεί σύμφωνα με την αρχιτεκτονική REST, επομένως μπορεί να προσπελαστεί και μέσω της εντολής cURL. Ωστόσο, προτού εκτελέσουμε οποιαδήποτε λειτουργία, πρέπει να δημιουργήσουμε ένα JSON Web Token (JWT) με βάση τα μεμονωμένα διαπιστευτήρια πελάτη που καθορίζονται στον πίνακα εργαλείων Aspose.Cloud. Είναι υποχρεωτικό επειδή τα API μας είναι προσβάσιμα μόνο σε εγγεγραμμένους χρήστες. Εκτελέστε την ακόλουθη εντολή για να δημιουργήσετε το διακριτικό JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Μόλις δημιουργηθεί το διακριτικό JWT, εκτελέστε την ακόλουθη εντολή για να εξαγάγετε δεδομένα φόρμας PDF σε μορφή XML.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/FormData-Filled.pdf/export/xml?xmlOutputFilePath=FormDataExported.xml" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-d{}

Σύναψη

Σε αυτό το άρθρο, εξερευνήσαμε τις λεπτομέρειες και τα βήματα σχετικά με τον τρόπο εξαγωγής δεδομένων φόρμας PDF σε μορφές XML, FDF και XFDF. Αυτές οι απαιτήσεις μπορούν να επιτευχθούν χρησιμοποιώντας αποσπάσματα κώδικα Python καθώς και χρησιμοποιώντας τις εντολές cURL. Συνιστούμε επίσης να εξερευνήσετε τον Οδηγό προγραμματιστών για να μάθετε για άλλες συναρπαστικές λειτουργίες που προσφέρονται από το API. Επιπλέον, ο πλήρης πηγαίος κώδικας του Aspose.PDF Cloud SDK για Python έχει γίνει διαθέσιμος για λήψη μέσω GitHub. Σε περίπτωση που αντιμετωπίσετε προβλήματα κατά τη χρήση του API ή έχετε περαιτέρω απορίες, μη διστάσετε να επικοινωνήσετε μαζί μας μέσω του Δωρεάν φόρουμ υποστήριξης προϊόντων.

Σχετικά Άρθρα

Συνιστούμε επίσης να επισκεφθείτε τους παρακάτω συνδέσμους για να μάθετε περισσότερα σχετικά με: