Μια γρήγορη και εύκολη προσέγγιση για την εξαγωγή σελίδων από έγγραφα του Word χρησιμοποιώντας το Python SDK.

έγγραφο split word

έγγραφο split word | Εξαγωγή σελίδων από το έγγραφο του Word ως ξεχωριστό αρχείο

Στον τομέα της διαχείρισης εγγράφων, συχνά προκύπτει η ανάγκη διαίρεσης, διαχωρισμού ή εξαγωγής συγκεκριμένων τμημάτων από ένα έγγραφο του Word. Είτε έχετε να κάνετε με εκτεταμένες ερευνητικές εργασίες, περιεκτικές αναφορές ή μακροσκελή χειρόγραφα, η εργασία ανάλυσής τους σε πιο διαχειρίσιμα μέρη μπορεί να είναι χρονοβόρα και προκλητική. Σε αυτό το άρθρο, θα διερευνήσουμε τα βήματα για την επίτευξη αυτής της απαίτησης με το Python Cloud SDK, επιτρέποντάς σας να βελτιστοποιήσετε τις εργασίες διαχείρισης εγγράφων σας και να εργάζεστε πιο αποτελεσματικά.

API επεξεργασίας κειμένου

Το Aspose.Words Cloud είναι η αποκλειστική μας λύση για επεξεργασία MS Word (DOCX, DOC, DOT, RTF, DOCM) ή OpenDocument (ODT, OTT).Δεν απαιτείται λογισμικό τρίτων κατασκευαστών ή αυτοματισμός MS Office για την επεξεργασία εγγράφων του Word. Απλώς καλέστε τα REST API για να εκπληρώσετε τις απαιτήσεις σας. Δεδομένου ότι τα API βασίζονται σε REST, επομένως μπορείτε να αποκτήσετε πρόσβαση σε αυτά σε οποιαδήποτε πλατφόρμα, όπως Desktop, Web, Mobile App, κ.λπ. Τώρα, σύμφωνα με το πεδίο εφαρμογής αυτού του άρθρου, θα συζητήσουμε τις λεπτομέρειες σχετικά με τον τρόπο διαχωρισμού σελίδων σε ένα αρχείο word ως μεμονωμένο έγγραφο του Word. Το API παρέχει επίσης την ευελιξία για την προσαρμογή της λειτουργίας διαχωρισμού, π.χ. Διαχωρισμός κάθε σελίδας, μονές και ζυγές, με βάση τον αριθμό των σελίδων, κατά εύρος σελίδων.

Για να διευκολύνουμε περαιτέρω τους πελάτες μας, δημιουργήσαμε το Aspose.Words Cloud SDK για Python, το οποίο είναι ένα περιτύλιγμα γύρω από το Cloud API, ώστε να μπορείτε να αξιοποιήσετε όλα τα πλεονεκτήματα της επεξεργασίας εγγράφων του Word στην αγαπημένη σας γλώσσα προγραμματισμού. Πριν προχωρήσετε, λοιπόν, το πρώτο βήμα είναι η εγκατάσταση του SDK στο τοπικό σύστημα. Είναι διαθέσιμο για λήψη στο PIP και στο GitHub. Εκτελέστε την ακόλουθη εντολή στο τερματικό της γραμμής εντολών για να εγκαταστήσετε το SDK:

pip install aspose-words-cloud

Σε περίπτωση που χρησιμοποιείτε το Visual Studio ως IDE, μπορείτε να προσθέσετε απευθείας την αναφορά του SDK στο έργο.

Κάντε κλικ στην επιλογή View ->Other Windows ->Python Environments. Όπως φαίνεται παρακάτω.

Επιλογή μενού Python Environment.

Εικόνα 1: - Επιλογή μενού Python Environment.

Εισαγάγετε aspose-word-cloud στο πεδίο Πακέτα στο παράθυρο Python Environments. Στη συνέχεια, κάντε κλικ στο σύνδεσμο Εγκατάσταση aspose-word-cloud (21.11.0).Ο αριθμός έκδοσης μπορεί να αλλάξει ανάλογα με την τελευταία/τρέχουσα έκδοση. Δείτε την παρακάτω εικόνα.

πακέτο aspose-words-cloud python

Εικόνα 2: - πακέτο aspose-words-cloud python.

Διαχωρίστε τις σελίδες στο έγγραφο του Word χρησιμοποιώντας Python

Ακολουθήστε τις παρακάτω οδηγίες για να χωρίσετε όλες τις σελίδες σε ένα έγγραφο word που είναι ήδη διαθέσιμο στο cloud storage.

  • Πρώτον, πρέπει να αρχικοποιήσουμε ένα αντικείμενο του WordsApi ενώ μεταβιβάζουμε το Client ID και το Client Secret ως ορίσματα.
  • Δεύτερον, καθορίστε το όνομα του αρχείου εισόδου του Word, τη μορφή εξόδου που προκύπτει, το όνομα του αρχείου που προκύπτει και την παράμετρο για να αρχειοθετήσετε το αποτέλεσμα συμπίεσης.
  • Μεταφορτώστε το έγγραφο εισόδου του Word στο χώρο αποθήκευσης cloud χρησιμοποιώντας το αντικείμενο UploadFileRequest.
  • Τώρα δημιουργήστε ένα στιγμιότυπο του SplitDocumentRequest μεταβιβάζοντας τις λεπτομέρειες που ορίζονται στο δεύτερο βήμα.
  • Τέλος, καλέστε τη μέθοδο splitdocument(…) της κλάσης WordsApi για να χωρίσετε έγγραφα word. Τα αρχεία που προκύπτουν αποθηκεύονται σε αντιστοιχισμένο χώρο αποθήκευσης cloud.
try:
        # δημιουργήστε μια παρουσία του WordsApi
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # Όνομα εγγράφου word εισαγωγής
        inputFileName = 'source.doc'
        # προκύπτουσα μορφή αρχείου
        resultantFormat = 'DOCX'
        # Όνομα του εγγράφου που προκύπτει μετά την επέμβαση. Εάν παραληφθεί αυτή η παράμετρος
        # τότε το προκύπτον αρχείο θα αποθηκευτεί με το όνομα του εγγράφου εισόδου
        resultantFile = 'Split-File'
        # Η σημαία που υποδεικνύει εάν θα γίνει ZIP στην έξοδο.
        zipOutput = 'false'

        # Μεταφορτώστε το έγγραφο προέλευσης του Word στο Cloud Storage
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # Δημιουργήστε ένα αντικείμενο στο Split Document
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,None, None, zipOutput, None)
        # εκκινήστε τη λειτουργία διαχωρισμού του Word
        result = words_api.split_document(request)
        
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
Προεπισκόπηση της λειτουργίας Document Split

Εικόνα 3: - Προεπισκόπηση της λειτουργίας διαχωρισμού εγγράφων.

Διαχωρισμός εγγράφου βάσει επιλεγμένων σελίδων

Σε αυτήν την ενότητα, θα συζητήσουμε τις λεπτομέρειες σχετικά με τον τρόπο διαχωρισμού ενός εγγράφου με βάση επιλεγμένες σελίδες και αποθήκευσης του αποτελέσματος ως αρχείο ZIP. Το απόσπασμα κώδικα είναι σχεδόν το ίδιο με το κοινόχρηστο παραπάνω, εκτός από το ότι πρέπει να καθορίσουμε τις τιμές Σελίδα Από, Σελίδα Προ και Αληθινή για την έξοδο που θα αρχειοθετηθεί.

try:
        # δημιουργήστε μια παρουσία του WordsApi
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # Όνομα εγγράφου word εισαγωγής
        inputFileName = 'source.doc'
        # προκύπτουσα μορφή αρχείου
        resultantFormat = 'DOCX'
        # Όνομα του εγγράφου που προκύπτει μετά την επέμβαση. Εάν παραληφθεί αυτή η παράμετρος
        # τότε το προκύπτον αρχείο θα αποθηκευτεί με το όνομα του εγγράφου εισόδου
        resultantFile = 'SplitOutput'
        # Η σημαία που δείχνει την έξοδο θα βρίσκεται στο αρχείο ZIP.
        zipOutput = 'false'

        # Μεταφορτώστε το έγγραφο προέλευσης του Word στο Cloud Storage
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # Δημιουργήστε ένα αντικείμενο στο Split Document
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,pageFrom, pageTo, zipOutput, None)
        # εκκινήστε τη λειτουργία διαχωρισμού του Word
        result = words_api.split_document(request)
        
        # εκτύπωση μηνύματος στην κονσόλα (προαιρετικό)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
Έξοδος διαχωρισμού εγγράφων

Εικόνα 4: - Προεπισκόπηση της λειτουργίας διαχωρισμού εγγράφων για επιλεγμένες σελίδες.

Εξαγωγή σελίδων από το έγγραφο του Word χρησιμοποιώντας εντολές cURL

Όπως και άλλα REST API, το Aspose.Words Cloud μπορεί επίσης να προσπελαστεί μέσω εντολών cURL στο τερματικό της γραμμής εντολών. Ωστόσο, πριν προχωρήσουμε περαιτέρω, πρέπει πρώτα να δημιουργήσουμε ένα διακριτικό πρόσβασης JWT με βάση τα διαπιστευτήρια πελάτη.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Μόλις δημιουργηθεί το διακριτικό, εκτελέστε την ακόλουθη εντολή για να εξαγάγετε σελίδες από το έγγραφο του Word και να αποθηκεύσετε την έξοδο στο χώρο αποθήκευσης Cloud.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>"

Σύναψη

Σε αυτό το άρθρο, διερευνήσαμε τη δυνατότητα δημιουργίας ενός διαχωριστή εγγράφων που μπορεί να χωρίσει το έγγραφο του Word σε μεμονωμένα αρχεία σελίδας χρησιμοποιώντας το Python SDK. Επιπλέον, σύμφωνα με τις απαιτήσεις σας, μπορείτε να χρησιμοποιήσετε το Python SDK ή να εξαγάγετε σελίδες από το έγγραφο του Word χρησιμοποιώντας εντολές cURL. Σημειώστε ότι πιστεύουμε στη συλλογική ανάπτυξη και συνεργασία. Επομένως, τα SDK μας αναπτύσσονται σύμφωνα με την άδεια MIT και ο πλήρης πηγαίος κώδικας τους είναι διαθέσιμος για λήψη μέσω Github. Εάν χρειάζεστε, μπορείτε να κάνετε λήψη και να τροποποιήσετε τον κωδικό σύμφωνα με τις απαιτήσεις σας. Σε περίπτωση που αντιμετωπίσετε προβλήματα ή έχετε περαιτέρω απορίες, μη διστάσετε να επικοινωνήσετε μαζί μας μέσω του Δωρεάν φόρουμ υποστήριξης προϊόντων.

Σχετικά Άρθρα

Σας συνιστούμε να επισκεφθείτε τους παρακάτω συνδέσμους για να μάθετε περισσότερα σχετικά με: