En hurtig og nem tilgang til at udtrække sider fra word-dokumenter ved hjælp af Python SDK.

split word-dokument | Uddrag Pages fra Word-dokument som en separat fil
Inden for dokumenthåndtering opstår der ofte behov for at opdele, adskille eller udtrække specifikke sektioner fra et Word-dokument. Uanset om du har at gøre med omfattende forskningsartikler, omfattende rapporter eller lange manuskripter, kan opgaven med at opdele dem i mere overskuelige dele være både tidskrævende og udfordrende. I denne artikel vil vi undersøge trinene til at opnå dette krav med Python Cloud SDK, så du kan strømline dine dokumenthåndteringsopgaver og arbejde mere effektivt.
- Tekstbehandling API
- Opdel sider i Word-dokument ved hjælp af Python
- Opdel dokument baseret på udvalgte sider
- Uddrag sider fra Word-dokument ved hjælp af cURL-kommandoer
Tekstbehandlings-API
Aspose.Words Cloud er vores dedikerede løsning til behandling af MS Word (DOCX, DOC, DOT, RTF, DOCM) eller OpenDocument (ODT, OTT).Ingen tredjepartssoftware eller MS Office-automatisering er nødvendig for at behandle Word-dokumenter. Du skal blot kalde REST API’erne for at opfylde dine krav. Da API’erne er REST-baserede, så du kan få adgang til dem på enhver platform, inklusive Desktop, Web, Mobile App, osv. Nu i henhold til denne artikels omfang vil vi diskutere detaljerne om, hvordan man opdeler sider i en word-fil som et individuelt word-dokument. API’en giver også fleksibiliteten til at tilpasse opdelingsoperationen, dvs. Opdel hver side, ulige og lige, efter antallet af sider, efter sideområde.
For yderligere at lette vores kunder har vi skabt Aspose.Words Cloud SDK for Python, som er en indpakning omkring Cloud API, så du kan tage alle fordelene ved Word-dokumentbehandling inden for dit foretrukne programmeringssprog. Så før du går videre, er det første trin installationen af SDK på det lokale system. Den er tilgængelig til download på PIP og GitHub. Udfør følgende kommando på kommandolinjeterminalen for at installere SDK’et:
pip install aspose-words-cloud
Hvis du bruger Visual Studio som IDE, kan du tilføje referencen til SDK direkte i projektet.
Klik på Vis ->Andre Windows ->indstillingen Python-miljøer. Som vist nedenfor.

Billede 1:- Python Environment menuvalg.
Indtast aspose-word-cloud under feltet Pakker i vinduet Python Environments. Klik derefter på linket Installer aspose-word-cloud (21.11.0).Versionsnummeret kan ændre sig afhængigt af den seneste/aktuelle udgivelsesversion. Se billedet nedenfor.

Billede 2:- aspose-words-cloud python-pakke.
Opdel sider i Word-dokument ved hjælp af Python
Følg venligst instruktionerne nedenfor for at opdele alle siderne i et word-dokument, der allerede er tilgængeligt i cloud storage.
- For det første skal vi initialisere et objekt af WordsApi, mens vi sender Client ID og Client Secret som argumenter.
- For det andet skal du angive navnet på input Word-filen, resulterende outputformat, navnet på den resulterende fil og parameter for at zip-arkivere outputtet.
- Upload input Word-dokument til skylager ved hjælp af UploadFileRequest-objekt.
- Opret nu en forekomst af SplitDocumentRequest, mens du videregiver detaljerne defineret i andet trin.
- Til sidst skal du kalde splitdocument(…)-metoden i WordsApi-klassen for at opdele word-dokumenter. De resulterende filer gemmes i kortlagt skylager.
try:
# oprette en forekomst af WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# Navn på input word-dokument
inputFileName = 'source.doc'
# resulterende filformat
resultantFormat = 'DOCX'
# Navn på resulterende dokument efter operationen. Hvis denne parameter udelades
# derefter vil den resulterende fil blive gemt med navnet på inputdokumentet
resultantFile = 'Split-File'
# Flaget, der angiver, om outputtet skal zippes.
zipOutput = 'false'
# Upload Word-kildedokument til Cloud Storage
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# Opret et objekt til at opdele dokument
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,None, None, zipOutput, None)
# starte Word Split-operation
result = words_api.split_document(request)
# udskriv besked i konsollen (valgfrit)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

Billede 3:- Forhåndsvisning af dokumentopdeling.
Opdel dokument baseret på udvalgte sider
I dette afsnit skal vi diskutere detaljerne om, hvordan man opdeler et dokument baseret på udvalgte sider og gemmer output som et ZIP-arkiv. Kodestykket er næsten det samme som delt ovenfor, bortset fra at vi skal angive værdien Page From, Page To og True for at output skal arkiveres.
try:
# oprette en forekomst af WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# Navn på input word-dokument
inputFileName = 'source.doc'
# resulterende filformat
resultantFormat = 'DOCX'
# Navn på resulterende dokument efter operationen. Hvis denne parameter udelades
# derefter vil den resulterende fil blive gemt med navnet på inputdokumentet
resultantFile = 'SplitOutput'
# Flaget, der angiver output, skal være i ZIP-arkiv.
zipOutput = 'false'
# Upload Word-kildedokument til Cloud Storage
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# Opret et objekt til at opdele dokument
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,pageFrom, pageTo, zipOutput, None)
# starte Word Split-operation
result = words_api.split_document(request)
# udskriv besked i konsollen (valgfrit)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

Billede 4:- Forhåndsvisning af dokumentopdeling for udvalgte sider.
Uddrag sider fra Word-dokument ved hjælp af cURL-kommandoer
Som andre REST API’er kan Aspose.Words Cloud også tilgås via cURL-kommandoer i kommandolinjeterminalen. Før vi går videre, skal vi dog først generere et JWT-adgangstoken baseret på klientlegitimationsoplysninger.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Når tokenet er blevet genereret, skal du udføre følgende kommando for at udtrække sider fra Word-dokumentet og gemme outputtet i Cloud-lageret.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>"
Konklusion
I denne artikel har vi undersøgt muligheden for at oprette en dokumentopdeler, der kan opdele Word-dokumenter i individuelle sidefiler ved hjælp af Python SDK. Desuden kan du i henhold til dine krav bruge Python SDK eller udtrække sider fra Word-dokument ved hjælp af cURL-kommandoer. Bemærk venligst, at vi tror på kollektiv vækst og samarbejde. Derfor er vores SDK’er udviklet i henhold til MIT-licensen, og deres komplette kildekode er tilgængelig til download over Github. Hvis du har brug for det, kan du downloade og ændre koden i henhold til dine krav. Hvis du støder på problemer, eller hvis du har yderligere spørgsmål, er du velkommen til at kontakte os via Free product support forum.
Relaterede artikler
Vi anbefaler, at du besøger følgende links for at lære mere om: