Gyors és egyszerű megközelítés a Word dokumentumokból oldalak kinyerésére Python SDK használatával.

osztott szódokumentum

osztott szódokumentum | Bontsa ki az oldalakat a Word-dokumentumból külön fájlként

A dokumentumkezelés területén gyakran felmerül az igény egy Word-dokumentum meghatározott szakaszainak felosztására, szétválasztására vagy kivonására. Legyen szó kiterjedt kutatási cikkekről, átfogó jelentésekről vagy hosszadalmas kéziratokról, ezek könnyebben kezelhető részekre bontása időigényes és kihívást is jelenthet. Ebben a cikkben megvizsgáljuk a Python Cloud SDK-val e követelmény teljesítésének lépéseit, amely lehetővé teszi a dokumentumkezelési feladatok egyszerűsítését és a hatékonyabb munkavégzést.

Szövegszerkesztő API

Az Aspose.Words Cloud az MS Word (DOCX, DOC, DOT, RTF, DOCM) vagy az OpenDocument (ODT, OTT) feldolgozáshoz dedikált megoldásunk. A Word dokumentumok feldolgozásához nem szükséges harmadik féltől származó szoftver vagy MS Office automatizálás. Egyszerűen hívja a REST API-kat a követelmények teljesítéséhez. Mivel az API-k REST-alapúak, így bármilyen platformon elérheti őket, beleértve az asztali számítógépet, a webet, a mobilalkalmazást stb.. Most ennek a cikknek a keretein belül megvitatjuk a Word-fájlban lévő oldalak különálló Word-dokumentumként történő felosztásának részleteit. Az API rugalmasságot biztosít a felosztási művelet testreszabásához is, azaz minden oldal felosztása, páratlan és páratlan oldalak száma szerint, oldaltartomány szerint.

Ügyfeleink további megkönnyítése érdekében létrehoztuk az Aspose.Words Cloud SDK for Python-t, amely a Cloud API köré épül, így a Word dokumentumfeldolgozás minden előnyét kihasználhatja kedvenc programozási nyelvén. Tehát mielőtt továbblépne, az első lépés az SDK telepítése a helyi rendszerre. Letölthető a PIP és a GitHub oldalakon. Az SDK telepítéséhez hajtsa végre a következő parancsot a parancssori terminálon:

pip install aspose-words-cloud

Abban az esetben, ha a Visual Studio-t IDE-ként használja, közvetlenül hozzáadhatja az SDK hivatkozását a projekthez.

Kattintson a Nézet ->Egyéb Windows ->Python környezetek lehetőségre. Az alábbiak szerint.

Python Environment menüopció.

  1. kép: - Python Environment menüopció.

Írja be az aspose-word-cloud értéket a Csomagok mezőbe a Python Environments ablakban. Ezután kattintson az aspose-word-cloud (21.11.0) telepítése hivatkozásra. A verziószám a legújabb/aktuális kiadástól függően változhat. Lásd az alábbi képet.

aspose-words-cloud python csomag

  1. kép: - aspose-words-cloud python csomag.

Oldalak felosztása a Word dokumentumban Python segítségével

Kövesse az alábbi utasításokat a felhőtárhelyen már elérhető Word-dokumentum összes oldalának felosztásához.

  • Először is inicializálnunk kell egy WordsApi objektumot, miközben argumentumként adjuk át az ügyfélazonosítót és az ügyféltitkot.
  • Másodszor, adja meg a bemeneti Word fájl nevét, az eredő kimeneti formátumot, az eredő fájl nevét és a kimenet zip archiválásához szükséges paramétert.
  • Töltse fel a bemeneti Word-dokumentumot a felhőtárhelyre az UploadFileRequest objektum használatával.
  • Most hozza létre a SplitDocumentRequest példányát, miközben átadja a második lépésben meghatározott részleteket.
  • Végül hívja meg a WordsApi osztály splitdocument(…) metódusát a Word dokumentumok felosztásához. Az eredményül kapott fájlokat a rendszer a feltérképezett felhőtárolóba menti.
try:
        # hozzon létre egy WordsApi példányt
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # A bemeneti Word dokumentum neve
        inputFileName = 'source.doc'
        # eredő fájlformátum
        resultantFormat = 'DOCX'
        # Az eredményül kapott dokumentum neve a művelet után. Ha ezt a paramétert kihagyjuk
        # majd az eredményül kapott fájl a bemeneti dokumentum nevével kerül mentésre
        resultantFile = 'Split-File'
        # A zászló, amely jelzi, hogy ZIP-e kell-e a kimenetet.
        zipOutput = 'false'

        # Töltse fel a Word forrásdokumentumot a Cloud Storage szolgáltatásba
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # Hozzon létre egy objektumot a felosztott dokumentumhoz
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,None, None, zipOutput, None)
        # indítsa el a Word Split műveletet
        result = words_api.split_document(request)
        
        # üzenet nyomtatása a konzolon (opcionális)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
A dokumentumfelosztási művelet előnézete

  1. kép: – A dokumentumfelosztási művelet előnézete.

Dokumentum felosztása a kiválasztott oldalak alapján

Ebben a részben a dokumentum kiválasztott oldalak alapján történő felosztásának és a kimenet ZIP-archívumként való mentésének részleteiről fogunk beszélni. A kódrészlet majdnem megegyezik a fent megosztott kóddal, azzal a különbséggel, hogy meg kell adnunk az Oldaltól, az Oldalig és a True értéket az archiválandó kimenethez.

try:
        # hozzon létre egy WordsApi példányt
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # A bemeneti Word dokumentum neve
        inputFileName = 'source.doc'
        # eredő fájlformátum
        resultantFormat = 'DOCX'
        # Az eredményül kapott dokumentum neve a művelet után. Ha ezt a paramétert kihagyjuk
        # majd az eredményül kapott fájl a bemeneti dokumentum nevével kerül mentésre
        resultantFile = 'SplitOutput'
        # A kimenetet jelző zászlónak ZIP-archívumban kell lennie.
        zipOutput = 'false'

        # Töltse fel a Word forrásdokumentumot a Cloud Storage szolgáltatásba
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # Hozzon létre egy objektumot a felosztott dokumentumhoz
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,pageFrom, pageTo, zipOutput, None)
        # indítsa el a Word Split műveletet
        result = words_api.split_document(request)
        
        # üzenet nyomtatása a konzolon (opcionális)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
Dokumentum megosztott kimenet

  1. kép: – A kiválasztott oldalak dokumentumfelosztási műveletének előnézete.

Kivonja az oldalakat a Word-dokumentumból a cURL-parancsok segítségével

Más REST API-khoz hasonlóan az Aspose.Words Cloud is elérhető cURL-parancsokkal a parancssori terminálon belül. Mielőtt azonban továbblépnénk, először létre kell hoznunk egy JWT hozzáférési tokent az ügyfél hitelesítő adatai alapján.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

A token létrehozása után hajtsa végre a következő parancsot az oldalak kinyeréséhez a Word dokumentumból, és mentse a kimenetet a Cloud Storage-ba.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>"

Következtetés

Ebben a cikkben megvizsgáltuk egy dokumentumelosztó létrehozásának lehetőségét, amely a Python SDK használatával a Word-dokumentumot egyedi oldalfájlokra bonthatja. Ezenkívül az Ön igényei szerint használhatja a Python SDK-t, vagy cURL-parancsok segítségével kibonthatja az oldalakat a Word-dokumentumból. Felhívjuk figyelmét, hogy hiszünk a kollektív növekedésben és az együttműködésben. Ezért SDK-jainkat az MIT-licenc szerint fejlesztjük, és teljes forráskódjuk letölthető Githubon. Ha szüksége van rá, letöltheti és módosíthatja a kódot igényei szerint. Ha bármilyen problémába ütközik, vagy további kérdései vannak, forduljon hozzánk bizalommal az Ingyenes terméktámogatási fórumon.

Kapcsolódó cikkek

Javasoljuk, hogy látogassa meg az alábbi linkeket, ha többet szeretne megtudni erről: