PDF mellékletek kibontása

A PDF fájl szövegből és grafikából áll, és mellékletként teljes fájlokat tartalmazhat. Ez megkönnyíti és megbízhatóbbá teszi a dokumentumkészletek cseréjét. A Mellékletek ablaktábla központi helyet biztosít a mellékletek megtekintéséhez, beszúrásához, törléséhez és exportálásához. Kérjük, vegye figyelembe, hogy ha áthelyezi a PDF-fájlt egy új helyre, a benne lévő mellékletek is elköltöznek vele. A mellékletek tartalmazhatnak hivatkozásokat a szülődokumentumra, illetve más mellékletekre. Kérjük, ne keverje össze a mellékelt megjegyzéseket a fájlmellékletekkel.

Ebben a cikkben megvitatjuk annak részleteit, hogyan olvashatjuk el a mellékletekkel kapcsolatos információkat PDF dokumentumokban, valamint hogyan tölthetünk le mellékleteket PDF-ből Python segítségével. Nincs szükség különösebb szoftverletöltésre és -telepítésre, és az összes szükséges műveletet a felhőben hajthatja végre.

PDF feldolgozó API

Az Aspose.PDF Cloud a REST-alapú API-nk, amely lehetőséget kínál különféle formátumok létrehozására, szerkesztésére és PDF formátumba való átalakítására, valamint PDF-fájlok megjelenítésére olyan formátumokba, mint például XLSX, PPTX, DOCX, EPUB, HTML, JPEG stb. A REST architektúrának köszönhetően az API bármilyen platformon elérhető. Ezért PDF-feldolgozási képességeket implementálhat asztali, webes, mobil-, felhő- és hibrid alkalmazásokban.

Python SDK PDF-feldolgozáshoz

Ügyfeleink további megkönnyítése érdekében speciális programozási SDK-kat hoztunk létre, így Ön az összes PDF-feldolgozási képességet az Ön által választott nyelven használhatja. Hasonlóképpen, a Python-fejlesztők megkönnyítése érdekében létrehoztunk egy Python programozási SDK-t Aspose.PDF Cloud SDK for Python néven, amely az Aspose.PDF Cloud API köré épül fel. A kezdéshez az első lépés a telepítés. Az SDK ingyenesen letölthető PIP és GitHub tárhelyen keresztül. Most hajtsa végre a következő parancsot a terminálban/parancssorban, hogy telepítse az SDK legújabb verzióját a rendszerre.

pip install asposepdfcloud

PyCharm IDE

Ha PyCharm IDE-t használ, közvetlenül hozzáadhatja az SDK-t függőségként a projekthez.

Fájl ->Beállítások ->Projekt ->Python Interpreter ->asposepdfcloud

felirat

Image 1:- PyCharm settings option.

Aspose.PDF Python csomag

  1. kép: - Aspose.Pdf Cloud Python csomag.

Ingyenes Cloud Dashboard-fiók

A telepítés után a következő nagy lépés egy ingyenes előfizetés felhőszolgáltatásainkra az Aspose.Cloud dashboard oldalon. Ennek az előfizetésnek az a célja, hogy csak arra jogosult személyek férhessenek hozzá fájlfeldolgozó szolgáltatásainkhoz. Ha rendelkezik GitHub- vagy Google-fiókkal, egyszerűen regisztráljon, vagy kattintson az Új fiók létrehozása gombra, és adja meg a szükséges információkat. Most jelentkezzen be az irányítópultra a hitelesítési adatokkal, és bontsa ki az Alkalmazások részt az irányítópulton, és görgessen lefelé az Ügyfél hitelesítő adatai szakasz felé, hogy megtekinthesse az ügyfél-azonosítót és az ügyféltitkot.

Ügyfél hitelesítő adatai

  1. kép: - Ügyfél hitelesítő adatai az Aspose.Cloud irányítópulton.

Olvassa el a mellékletekkel kapcsolatos információkat PDF-ből

Kérjük, kövesse az alábbi utasításokat a PDF dokumentumban található mellékletek információinak elolvasásához.

  • Először is létre kell hoznunk az ApiClient osztály példányát, miközben argumentumként a Client ID Client Secretet adjuk meg.
  • Másodszor, hozzon létre egy példányt a PdfApi osztályból, amely az ApiClient objektumot veszi be bemeneti argumentumként.
  • Most hívja meg a PdfApi getdocumentattachments(…) módszerét a PDF-melléklet részleteinek lekéréséhez.
def readAttachmentDetails():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # hozzon létre PdfApi példányt, miközben a PdfApiClient argumentumként adja át
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # hívja az API-t a melléklet részleteinek kinyeréséhez
        response = pdf_api.get_document_attachments(name = input_file)
        print(response)
        # üzenet nyomtatása a konzolon (opcionális)
        print('PDF Attachment details successfully retrieved !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Tájékoztatásul a fenti példában használt PDF-minta letölthető a PdfWithEmbeddedFiles.pdf webhelyről.

Olvassa el a specifikus mellékletadatokat

Az API azt is megkönnyíti, hogy elolvassuk a PDF dokumentum egyes mellékleteinek információit. Ebből a célból próbálja meg a GetDocumentAttachmentByIndex módszert használni. Tekintse meg alább az elsőként letöltött melléklet részleteit.

{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
                'creation_date': '11/24/2008 02:02:36.000 PM',
                'description': None,
                'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
                           'rel': 'self',
                           'title': None,
                           'type': None}],
                'mime_type': 'application/pdf',
                'modification_date': '05/03/2007 10:37:41.000 AM',
                'name': 'example1.pdf',
                'size': 10984},
 'code': 200,
 'status': 'OK'}

Konkrét melléklet letöltése PDF-ből

Kérjük, kövesse az alábbi utasításokat a PDF dokumentum egyes mellékleteinek letöltéséhez.

  • Először is létre kell hoznunk az ApiClient osztály példányát, miközben argumentumként a Client ID Client Secretet adjuk meg.
  • Másodszor, hozzon létre egy példányt a PdfApi osztályból, amely az ApiClient objektumot veszi be bemeneti argumentumként.
  • Most hívja a GetDownloadDocumentAttachmentByIndex(…) metódust a melléklet letöltéséhez PDF-fájlból.
def downloadAttachment():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # hozzon létre PdfApi példányt, miközben a PdfApiClient argumentumként adja át
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # hívja az API-t az első melléklet letöltéséhez PDF-fájlból
        response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
        print(response)
        # üzenet nyomtatása a konzolon (opcionális)
        print('PDF Attachment successfully downloaded !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Olvassa el a melléklet adatait a cURL paranccsal

A REST API-k könnyen elérhetők cURL parancsokkal, és egy egyszerű terminálalkalmazás segítségével végrehajthatjuk őket. Mivel az Aspose.PDF Cloud a REST architektúrának megfelelően lett kifejlesztve, a cURL parancsokon keresztül is elérhetjük őket. Előfeltételként azonban létre kell hoznunk egy JSON Web Tokent (JWT) az Aspose.Cloud irányítópulton megadott egyéni kliens hitelesítő adatai alapján. Kötelező, mert API-jaink csak regisztrált felhasználók számára érhetők el. Kérjük, hajtsa végre a következő parancsot a JWT token generálásához.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Most, hogy megvan a JWT token, végrehajthatjuk a következő parancsot, hogy lekérhessük a PDF-dokumentumok egyes mellékleteiről szóló információkat.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Töltse le az adott mellékletet a cURL paranccsal

Kérjük, hajtsa végre a következő parancsot a PDF-fájl 2. mellékletének letöltéséhez és a helyi meghajtóra való mentéséhez.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o Attachment.txt

Következtetés

Ez a cikk bemutatja a PDF-dokumentumok mellékleteinek olvasásának és letöltésének részleteit és lépéseit. A lépéseket Python kódrészletek és a cURL parancsok használatával vizsgáltuk. A mellékletek feldolgozásán kívül az API a PDF-fájlok egyéb elemeihez kapcsolódó funkciók tömkelegét is biztosítja, és ezek részletei a Fejlesztői útmutatóban találhatók. Ezenkívül a Pythonhoz készült Aspose.PDF Cloud SDK teljes forráskódja letölthető a GitHub-ről. Ha bármilyen problémába ütközik az API használata során, vagy további kérdései vannak, forduljon hozzánk bizalommal az Ingyenes terméktámogatási fórumon.

Kapcsolódó cikkek

Javasoljuk továbbá, hogy látogassa meg az alábbi linkeket, ha többet szeretne megtudni erről: