Витягніть PDF-додатки

Файл PDF складається з тексту та графіки та може містити цілі файли у вигляді вкладень. Це робить обмін пакетами документів простішим і надійнішим. Панель вкладень є центральним місцем для перегляду, вставлення, видалення та експорту вкладень. Також зауважте, що якщо ви перемістите PDF-файл у нове розташування, вкладені файли в ньому також перемістяться разом із ним. Вкладення можуть містити посилання на або з батьківського документа або на інші вкладення. Будь ласка, не плутайте вкладені коментарі з вкладеними файлами.

У цій статті ми збираємося обговорити деталі того, як ми можемо читати інформацію щодо вкладень у документах PDF, а також як ми можемо завантажувати вкладення з PDF за допомогою Python. Не потрібно завантажувати та встановлювати спеціальне програмне забезпечення та виконувати всі необхідні операції в хмарі.

API обробки PDF

Aspose.PDF Cloud — це наш API на основі REST, який пропонує можливості створювати, редагувати та перетворювати різні формати на PDF, а також відтворювати файли PDF у форматах, зокрема XLSX, PPTX, DOCX, EPUB, HTML, JPEG тощо та багато іншого. Завдяки архітектурі REST API доступний на будь-якій платформі. Тому ви можете реалізувати можливості обробки PDF у настільних, веб-, мобільних, хмарних і гібридних програмах.

Python SDK для обробки PDF

Щоб ще більше полегшити роботу наших клієнтів, ми створили спеціальні SDK для програмування, щоб ви отримали всі можливості обробки PDF-файлів вибраною вами мовою. Подібним чином, щоб полегшити розробникам Python, ми створили SDK для програмування Python під назвою Aspose.PDF Cloud SDK for Python, який є оболонкою для Aspose.PDF Cloud API. Тепер, щоб почати, першим кроком є його встановлення. SDK доступний для безкоштовного завантаження в репозиторії PIP і GitHub. Тепер виконайте наступну команду в терміналі/командному рядку, щоб інсталювати останню версію SDK у системі.

pip install asposepdfcloud

PyCharm IDE

Якщо ви використовуєте PyCharm IDE, ви можете безпосередньо додати SDK як залежність у своєму проекті.

Файл ->Параметри ->Проект ->Інтерпретатор Python ->asposepdfcloud

Зображення 1: - Параметр налаштувань PyCharm.

Зображення 1: - Параметр налаштувань PyCharm.

Aspose.PDF пакет Python

Зображення 2:- Пакет Aspose.Pdf Cloud Python.

Безкоштовний обліковий запис Cloud Dashboard

Після встановлення наступним важливим кроком є безкоштовна підписка на наші хмарні служби через інформаційну панель Aspose.Cloud. Метою цієї підписки є надання лише авторизованим особам доступу до наших служб обробки файлів. Якщо у вас є обліковий запис GitHub або Google, просто зареєструйтеся або натисніть кнопку Створити новий обліковий запис і надайте необхідну інформацію. Тепер увійдіть на інформаційну панель, використовуючи облікові дані, розгорніть розділ «Програми» на інформаційній панелі та прокрутіть униз до розділу «Облікові дані клієнта», щоб переглянути дані про ідентифікатор клієнта та секрет клієнта.

Облікові дані клієнта

Зображення 3: облікові дані клієнта на інформаційній панелі Aspose.Cloud.

Читання інформації про вкладення з PDF

Будь ласка, дотримуйтеся наведених нижче інструкцій, щоб прочитати інформацію про вкладення в документі PDF.

  • По-перше, нам потрібно створити екземпляр класу ApiClient, надаючи як аргументи Client ID Client Secret.
  • По-друге, створіть екземпляр класу PdfApi, який приймає об’єкт ApiClient як вхідний аргумент.
  • Тепер викличте метод getdocumentattachments(…) PdfApi, щоб отримати деталі вкладення PDF.
def readAttachmentDetails():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # створити екземпляр PdfApi, передаючи PdfApiClient як аргумент
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # викликати API, щоб отримати деталі вкладення
        response = pdf_api.get_document_attachments(name = input_file)
        print(response)
        # друкувати повідомлення в консолі (необов'язково)
        print('PDF Attachment details successfully retrieved !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Для довідки зразок PDF-документа, використаний у наведеному вище прикладі, можна завантажити з PdfWithEmbeddedFiles.pdf.

Прочитайте конкретну інформацію про вкладення

API також допомагає нам читати інформацію про певні вкладення в документі PDF. Для цього спробуйте використати метод GetDocumentAttachmentByIndex. Нижче наведено деталі першого отриманого вкладення.

{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
                'creation_date': '11/24/2008 02:02:36.000 PM',
                'description': None,
                'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
                           'rel': 'self',
                           'title': None,
                           'type': None}],
                'mime_type': 'application/pdf',
                'modification_date': '05/03/2007 10:37:41.000 AM',
                'name': 'example1.pdf',
                'size': 10984},
 'code': 200,
 'status': 'OK'}

Завантажте конкретне вкладення з PDF

Будь ласка, дотримуйтесь інструкцій, наведених нижче, щоб завантажити певні вкладення з документа PDF.

  • По-перше, нам потрібно створити екземпляр класу ApiClient, надаючи як аргументи Client ID Client Secret.
  • По-друге, створіть екземпляр класу PdfApi, який приймає об’єкт ApiClient як вхідний аргумент.
  • Тепер викличте метод GetDownloadDocumentAttachmentByIndex(…), щоб завантажити вкладення з файлу PDF.
def downloadAttachment():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # створити екземпляр PdfApi, передаючи PdfApiClient як аргумент
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # викликати API, щоб завантажити перше вкладення з файлу PDF
        response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
        print(response)
        # друкувати повідомлення в консолі (необов'язково)
        print('PDF Attachment successfully downloaded !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Читання інформації про вкладення за допомогою команди cURL

Доступ до API REST легко отримати за допомогою команд cURL, і ми можемо використовувати просту програму терміналу для їх виконання. Оскільки Aspose.PDF Cloud розроблено відповідно до архітектури REST, ми також можемо отримати доступ до них за допомогою команд cURL. Однак, як попередня умова, нам потрібно створити веб-токен JSON (JWT) на основі облікових даних вашого індивідуального клієнта, указаних на інформаційній панелі Aspose.Cloud. Це обов’язково, оскільки наші API доступні лише зареєстрованим користувачам. Виконайте таку команду, щоб створити маркер JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Тепер, коли у нас є маркер JWT, ми можемо виконати наступну команду, щоб отримати 7інформацію про певні вкладення з документів PDF.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Завантажте певний вкладений файл за допомогою команди cURL

Будь ласка, виконайте наступну команду, щоб завантажити 2-е вкладення PDF-файлу та зберегти його на локальному диску.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o Attachment.txt

Висновок

У цій статті описано деталі та кроки щодо того, як ми можемо читати та завантажувати вкладення з документів PDF. Ми досліджували кроки за допомогою фрагментів коду Python, а також за допомогою команд cURL. Крім обробки вкладень, API також надає безліч функцій, пов’язаних з іншими елементами PDF-файлів, і їх деталі можна знайти в Посібнику розробника. Крім того, повний вихідний код Aspose.PDF Cloud SDK для Python доступний для завантаження на GitHub. Якщо у вас виникнуть проблеми під час використання API або у вас виникнуть додаткові запитання, будь ласка, зв’яжіться з нами через безкоштовний форум підтримки продуктів.

Схожі статті

Ми також рекомендуємо відвідати такі посилання, щоб дізнатися більше про: