
Файл PDF состоит из текста и графики и может содержать целые файлы внутри себя в качестве вложений. Это делает обмен наборами документов проще и надежнее. Панель вложений предоставляет вам центральное место для просмотра, вставки, удаления и экспорта вложений. Также обратите внимание, что если вы перемещаете файл PDF в новое место, вложения внутри него также перемещаются вместе с ним. Вложения могут включать ссылки на родительский документ или из него или на другие вложения. Пожалуйста, не путайте прикрепленные комментарии с вложенными файлами.
В этой статье мы обсудим детали того, как мы можем читать информацию о вложениях в PDF-документах, а также как мы можем загружать вложения из PDF с помощью Python. Никакой специальной загрузки и установки программного обеспечения не требуется, и все необходимые операции выполняются в облаке.
- API обработки PDF-файлов
- Python SDK для обработки PDF
- Чтение информации о вложении с помощью команды cURL
- Загрузите определенное вложение с помощью команды cURL
API обработки PDF-файлов
Aspose.PDF Cloud — это наш API на основе REST, предлагающий возможности создания, редактирования и преобразования различных форматов в PDF, а также рендеринга файлов PDF в форматы, включая XLSX, PPTX, DOCX, EPUB, HTML, JPEG и многие другие. Благодаря архитектуре REST доступ к API можно получить на любой платформе. Таким образом, вы можете реализовать возможности обработки PDF в настольных, веб-, мобильных, облачных и гибридных приложениях.
Python SDK для обработки PDF-файлов
Чтобы еще больше облегчить работу наших клиентов, мы создали специальные программные SDK, чтобы вы получили все возможности обработки PDF на выбранном вами языке. Аналогично, чтобы облегчить работу разработчиков Python, мы создали программный SDK Python под названием Aspose.PDF Cloud SDK для Python, который является оболочкой вокруг Aspose.PDF Cloud API. Теперь, чтобы начать, первым шагом будет его установка. SDK доступен для бесплатной загрузки через репозиторий PIP и GitHub. Теперь выполните следующую команду в терминале/командной строке, чтобы установить последнюю версию SDK в системе.
pip install asposepdfcloud
PyCharm-IDE-среда
Если вы используете PyCharm IDE, вы можете напрямую добавить SDK в качестве зависимости в свой проект.
Файл ->Настройки ->Проект ->Интерпретатор Python ->asposepdfcloud

Image 1:- PyCharm settings option.

Изображение 2:- Пакет Python Aspose.Pdf Cloud.
Бесплатная учетная запись Cloud Dashboard
После установки следующим важным шагом является бесплатная подписка на наши облачные сервисы через панель управления Aspose.Cloud. Цель этой подписки — разрешить доступ к нашим сервисам обработки файлов только авторизованным лицам. Если у вас есть учетная запись GitHub или Google, просто зарегистрируйтесь или нажмите кнопку Создать новую учетную запись и укажите необходимую информацию. Теперь войдите в панель управления, используя учетные данные, разверните раздел «Приложения» на панели управления и прокрутите вниз до раздела «Учетные данные клиента», чтобы увидеть данные Client ID и Client Secret.

Изображение 3: Учетные данные клиента на панели управления Aspose.Cloud.
Читать информацию о вложениях из PDF
Чтобы прочитать информацию во вложениях в документе PDF, следуйте инструкциям ниже.
- Во-первых, нам необходимо создать экземпляр класса ApiClient, указав в качестве аргументов Client ID и Client Secret.
- Во-вторых, создайте экземпляр класса PdfApi, который принимает объект ApiClient в качестве входного аргумента.
- Теперь вызовите метод getdocumentattachments(…) PdfApi, чтобы получить сведения о вложении PDF.
def readAttachmentDetails():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'PdfWithEmbeddedFiles.pdf'
# вызовите API для извлечения данных о вложении
response = pdf_api.get_document_attachments(name = input_file)
print(response)
# вывести сообщение в консоль (необязательно)
print('PDF Attachment details successfully retrieved !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Для справки образец PDF-документа, использованный в приведенном выше примере, можно загрузить с PdfWithEmbeddedFiles.pdf.
Прочитайте конкретную информацию о вложении
API также позволяет нам читать информацию о конкретных вложениях в документе PDF. Для этой цели попробуйте использовать метод GetDocumentAttachmentByIndex. Ниже приведены сведения о первом извлеченном вложении.
{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
'creation_date': '11/24/2008 02:02:36.000 PM',
'description': None,
'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
'rel': 'self',
'title': None,
'type': None}],
'mime_type': 'application/pdf',
'modification_date': '05/03/2007 10:37:41.000 AM',
'name': 'example1.pdf',
'size': 10984},
'code': 200,
'status': 'OK'}
Загрузить определенное приложение из PDF
Чтобы загрузить определенные вложения из PDF-документа, следуйте инструкциям, указанным ниже.
- Во-первых, нам необходимо создать экземпляр класса ApiClient, указав в качестве аргументов Client ID и Client Secret.
- Во-вторых, создайте экземпляр класса PdfApi, который принимает объект ApiClient в качестве входного аргумента.
- Теперь вызовите метод GetDownloadDocumentAttachmentByIndex(…), чтобы загрузить вложение из PDF-файла.
def downloadAttachment():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'PdfWithEmbeddedFiles.pdf'
# вызовите API для загрузки первого вложения из PDF-файла
response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
print(response)
# вывести сообщение в консоль (необязательно)
print('PDF Attachment successfully downloaded !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Чтение информации о вложении с помощью команды cURL
REST API легко доступны через команды cURL, и мы можем использовать простое терминальное приложение для их выполнения. Поскольку Aspose.PDF Cloud разработан в соответствии с архитектурой REST, мы также можем получить к ним доступ через команды cURL. Однако в качестве предварительного условия нам необходимо сгенерировать JSON Web Token (JWT) на основе ваших индивидуальных учетных данных клиента, указанных на панели управления Aspose.Cloud. Это обязательно, поскольку наши API доступны только зарегистрированным пользователям. Пожалуйста, выполните следующую команду, чтобы сгенерировать JWT-токен.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Теперь, когда у нас есть токен JWT, мы можем выполнить следующую команду, чтобы получить информацию о конкретных вложениях из PDF-документов.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Загрузите определенное вложение с помощью команды cURL
Выполните следующую команду, чтобы загрузить второе вложение PDF-файла и сохранить его на локальном диске.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o Attachment.txt
Заключение
В этой статье объясняются детали и шаги того, как мы можем читать и загружать вложения из PDF-документов. Мы изучили шаги с использованием фрагментов кода Python, а также с использованием команд cURL. Помимо обработки вложений, API также предоставляет множество функций, связанных с другими элементами PDF-файлов, и их подробности можно найти в Руководстве разработчика. Кроме того, полный исходный код Aspose.PDF Cloud SDK для Python доступен для загрузки через GitHub. Если у вас возникнут какие-либо проблемы при использовании API или у вас возникнут дополнительные вопросы, пожалуйста, свяжитесь с нами через Бесплатный форум поддержки продукта.
Похожие статьи
Мы также рекомендуем посетить следующие ссылки, чтобы узнать больше о: