
El archivo PDF está compuesto de texto y gráficos y puede contener archivos completos en su interior como archivos adjuntos. Esto hace que el intercambio de conjuntos de documentos sea más fácil y fiable. El panel Archivos adjuntos le proporciona un lugar central para ver, insertar, eliminar y exportar archivos adjuntos. Tenga en cuenta también que si mueve el archivo PDF a una nueva ubicación, los archivos adjuntos que contiene también se moverán con él. Los archivos adjuntos pueden incluir enlaces hacia o desde el documento principal o hacia otros archivos adjuntos. No confunda los comentarios adjuntos con los archivos adjuntos.
En este artículo, analizaremos en detalle cómo podemos leer la información sobre los archivos adjuntos en documentos PDF y cómo podemos descargar archivos adjuntos de PDF con Python. No es necesario descargar ni instalar ningún software en particular y todas las operaciones necesarias se realizan en la nube.
- API de procesamiento de PDF
- SDK de Python para procesamiento de PDF
- Leer información adjunta mediante el comando cURL
- Descargar archivo adjunto específico mediante el comando cURL
API de procesamiento de PDF
Aspose.PDF Cloud es nuestra API basada en REST que ofrece la posibilidad de crear, editar y transformar varios formatos en PDF, así como de renderizar archivos PDF en formatos como XLSX, PPTX, DOCX, EPUB, HTML, JPEG, etc. y muchos más. Gracias a la arquitectura REST, se puede acceder a la API desde cualquier plataforma. Por lo tanto, puede implementar capacidades de procesamiento de PDF en aplicaciones de escritorio, web, móviles, en la nube e híbridas.
SDK de Python para procesamiento de PDF
Para facilitar aún más la tarea a nuestros clientes, hemos creado SDK de programación específicos para que obtenga todas las capacidades de procesamiento de PDF dentro del lenguaje de su elección. De manera similar, para facilitar la tarea a los desarrolladores de Python, hemos creado un SDK de programación de Python llamado Aspose.PDF Cloud SDK for Python, que es un contenedor de Aspose.PDF Cloud API. Ahora, para comenzar, el primer paso es su instalación. El SDK está disponible para descarga gratuita a través de los repositorios PIP y GitHub. Ahora ejecute el siguiente comando en la terminal/símbolo del sistema para instalar la última versión del SDK en el sistema.
pip install asposepdfcloud
IDE de PyCharm
Si está utilizando PyCharm IDE, puede agregar directamente el SDK como una dependencia en su proyecto.
Archivo ->Configuración ->Proyecto ->Intérprete de Python ->asposepdfcloud

Image 1:- PyCharm settings option.

Imagen 2:- Paquete Python en la nube Aspose.Pdf.
Cuenta gratuita de Cloud Dashboard
Después de la instalación, el siguiente paso importante es una suscripción gratuita a nuestros servicios en la nube a través del panel de control de Aspose.Cloud. El propósito de esta suscripción es permitir que solo las personas autorizadas accedan a nuestros servicios de procesamiento de archivos. Si tiene una cuenta de GitHub o Google, simplemente regístrese o haga clic en el botón Crear una nueva cuenta y proporcione la información requerida. Ahora inicie sesión en el panel de control con credenciales y expanda la sección Aplicaciones desde el panel de control y desplácese hacia abajo hasta la sección Credenciales del cliente para ver los detalles de ID de cliente y Secreto de cliente.

Imagen 3: Credenciales del cliente en el panel de Aspose.Cloud.
Leer información adjunta en formato PDF
Siga las instrucciones a continuación para leer la información de los archivos adjuntos dentro del documento PDF.
- En primer lugar, debemos crear una instancia de la clase ApiClient y proporcionar el ID de cliente y el secreto del cliente como argumentos.
- En segundo lugar, cree una instancia de la clase PdfApi que tome el objeto ApiClient como argumento de entrada.
- Ahora llame al método getdocumentattachments(…) de PdfApi para obtener los detalles del archivo adjunto en PDF.
def readAttachmentDetails():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# Crea una instancia de PdfApi mientras pasas PdfApiClient como argumento
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'PdfWithEmbeddedFiles.pdf'
# Llamar a la API para extraer los detalles del archivo adjunto
response = pdf_api.get_document_attachments(name = input_file)
print(response)
# Imprimir mensaje en la consola (opcional)
print('PDF Attachment details successfully retrieved !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Para su referencia, el documento PDF de muestra utilizado en el ejemplo anterior se puede descargar desde PdfWithEmbeddedFiles.pdf.
Leer información específica del archivo adjunto
La API también nos permite leer la información de archivos adjuntos específicos en el documento PDF. Para ello, intente utilizar el método GetDocumentAttachmentByIndex. A continuación, consulte los detalles del primer archivo adjunto recuperado.
{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
'creation_date': '11/24/2008 02:02:36.000 PM',
'description': None,
'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
'rel': 'self',
'title': None,
'type': None}],
'mime_type': 'application/pdf',
'modification_date': '05/03/2007 10:37:41.000 AM',
'name': 'example1.pdf',
'size': 10984},
'code': 200,
'status': 'OK'}
Descargar archivo adjunto específico en formato PDF
Siga las instrucciones que se especifican a continuación para descargar archivos adjuntos específicos del documento PDF.
- En primer lugar, debemos crear una instancia de la clase ApiClient y proporcionar el ID de cliente y el secreto del cliente como argumentos.
- En segundo lugar, cree una instancia de la clase PdfApi que tome el objeto ApiClient como argumento de entrada.
- Ahora llame al método GetDownloadDocumentAttachmentByIndex(…) para descargar el archivo adjunto del archivo PDF.
def downloadAttachment():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# Crea una instancia de PdfApi mientras pasas PdfApiClient como argumento
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'PdfWithEmbeddedFiles.pdf'
# Llamar a la API para descargar el primer archivo adjunto del archivo PDF
response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
print(response)
# Imprimir mensaje en la consola (opcional)
print('PDF Attachment successfully downloaded !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Leer información adjunta mediante el comando cURL
Se puede acceder fácilmente a las API REST mediante comandos cURL y podemos usar una aplicación de terminal simple para ejecutarlas. Dado que Aspose.PDF Cloud está desarrollado según la arquitectura REST, también podemos acceder a ellas mediante comandos cURL. Sin embargo, como requisito previo, necesitamos generar un token web JSON (JWT) basado en las credenciales de cliente individuales especificadas en el panel de control de Aspose.Cloud. Es obligatorio porque nuestras API solo son accesibles para usuarios registrados. Ejecute el siguiente comando para generar el token JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Ahora que tenemos el token JWT, podemos ejecutar el siguiente comando para obtener información de archivos adjuntos específicos de documentos PDF.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Descargar archivo adjunto específico mediante el comando cURL
Ejecute el siguiente comando para descargar el segundo archivo adjunto del archivo PDF y guárdelo en la unidad local.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o Attachment.txt
Conclusión
En este artículo se han explicado los detalles y los pasos necesarios para leer y descargar archivos adjuntos de documentos PDF. Hemos explorado los pasos utilizando fragmentos de código de Python, así como los comandos cURL. Además del procesamiento de archivos adjuntos, la API también proporciona una gran cantidad de funciones relacionadas con otros elementos de los archivos PDF, cuyos detalles se pueden encontrar en la Guía para desarrolladores. Además, el código fuente completo de Aspose.PDF Cloud SDK para Python está disponible para su descarga en GitHub. En caso de que tenga algún problema al utilizar la API o tenga más consultas, no dude en ponerse en contacto con nosotros a través del Foro de soporte técnico gratuito.
Artículos relacionados
También recomendamos visitar los siguientes enlaces para conocer más sobre: