Desarrollar un convertidor de PDF a Excel utilizando Python Cloud SDK.

Convertir PDF a Excel

Cómo convertir PDF a Excel | Exportar PDF a Excel con el SDK de Python

Los archivos PDF son excelentes para preservar el formato de los documentos, pero extraer y utilizar datos de ellos puede ser complejo. Aquí es donde se hace evidente la necesidad de convertir PDF a Excel. El libro de trabajo Excel, con su formato de hoja de cálculo, ofrece una forma estructurada de organizar y procesar datos. Imagine extraer sin problemas tablas, figuras y texto de un PDF y tenerlos perfectamente ordenados en celdas de Excel, listos para su análisis. Esta conversión no solo simplifica el manejo de datos, sino que también mejora la eficiencia y la productividad.

Además, Excel se utiliza principalmente para almacenar y organizar datos como ingresos, nóminas e información contable. Permiten al usuario realizar cálculos con estos datos y producir gráficos y diagramas. Ahora, en este artículo, vamos a analizar los detalles sobre cómo transformar un PDF a formato Excel.

SDK de Python Cloud para procesamiento de PDF

Aspose.PDF Cloud SDK for Python surge como una herramienta poderosa para optimizar el proceso de conversión de PDF a XLS. No solo facilita la conversión de “PDF a Excel” sin inconvenientes, sino que también ofrece una gran cantidad de otras capacidades. Imagine aprovechar la capacidad de manipular archivos PDF, extraer datos específicos y generar archivos listos para Excel sin esfuerzo.

El primer paso es instalar el Python Cloud SDK, que está disponible para descargar en los repositorios PIP y GitHub. Por lo tanto, ejecute el siguiente comando en la terminal o en el símbolo del sistema para instalar la última versión del Cloud SDK.

pip install asposepdfcloud

MS Visual Studio

En caso de que necesite agregar directamente la referencia en su proyecto Python dentro de Visual Studio IDE, busque asposepdfcloud como paquete en la ventana del entorno Python. Siga los pasos numerados en la imagen a continuación para completar el proceso de instalación.

Guardar PDF en Excel

Imagen 1: Paquete Aspose.PDF Cloud SDK para Python.

PyCharm

PyCharm es un IDE popular para el desarrollo de Python. En esta sección, analizaremos la configuración de PyCharm en la plataforma Windows.

  • Haga clic en el menú Archivo y seleccione el elemento de menú Configuración…
Configuración de PyCharm

Imagen 2:- Elemento del menú Configuración de PyCharm.

  • Expanda el árbol del Proyecto desde la izquierda y seleccione la opción Intérprete de Python.
  • Haga clic en el signo + (más) en la sección derecha e ingrese asposepdfcloud en el campo de búsqueda sobre el cuadro de diálogo de paquetes disponibles.
  • Ahora haga clic en el botón Instalar paquete.
Convertir PDF a Excel SDK

Imagen 3:- Paquete Aspose.PDF Cloud para Python.

Una vez instalado el SDK, se muestra el mensaje de éxito.

SDK de PDF a Excel

Imagen 4: Mensaje de éxito una vez instalado Aspose.PDF Cloud para Python.

  • En caso de que no tenga una cuenta existente en cloud dashboard, puede crear una cuenta gratuita utilizando GitHub o credenciales de Google. Ahora inicie sesión en el panel y obtenga sus credenciales de cliente personalizadas.
Credenciales del cliente

Imagen 5: Credenciales del cliente en el panel de Aspose.Cloud.

Convertir PDF a Excel en Python

Siga las instrucciones a continuación para transformar un PDF en un libro de Excel (XLSX) mediante un fragmento de código de Python. Tenga en cuenta que los siguientes fragmentos de código esperan que el PDF de entrada esté disponible en el almacenamiento en la nube.

  • Primero, cree una instancia de la clase ApiClient mientras proporciona el ID de cliente y el secreto del cliente como argumentos.
  • En segundo lugar, cree una instancia de la clase PdfApi que tome el objeto ApiClient como argumento.
  • Ahora especifique el nombre del PDF de entrada y el nombre del archivo XLSX resultante.
  • Por último, llame al método putpdfinstoragetoxlsx(..) que toma el archivo PDF de entrada, el nombre del archivo XLSX resultante y un parámetro opcional para generar hojas de trabajo uniformes.
# Para obtener más ejemplos de código, visite https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Para obtener las credenciales del cliente, visite https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # Crea una instancia de PdfApi mientras pasas PdfApiClient como argumento
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # nombre del libro de Excel resultante
        resultant_file_name = 'Resultant.xlsx'
    
        # Llamar a la API para convertir PDF a formato Excel
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # Imprimir mensaje en la consola (opcional)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
Vista previa de PDF a XLSX

Imagen 6: Vista previa de conversión de PDF a Excel.

Los archivos de muestra utilizados en el ejemplo anterior se pueden descargar de awesomeTable.pdf y Resultant.xlsx.

Conversión de PDF a XLS mediante el comando cURL

La transformación de PDF a XLS se puede realizar fácilmente utilizando Aspose.PDF Cloud junto con los comandos cURL, ya que representa un enfoque optimizado y automatizado. Al utilizar los comandos cURL junto con Aspose.PDF Cloud, no solo simplificamos el proceso de conversión, sino que también permitimos una integración perfecta en varios flujos de trabajo.

El primer paso de este enfoque es generar un token web JSON (JWT) basado en las credenciales del cliente. Por lo tanto, ejecute el siguiente comando para generar el token JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Una vez que tengamos el token JWT, ejecute el siguiente comando para convertir PDF al formato XLS.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Conclusión

En conclusión, ya sea que optemos por el robusto SDK de Aspose.PDF Cloud para Python o utilicemos comandos cURL junto con Aspose.PDF Cloud, podemos lograr fácilmente nuestro objetivo de transformar PDF a formato Excel. El SDK de Aspose.PDF Cloud para Python ofrece una solución integral y fácil de usar para desarrolladores, que le brinda una variedad de funcionalidades más allá de la conversión. Por otro lado, aprovechar los comandos cURL proporciona un enfoque versátil y programable. Independientemente del método elegido, ambos enfoques son herramientas poderosas que revolucionan la forma en que estructuramos y extraemos datos de los archivos PDF.

Artículos relacionados

We recommend visiting the following articles to learn about: