pdf a html

Aprenda a convertir PDF a HTML usando Python

En el acelerado mundo digital actual, la accesibilidad de los documentos es una consideración clave tanto para las empresas como para los particulares. La necesidad de convertir documentos PDF a HTML nunca ha sido tan evidente. Si bien los archivos PDF son excelentes para preservar el formato de los documentos, puede resultar complicado trabajar con ellos en la web. A menudo carecen de la interactividad y la adaptabilidad necesarias para las experiencias en línea modernas. Ahí es donde la API REST de Python entra en acción para cerrar la brecha. Este artículo explora la creciente demanda de conversión de PDF a HTML y cómo la API REST de Python puede revolucionar este proceso.

API REST de Python para conversión de PDF a HTML

Convertir documentos PDF a formato HTML es una tarea sencilla y eficiente con Aspose.PDF Cloud SDK para Python. Este potente SDK ofrece una variedad de funciones para abordar los desafíos de la conversión de PDF a HTML sin problemas. Ya sea que necesite presentar sus documentos en la web, compartir contenido en varias plataformas o mejorar la accesibilidad de los documentos, Aspose.PDF Cloud lo tiene cubierto.

El Python Cloud SDK es totalmente capaz de crear, editar o transformar archivos PDF a varios formatos, incluidos EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.

El SDK está disponible para descargarse en los repositorios PIP y GitHub. Ahora, ejecute el siguiente comando en la terminal o en el símbolo del sistema para instalar la última versión del SDK en el sistema.

pip install asposepdfcloud

En caso de que necesite agregar directamente la referencia en su proyecto Python dentro de Visual Studio IDE, busque asposepdfcloud como paquete en la ventana del entorno Python. Siga los pasos numerados en la imagen a continuación para completar el proceso de instalación.

api de pdf a html

Imagen 1: API de conversión de PDF a HTML.

Convertir PDF a HTML en Python

Siga las instrucciones que se indican a continuación para convertir un PDF a formato HTML.

  • Primero, cree una instancia de la clase ApiClient mientras pasa los detalles secretos de ClinetID y del cliente como argumentos.
  • En segundo lugar, creamos un objeto de PdfApi donde pasamos el objeto ApiClient como argumento.
  • En tercer lugar, especifique el nombre del PDF de entrada y la salida resultante.
  • Por último, llama al método putpdfinstoragetohtml(…) de la clase PdfApi para iniciar la conversión. El resultado se almacena en la nube.
# Para obtener ejemplos de código completos, visite https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # Crea una instancia de PdfApi mientras pasas PdfApiClient como argumento
        pdf_api = PdfApi(pdf_api_client)

        # Documento fuente en formato PDF
        input_file_name = 'completeWorkbook.pdf'

        # nombre del archivo resultante
        resultant_file_name = 'CodeConversion.zip'
    
        # Llamar a la API para realizar la conversión
        # Hemos establecido el formato de salida como zip y el tipo de documento como xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # Imprimir mensaje en la consola (opcional)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

Conversión de PDF a HTML mediante el comando cURL

Como alternativa, la conversión de PDF a HTML también se puede simplificar utilizando comandos cURL en combinación con Aspose.PDF Cloud. Este enfoque proporciona una forma conveniente de aprovechar las capacidades de Aspose.PDF Cloud para sus necesidades de conversión de PDF a HTML. Este enfoque se adapta mejor a sus requisitos, cuando busca un enfoque independiente de la plataforma y el lenguaje, para implementar un proceso de conversión de PDF a HTML sin inconvenientes.

Primero, debemos generar un token de acceso JWT basado en las credenciales del cliente. Ejecute el siguiente comando para generar el token JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Una vez que tenemos el token JWT, podemos ejecutar el siguiente comando para convertir un archivo PDF disponible en el almacenamiento en la nube a formato HTML y, como resultado, la salida se devuelve como una respuesta de flujo.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

En caso de que necesite convertir el archivo PDF a HTML y también quiera guardar la salida en el almacenamiento en la nube, intente usar el siguiente comando.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
Vista previa de PDF a HTML

Imagen 2: Vista previa de conversión de PDF a HTML.

Conclusión

En conclusión, el proceso de pasar de PDF a HTML nunca ha sido tan sencillo. Hemos explorado el poder de transformación de las API REST de Python y la eficiencia de Aspose.PDF Cloud con comandos cURL para convertir sus documentos PDF en HTML dinámico y compatible con la Web. Estos métodos no solo garantizan la integridad del documento, sino que también mejoran la accesibilidad y la capacidad de compartirlo. Por lo tanto, es hora de hacer que su contenido sea accesible para una audiencia más amplia y mejorar su presencia en línea.

En caso de que surja algún problema al usar la API o tenga más consultas, no dude en contactarnos a través del foro de soporte de productos gratuito.

Artículos relacionados

Le recomendamos visitar los siguientes enlaces para obtener más información sobre: