Conversor de PDF a HTML

Convertir PDF a HTML usando Java

Uno de los estándares de facto para compartir información y datos en Internet es PDF. La razón de su popularidad es que mantiene el diseño y la fidelidad del documento cuando se ve en cualquier plataforma, incluidos los dispositivos móviles o de escritorio. Sin embargo, para ver estos archivos, debe usar la aplicación de visualización de PDF. Sin embargo, una solución sencilla es convertir PDF a HTML y cargar fácilmente el HTML en el navegador web. Entonces, en este artículo, vamos a discutir más a fondo los detalles sobre cómo desarrollar un convertidor de PDF a HTML utilizando la API REST.

API de conversión de SXC a Excel

Para crear, manipular y transformar archivos PDF a otros formatos, intente usar Aspose.PDF Cloud SDK for Java. Ahora, para usar el SDK, agregue la siguiente información en pom.xml del proyecto de tipo de compilación maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Ahora que la referencia de Aspose.PDF Cloud SDK for Java se agregó a su proyecto, el siguiente paso es crear una cuenta gratuita en Aspose Cloud. Inicie sesión con una cuenta recién creada y busque/cree el ID del cliente y el secreto del cliente en Cloud Dashboard. Estos detalles son necesarios en las secciones siguientes.

Conversor de PDF a HTML en Java

Analicemos los detalles sobre cómo desarrollar un convertidor de PDF a HTML utilizando Java Cloud SDK. Tenga en cuenta que en el siguiente fragmento de código, se utilizan parámetros muy básicos durante la operación de conversión, pero le recomendamos visitar la sección Referencia de la API para ver la lista de todos los parámetros admitidos, así como su descripción relacionada.

  • Primero necesitamos crear un objeto PdfApi mientras proporcionamos ClientID y Client secret como argumentos
  • En segundo lugar, cargue el archivo PDF de entrada utilizando la instancia de archivo
  • En tercer lugar, suba el PDF de entrada al almacenamiento en la nube utilizando el método uploadFile(…)
  • Dado que solo necesitamos convertir la segunda página de PDF, proporcionamos el valor de la segunda página en el objeto Lista
  • Ahora llame al método putPdfInStorageToHtml(…) que requiere el PDF de entrada, el nombre del HTML resultante y varios otros parámetros de conversión.
try
    {
    // Obtenga ClientID y ClientSecret de https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // crear una instancia de PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // nombre del documento PDF de entrada 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // nombre del archivo HTML resultante
    String resultantImage = "Resultant.html";
	  
    // leer el contenido del archivo PDF de entrada
    File file = new File("//Users//"+inputFile);
	    
    // subir PDF al almacenamiento en la nube
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // lista de páginas PDF para convertir
    List<Integer> list = new ArrayList<Integer>();
    //lista.añadir(1);
    list.add(2);  // only convert second page of PDF
	    
    // llame a la API para la conversión de PDF a HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // mensaje de éxito de impresión
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Conversor de PDF a HTML

Imagen 1: - Vista previa de conversión de PDF a HTML

El archivo PDF de muestra utilizado en el ejemplo anterior se puede descargar desde PdfWithScreenAnnotations.pdf

Convierta PDF a HTML usando comandos cURL

Los comandos cURL también son una de las formas convenientes de acceder a las API REST a través del terminal de línea de comandos. Ahora, el requisito previo para este enfoque es la generación del token de acceso JWT (basado en las credenciales del cliente) mientras se ejecuta el siguiente comando.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Una vez que tengamos el token JWT, debemos ejecutar el siguiente comando para convertir PDF a HTML. El HTML resultante se guarda como archivo Zip en el almacenamiento en la nube.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Conclusión

Hemos aprendido los pasos para desarrollar un convertidor de PDF a HTML utilizando Java Cloud SDK. Entonces, podemos usar el fragmento de código de Jave para convertir PDF a HTML o podemos usar los comandos cULR para convertir PDF a HTML5. En caso de que desee realizar algún cambio en el código fuente de Java Cloud SDK, puede descargar el código fuente completo desde GitHub. Puede considerar acercarse a nosotros para una resolución rápida de problemas a través del [foro de soporte del producto] gratuito 9.

Artículos relacionados

Recomendamos encarecidamente visitar los siguientes enlaces para obtener más información sobre: