Conversor de PDF para HTML

Converter PDF para HTML usando Java

Um dos padrões de fato para compartilhamento de informações e dados pela Internet é PDF. O motivo de sua popularidade é que ele mantém o layout e a fidelidade do documento quando visualizado em qualquer plataforma, incluindo desktop ou celular. No entanto, para visualizar esses arquivos, você precisa usar o aplicativo visualizador de PDF. No entanto, uma solução simples é converter PDF em HTML e carregar facilmente o HTML no navegador da web. Portanto, neste artigo, discutiremos mais detalhadamente como desenvolver um conversor de PDF para HTML usando a API REST.

API de conversão de SXC para Excel

Para criar, manipular e transformar arquivos PDF em outros formatos, tente usar Aspose.PDF Cloud SDK for Java. Agora, para usar o SDK, adicione as seguintes informações em pom.xml do projeto de tipo de compilação maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Agora que a referência Aspose.PDF Cloud SDK para Java foi adicionada ao seu projeto, a próxima etapa é criar uma conta gratuita no Aspose Cloud. Faça login usando a conta recém-criada e procure/crie ID do cliente e Segredo do cliente em Cloud Dashboard. Esses detalhes são necessários nas seções subsequentes.

Conversor de PDF para HTML em Java

Vamos discutir os detalhes de como desenvolver um conversor de PDF para HTML usando Java Cloud SDK. Observe que no trecho de código a seguir, parâmetros muito básicos são usados durante a operação de conversão, mas é altamente recomendável visitar a seção Referência da API para obter a lista de todos os parâmetros compatíveis, bem como a descrição relacionada.

  • Primeiro, precisamos criar um objeto PdfApi enquanto fornecemos ClientID e Client secret como argumentos
  • Em segundo lugar, carregue o arquivo PDF de entrada usando a instância de arquivo
  • Em terceiro lugar, carregue o PDF de entrada para o armazenamento em nuvem usando o método uploadFile(…)
  • Como só precisamos converter a segunda página do PDF, estamos fornecendo o valor da segunda página no objeto List
  • Agora chame o método putPdfInStorageToHtml(…) que requer PDF de entrada, nome do HTML resultante e vários outros parâmetros de conversão
try
    {
    // Obtenha ClientID e ClientSecret em https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // criar uma instância de PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // nome do documento PDF de entrada 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // nome do arquivo HTML resultante
    String resultantImage = "Resultant.html";
	  
    // leia o conteúdo do arquivo PDF de entrada
    File file = new File("//Users//"+inputFile);
	    
    // carregar PDF para armazenamento em nuvem
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // lista de páginas PDF a serem convertidas
    List<Integer> list = new ArrayList<Integer>();
    //lista.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // chame a API para conversão de PDF para HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // imprimir mensagem de sucesso
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Conversor de PDF para HTML

Image1:- Pré-visualização da conversão de PDF para HTML

O arquivo PDF de amostra usado no exemplo acima pode ser baixado em PdfWithScreenAnnotations.pdf

Converta PDF para HTML usando comandos cURL

Os comandos cURL também são uma das maneiras convenientes de acessar APIs REST por meio do terminal de linha de comando. Agora, o pré-requisito para essa abordagem é a geração do token de acesso JWT (com base nas credenciais do cliente) durante a execução do seguinte comando.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Assim que tivermos o token JWT, precisamos executar o seguinte comando para converter PDF em HTML. O HTML resultante é salvo como arquivo Zip no armazenamento em nuvem.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Conclusão

Aprendemos as etapas para desenvolver um conversor de PDF para HTML usando o Java Cloud SDK. Portanto, podemos usar o trecho de código Jave para converter PDF em HTML ou podemos usar os comandos cULR para converter PDF em HTML5. Caso você queira fazer alguma alteração no código-fonte do Java Cloud SDK, o código-fonte completo pode ser baixado do GitHub. Você pode considerar entrar em contato conosco para uma resolução rápida de problemas por meio do [fórum de suporte ao produto] gratuito 9.

Artigos relacionados

É altamente recomendável visitar os links a seguir para saber mais sobre: