PDF para HTML

Converta PDF em HTML usando a API REST .NET.

Os documentos PDF são uma escolha popular para compartilhar informações devido à sua formatação consistente em diferentes dispositivos e plataformas. Mas quando se trata de exibir conteúdo em um site, os PDFs nem sempre são a opção mais fácil de usar. No entanto, a conversão de arquivos PDF para o formato HTML abre um mundo de possibilidades para desenvolvedores web e criadores de conteúdo. Outra razão para esta conversão é que a apresentação e acessibilidade do conteúdo são fatores cruciais para o sucesso online, uma vez que este se torna indexável pelos motores de busca.

Neste artigo, iremos nos aprofundar nos detalhes sobre como converter PDF em HTML usando a API .NET REST.

API REST para conversão de PDF em HTML

Realizar a conversão de PDF em HTML é facilitado com os poderosos recursos do Aspose.PDF Cloud SDK for .NET. Esta API permite integrar perfeitamente a funcionalidade de conversão de PDF em seus aplicativos e fluxos de trabalho .NET. Com apenas algumas linhas de código, você pode converter facilmente documentos PDF para o formato HTML, tornando-os adequados para exibição e interação na web. A API REST fornece uma ampla gama de recursos para controlar o processo de conversão. Você também pode personalizar o HTML de saída especificando o nome da fonte padrão, tipo de documento, layout, resolução de imagem e várias outras configurações.

Para iniciar este processo de conversão, primeiro precisamos adicionar a referência do SDK em nosso projeto e para isso, pesquise Aspose.PDF-Cloud no gerenciador de pacotes NuGet dentro do IDE do Visual Studio e clique no botão Adicionar Pacote . Você também precisa obter as credenciais do seu cliente no painel da nuvem. Caso você não tenha uma conta existente, basta criar uma conta gratuita seguindo as instruções especificadas em início rápido.

Converta PDF em HTML usando C# .NET

Agora precisamos executar o seguinte trecho de código para realizar a conversão para que possamos renderizar o PDF no site.

// Para mais exemplos, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Obtenha credenciais do cliente em https://dashboard.aspose.cloud/
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// crie uma instância do PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Insira o nome do arquivo PDF
String inputFile = "Binder1-1.pdf";
// leia o conteúdo do arquivo PDF de entrada
var pdfFile = System.IO.File.OpenRead(inputFile);

// Chame a API para converter o arquivo PDF em HTML e salve a saída no armazenamento em nuvem
// Especificamos o formato HTML de saída como `HTML5` 
// O sinalizador para salvar cada página PDF como arquivo HTML separado está ativado
// A saída será gerada como arquivo .ZIP
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF para HTML

Visualização da conversão de PDF para HTML.

Abaixo estão detalhes rápidos sobre o trecho de código declarado acima.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Primeiramente, crie um objeto da classe PdfApi enquanto passa as credenciais do cliente como argumentos de entrada.

var pdfFile = System.IO.File.OpenRead(inputFile);

Leia o conteúdo do arquivo PDF da unidade local.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Chame a API para converter o PDF do fluxo de entrada para o formato HTML. Durante a conversão, especificamos o valor para salvar cada página PDF em um arquivo HTML individual.

Visite PutPdfInRequestToHtml para obter uma lista completa de argumentos suportados por esta chamada de API e seus detalhes relacionados.

O documento PDF de entrada usado no exemplo acima pode ser baixado em Binder1.pdf.

PDF para HTML online usando comandos cURL

Converter PDF em HTML usando comandos cURL em combinação com Aspose.PDF Cloud também é uma abordagem versátil e eficiente. Aproveitando o poder dos comandos cURL, você pode integrar facilmente a API Aspose.PDF Cloud em seus aplicativos e automatizar o processo de conversão de PDF em HTML. Além disso, o uso de comandos cURL permite uma fácil interação com endpoints RESTful, permitindo comunicação e troca de dados contínuas. Portanto, para exibir PDF no navegador HTML, precisamos simplesmente converter arquivos PDF em HTML chamando alguns comandos cURL, e isso reduz significativamente o tempo e o esforço de desenvolvimento.

A primeira etapa nesta abordagem é a geração de um token de acesso JWT. Então, por favor execute o seguinte comando:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Agora precisamos executar o seguinte comando cURL que carrega o arquivo PDF do armazenamento em nuvem, converte todo o documento para o formato HTML e salva a saída como arquivo .ZIP na unidade local (nome especificado com o argumento -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Substitua inputPDF pelo nome de um documento PDF de entrada disponível no armazenamento em nuvem e accessToken pelo token de acesso JWT gerado acima.

Conclusão

Concluindo, a conversão de PDF em HTML com Aspose.PDF Cloud API fornece uma solução abrangente e versátil. Seja usando a API REST .NET para integração perfeita ou comandos cURL para conversão eficiente, o Aspose.PDF Cloud SDK oferece amplos recursos e opções de personalização. Essas abordagens garantem a renderização precisa do conteúdo PDF em HTML responsivo, preservando o layout e a formatação para uma experiência ideal do usuário. Além disso, a capacidade de incorporar conteúdo PDF em páginas HTML permite aplicações web versáteis e interativas, melhorando a acessibilidade e o envolvimento do usuário.

Artigos relacionados

É altamente recomendável visitar os seguintes blogs: