
Aprenda a converter PDF para HTML usando Python
No mundo digital acelerado de hoje, a acessibilidade de documentos é uma consideração essencial para empresas e indivíduos. A necessidade de converter documentos PDF para HTML nunca foi tão pronunciada. Embora os arquivos PDF sejam excelentes para preservar a formatação de documentos, pode ser complicado trabalhar com eles na web. Eles geralmente não têm a interatividade e a adaptabilidade necessárias para experiências on-line modernas. É aí que a API REST do Python entra para preencher a lacuna. Este artigo explora a crescente demanda por conversão de PDF para HTML e como a API REST do Python pode revolucionar esse processo.
- API REST Python para conversão de PDF em HTML
- Converter PDF para HTML em Python
- PDF para HTML usando o comando cURL
API REST Python para conversão de PDF em HTML
Converter documentos PDF para o formato HTML é uma tarefa simplificada e eficiente com o Aspose.PDF Cloud SDK para Python. Este poderoso SDK fornece uma variedade de recursos para enfrentar os desafios da conversão de PDF para HTML perfeitamente. Se você precisa apresentar seus documentos na web, compartilhar conteúdo em várias plataformas ou aprimorar a acessibilidade do documento, o Aspose.PDF Cloud tem tudo o que você precisa.
O Python Cloud SDK é totalmente capaz de criar, editar ou transformar arquivos PDF em vários formatos, incluindo EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.
O SDK está disponível para download no repositório PIP e GitHub. Agora, execute o seguinte comando no terminal/prompt de comando para instalar a versão mais recente do SDK no sistema.
pip install asposepdfcloud
Caso precise adicionar diretamente a referência no seu projeto Python dentro do Visual Studio IDE, pesquise asposepdfcloud como um pacote na janela do ambiente Python. Siga os passos numerados na imagem abaixo para concluir o processo de instalação.

Imagem 1:- API de conversão de PDF para HTML.
Converter PDF para HTML em Python
Siga as instruções abaixo para converter um PDF para o formato HTML.
- Primeiro, crie uma instância da classe ApiClient enquanto passa os detalhes do ClinetID e do segredo do cliente como argumentos.
- Em segundo lugar, crie um objeto de PdfApi onde passamos o objeto ApiClient como argumento.
- Em terceiro lugar, especifique o nome do PDF de entrada e a saída resultante.
- Por fim, chame o método putpdfinstoragetohtml(…) da classe PdfApi, para iniciar a conversão. A saída é armazenada no armazenamento em nuvem.
# para amostras de código completas, visite https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi
def pdf2html():
try:
#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")
# crie uma instância PdfApi enquanto passa PdfApiClient como argumento
pdf_api = PdfApi(pdf_api_client)
# Documento PDF de origem
input_file_name = 'completeWorkbook.pdf'
# nome do arquivo resultante
resultant_file_name = 'CodeConversion.zip'
# Chame a API para realizar a conversão
# definimos o formato de saída como zip e o tipo de documento como xhtml
response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)
# imprimir mensagem no console (opcional)
print('PDF successfully converted to HTML format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
PDF para HTML usando o comando cURL
Alternativamente, a conversão de PDF para HTML também pode ser simplificada usando comandos cURL em combinação com o Aspose.PDF Cloud. Essa abordagem fornece uma maneira conveniente de aproveitar os recursos do Aspose.PDF Cloud para suas necessidades de conversão de PDF para HTML. Essa abordagem se adapta melhor às suas necessidades, quando você está procurando uma abordagem independente de plataforma e idioma, para implementar um processo de conversão de PDF para HTML sem interrupções.
Primeiro, precisamos gerar um token de acesso JWT com base nas credenciais do cliente. Execute o comando a seguir para gerar o token JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Depois que tivermos o token JWT, podemos executar o seguinte comando para converter um arquivo PDF disponível no armazenamento em nuvem para o formato HTML e, como resultado, a saída será retornada como uma resposta de fluxo.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip
Caso você precise converter o arquivo PDF para HTML e também queira salvar o resultado no armazenamento em nuvem, tente usar o seguinte comando.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

Imagem 2:- Visualização da conversão de PDF para HTML.
Conclusão
Concluindo, a jornada do PDF para HTML nunca foi tão suave. Exploramos o poder de transformação das APIs REST do Python e a eficiência do Aspose.PDF Cloud com comandos cURL na conversão de seus documentos PDF em HTML dinâmico e pronto para a web. Esses métodos não apenas garantem a integridade do documento, mas também melhoram a acessibilidade e a capacidade de compartilhamento. Então, é hora de tornar seu conteúdo acessível a um público mais amplo e elevar sua presença online.
Caso você encontre algum problema ao usar a API ou tenha alguma dúvida, sinta-se à vontade para entrar em contato conosco através do fórum de suporte gratuito ao produto.
Artigos relacionados
Recomendamos fortemente que você visite os seguintes links para saber mais sobre: