Exibir documento do Word na web após converter Word em HTML usando Python SDK

Converter Word para HTML

Converter Word para HTML | Conversão de Word para HTML com Python SDK

Este artigo explica as etapas para converter Word para HTML usando o Python SDK. Sabemos que os documentos Word são amplamente usados para compartilhamento de informações oficiais e pessoais. No entanto, o desafio surge quando precisamos visualizar ou exibir o documento em um navegador da web. Portanto, uma solução inteligente é converter documentos do Word para o formato HTML.

API de conversão de Word para HTML

Aspose.Words Cloud é capaz de carregar documentos do MS Word, OpenOffice ou WordProcessingML. Ele permite que você manipule no nível de elemento individual ou transforme esses arquivos em Formatos de arquivo suportados. Agora, para utilizar os recursos de processamento de documentos no aplicativo Python, precisamos usar Aspose.Words Cloud SDK for Python. Assim, para utilizar o SDK, o primeiro passo é a instalação que está disponível para download em PIP e GitHub. Execute o seguinte comando no terminal de linha de comando para instalar o SDK:

pip install aspose-words-cloud

O próximo passo é criar uma conta gratuita visitando Aspose.Cloud dashboard, para que você possa gerenciar seus documentos no armazenamento em nuvem.

Converter Word para HTML usando Python

Siga as instruções fornecidas abaixo para carregar o documento do Word da unidade local e enviá-lo para o armazenamento em nuvem. Em seguida, inicializaremos a rotina para converter o arquivo DOC para o formato HTML e salvar a saída no mesmo armazenamento em nuvem.

  • Em primeiro lugar, crie uma instância do WordsApi usando as credenciais do cliente
  • Em segundo lugar, documento do word da unidade local e upload para o armazenamento em nuvem usando o método uploadfile(…)
  • Agora crie uma instância de GetDocumentWithFormatRequest definindo o arquivo do Word de entrada e o documento HTML resultante
  • Finalmente, chame o método getdocumentwithformat(…) para iniciar o processo de conversão
# Para mais exemplos, visite https://github.com/aspose-words-cloud/aspose-words-cloud-python
# Obtenha a chave do aplicativo e o SID do aplicativo em https://dashboard.aspose.cloud/
try:
    # Credenciais do cliente
    client_secret = "1c9379bb7d701c26cc87e741a29987bb"
    client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

    # criar uma instância de WordsApi
    words_api = WordsApi(client_id,client_secret)

    # Nome do documento do Word de entrada
    inputFileName = 'test_multi_pages.docx'
    resultantFile = 'Converted.html'

    # Carregar documento do Word de origem para o Cloud Storage
    words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

    # Crie um objeto para conversão de documento
    request = asposewordscloud.models.requests.GetDocumentWithFormatRequest(inputFileName, "HTML", None, None, None,
                                                                                        None, resultantFile, None)
    # iniciar a operação de conversão de Word para JPEG
    result = words_api.get_document_with_format(request)
        
    # imprimir mensagem no console (opcional)
    print('Conversion process completed successfully !')
  except ApiException as e:
    print("Exception while calling WordsApi: {0}".format(e))

O documento de amostra do Word usado no exemplo acima pode ser baixado em testmultipages.docx.

Conversão de Word para HTML usando o comando cURL

Os comandos cURL também podem ser usados para converter documentos do Word para o formato HTML. No entanto, antes de iniciarmos o processo de conversão, precisamos criar um token de acesso JWT com base nas credenciais pessoais do cliente. Portanto, crie o token JWT executando o seguinte comando.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Depois que o token JWT é gerado, precisamos executar o seguinte comando para fazer upload de um documento do Word de amostra para o armazenamento em nuvem:

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.docx" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>" \
-H  "Content-Type: multipart/form-data" \
-d {"fileContent":{c:\Users\nayyer\Downloads\test_doc.docx}}

Agora, execute o seguinte comando para converter o documento do Word do armazenamento em nuvem para o formato HTML e salve o HTML resultante no mesmo armazenamento em nuvem.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=HTML&outPath=Resultant.html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Conclusão

Neste artigo, aprendemos sobre as etapas para converter Word em HTML usando o Python SDK. Da mesma forma, também exploramos a opção de realizar a conversão de DOC para HTML, DOCX para HTML usando comandos cURL. O processo de conversão completo é tão simples e direto que você só precisa se concentrar em seus requisitos de negócios e esquecer as complexidades internas de conversão de documentos. A API gerencia todas as rotinas de conversão entre documentos e retorna o conteúdo resultante. Sugerimos que você explore o Guia do programador para saber mais sobre outros recursos oferecidos pelo SDK. Além disso, o código-fonte completo do Cloud SDK está disponível para download no GitHub e você pode baixá-lo e atualizá-lo de acordo com suas necessidades.

Tópicos relacionados

Recomendamos que você visite os seguintes artigos para aprender sobre: