palavra para remarcação

Converter Word em Markdown em Java

O Microsoft Word é amplamente utilizado para criar, editar e transformar documentos do Word (DOC/DOCX) em vários formatos. Da mesma forma, Markdown é uma linguagem de marcação leve que você pode usar para adicionar elementos de formatação a documentos de texto simples. É um documento de texto simples que deve ser legível sem tags bagunçando tudo, mas ainda deve haver maneiras de adicionar modificadores de texto como listas, negrito, itálico, etc. Portanto, se tivermos um documento do Word e precisarmos criar um arquivo equivalente na sintaxe do Markdown, fica difícil criá-lo manualmente. No entanto, uma solução programática pode resolver o problema. Este artigo explicará todos os detalhes sobre como desenvolver um conversor de word para markdown usando Java Cloud SDK.

API de conversão de Word para Markdown

Nossa API baseada em REST chamada Aspose.Words Cloud é uma solução incrível para implementar operações de criação, manipulação e conversão de documentos do MS Word em uma variedade de formatos suportados. Agora, para implementar os mesmos recursos de conversão e processamento de documentos no aplicativo Java, precisamos usar Aspose.Words Cloud SDK for Java que é um wrapper em torno da API REST. Portanto, na primeira etapa da utilização do SDK, precisamos adicionar sua referência em nosso projeto Java, incluindo as seguintes informações em pom.xml (projeto de tipo de construção maven).

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

Depois que a referência do SDK for adicionada ao projeto, a próxima etapa importante é obter as credenciais do cliente no Cloud Dashboard. Caso contrário, você precisa primeiro registrar uma conta gratuita usando um endereço de e-mail válido.

Word para MD em Java

Esta seção explica as etapas e detalhes relacionados sobre como podemos converter o formato Word para MD usando o trecho de código Java. Vamos usar duas opções para carregar o documento do Word de entrada, ou seja, formar armazenamento em nuvem ou unidade local e, em seguida, transformá-lo no formato Markdown.

Carregar documento do Word da unidade local

  • Em primeiro lugar, crie uma instância de WordsApi e passe credenciais personalizadas como argumentos
  • Em segundo lugar, leia o conteúdo do documento do Word de entrada usando o método Files.readAllBytes(…) e obtenha o valor retornado em uma matriz byte[]
  • Em terceiro lugar, crie um objeto de ConvertDocumentRequest que usa o arquivo Word de entrada, o formato MD e o nome do arquivo Markdown resultante como argumentos
  • Agora, chame o método convertDocument(…) para conversão de Word para MD. O Markdown resultante é retornado como fluxo de resposta, para ser salvo na instância byte[]
  • Finalmente, para salvar o Markdown resultante na unidade local, crie um objeto de FileOutputStream e use seu método write(…)
// Para mais trechos de código, por favor https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// se baseUrl for nulo, WordsApi usará https://api.aspose.cloud padrão
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // carregar documento do word do sistema local
        File file1 = new File("sample_EmbeddedOLE.docx");

        // leia o conteúdo do documento do word de entrada
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // formato de arquivo resultante
        String format = "md";

        // criar solicitação de conversão de documento onde fornecemos o nome do arquivo resultante
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // execute conversão de word para markdown e salve a saída em array de bytes
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // Salve a documentação de remarcação resultante na unidade local
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
palavra para Markdown

Imagem:- Pré-visualização da conversão de Word para Markdown

Você pode fazer o download do documento de entrada do Word em sampleEmbeddedOLE.docx.

Carregar documento do Word do armazenamento em nuvem

  • Da mesma forma, primeiro precisamos criar uma instância de WordsApi ao passar credenciais personalizadas como argumentos
  • Em segundo lugar, crie um objeto de GetDocumentWithFormatRequest que usa o nome do arquivo Word de entrada, o formato MD e o nome do arquivo Markdown resultante como argumentos
  • Por fim, chame o método getDocumentWithFormat(..) que aciona a operação de conversão de Word para Markdown. O arquivo MD resultante é salvo no armazenamento em nuvem
// Para mais trechos de código, por favor https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// se baseUrl for nulo, WordsApi usará https://api.aspose.cloud padrão
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // agora crie um novo objeto de GetDocumentWithFormatRequest 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // agora chame o método para iniciar a operação de conversão
        // o arquivo resultante é armazenado no armazenamento em nuvem
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

DOC para Markdown usando comandos cURL

As APIs REST também oferecem flexibilidade para serem acessadas de qualquer plataforma com a ajuda de comandos cURL. Portanto, nesta seção, discutiremos os detalhes sobre como carregar o armazenamento em nuvem do formulário de documento do Word, realizar a conversão de DOCX para Markdown e salvar o arquivo MD resultante na unidade local. Agora, primeiro precisamos gerar o token de acesso JWT (com base nas credenciais do cliente) usando o seguinte comando e, em seguida, realizar a conversão de DOCX para Markdown.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Depois que o JWT for gerado, execute o seguinte comando para carregar o documento do Word do armazenamento em nuvem e realizar a conversão do Word para Markdown. O arquivo MD resultante é armazenado na unidade local

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

Conclusão

Chegamos ao final deste artigo, onde aprendemos os detalhes sobre como podemos converter programaticamente o Word em Markdown usando Java. Da mesma forma, também exploramos as etapas para converter DOCX em Markdown por meio de comandos cURL.

Outra opção para explorar os recursos da API é por meio de SwaggerUI em um navegador da web. Também recomendamos explorar a Documentação do produto, que é uma fonte incrível de informações para aprender sobre outros recursos interessantes. Caso você precise baixar e modificar o código-fonte do Cloud SDK, ele está disponível no GitHub (publicado sob licença do MIT). Por fim, caso encontre algum problema ao usar a API, considere entrar em contato conosco para uma resolução rápida por meio do [fórum de suporte ao produto] gratuito 9.

Artigos relacionados

Por favor, visite os links a seguir para saber mais sobre: