od slova k značke

Previesť Word na Markdown v Jave

Microsoft Word je široko používaný na vytváranie, úpravu a transformáciu dokumentov Word (DOC/DOCX) do rôznych formátov. Podobne Markdown je jednoduchý značkovací jazyk, ktorý môžete použiť na pridávanie prvkov formátovania do dokumentov s obyčajným textom. Ide o obyčajný textový dokument, ktorý bude čitateľný bez tagov, ktoré by všetko prekrývali, ale stále by mali existovať spôsoby, ako pridať textové modifikátory, ako sú zoznamy, tučné písmo, kurzíva atď. Ak teda máme dokument programu Word a potrebujeme vytvoriť ekvivalentný súbor v syntaxi Markdown je ťažké ho manuálne vytvoriť. Problém však môže vyriešiť programové riešenie. Tento článok vysvetlí všetky podrobnosti o tom, ako vyvinúť prevodník word to markdown pomocou Java Cloud SDK.

Word to Markdown Conversion API

Naše REST API s názvom Aspose.Words Cloud je úžasným riešením na implementáciu operácií vytvárania, manipulácie a konverzie dokumentov MS Word do rôznych podporovaných formátov. Teraz, aby sme mohli implementovať rovnaké možnosti konverzie a spracovania dokumentov v aplikácii Java, musíme použiť Aspose.Words Cloud SDK for Java, čo je obal okolo REST API. Takže v prvom kroku využitia SDK musíme pridať jeho referenciu do nášho projektu Java zahrnutím nasledujúcich informácií do pom.xml (projekt typu zostavy maven).

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

Po pridaní referencie SDK do projektu je ďalším dôležitým krokom získanie poverení klienta z Cloud Dashboard. V opačnom prípade si musíte najskôr zaregistrovať bezplatný účet a použiť platnú e-mailovú adresu.

Word to MD v jazyku Java

Táto časť vysvetľuje kroky a súvisiace podrobnosti o tom, ako môžeme previesť Word do formátu MD pomocou útržku kódu Java. Použijeme dve možnosti na načítanie vstupného dokumentu Word, tj z cloudového úložiska alebo lokálneho disku, a potom ho transformujeme do formátu Markdown.

Načítajte dokument programu Word z lokálneho disku

  • Najprv vytvorte inštanciu WordsApi a odovzdajte prispôsobené poverenia ako argumenty
  • Po druhé, prečítajte si obsah vstupného dokumentu programu Word pomocou metódy Files.readAllBytes(…) a získajte vrátenú hodnotu v poli byte[]
  • Po tretie, vytvorte objekt ConvertDocumentRequest, ktorý berie vstupný súbor Word, formát MD a výsledný názov súboru Markdown ako argumenty
  • Teraz zavolajte metódu convertDocument(…) na konverziu Wordu na MD. Výsledný Markdown sa vráti ako tok odpovedí, ktorý sa uloží do inštancie byte[]
  • Nakoniec, ak chcete uložiť výsledný Markdown na lokálny disk, vytvorte objekt FileOutputStream a použite jeho metódu write(…)
// Ďalšie úryvky kódu nájdete na https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// ak je baseUrl null, WordsApi použije predvolenú https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // načítať dokument programu Word z lokálneho systému
        File file1 = new File("sample_EmbeddedOLE.docx");

        // čítať obsah vstupného wordového dokumentu
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // výsledný formát súboru
        String format = "md";

        // vytvoriť požiadavku na konverziu dokumentu, kde poskytneme výsledný názov súboru
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // vykonať konverziu word na markdown a uložiť výstup do bajtového poľa
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // Uložte výslednú dokumentáciu označenia na lokálny disk
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
slovo Markdownovi

Obrázok: - Ukážka konverzie Word na Markdown

Môžete zvážiť stiahnutie vstupného dokumentu programu Word z sampleEmbeddedOLE.docx.

Načítajte dokument Word z cloudového úložiska

  • Podobne najprv musíme vytvoriť inštanciu WordsApi a zároveň odovzdať prispôsobené poverenia ako argumenty
  • Po druhé, vytvorte objekt GetDocumentWithFormatRequest, ktorý berie ako argumenty názov súboru programu Word, formát MD a výsledný názov súboru Markdown.
  • Nakoniec zavolajte metódu getDocumentWithFormat(..), ktorá spustí operáciu prevodu Word na Markdown. Výsledný súbor MD sa uloží do cloudového úložiska
// Ďalšie úryvky kódu nájdete na https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// ak je baseUrl null, WordsApi použije predvolenú https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // teraz vytvorte nový objekt GetDocumentWithFormatRequest 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // teraz zavolajte metódu na spustenie operácie konverzie
        // výsledný súbor je uložený v cloudovom úložisku
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

DOC do Markdown pomocou príkazov cURL

Rozhrania REST API tiež poskytujú flexibilitu prístupu z akejkoľvek platformy pomocou príkazov cURL. Takže v tejto časti budeme diskutovať o podrobnostiach o tom, ako načítať dokument Word z cloudového úložiska, vykonať konverziu DOCX na Markdown a uložiť výsledný súbor MD na lokálny disk. Teraz najprv musíme vygenerovať prístupový token JWT (na základe poverení klienta) pomocou nasledujúceho príkazu a potom vykonať konverziu DOCX na Markdown.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Po vygenerovaní JWT spustite nasledujúci príkaz na načítanie dokumentu Word z cloudového úložiska a vykonanie konverzie Word na Markdown. Výsledný súbor MD sa potom uloží na lokálny disk

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

Záver

Dostali sme sa na koniec tohto článku, kde sme sa dozvedeli podrobnosti o tom, ako môžeme programovo previesť Word na Markdown pomocou Java. Podobne sme tiež preskúmali kroky na konverziu DOCX na Markdown pomocou príkazov cURL.

Ďalšou možnosťou, ako preskúmať možnosti API, je SwaggerUI vo webovom prehliadači. Odporúčame tiež preskúmať Produktovú dokumentáciu, ktorá je úžasným zdrojom informácií o ďalších zaujímavých funkciách. V prípade, že si potrebujete stiahnuť a upraviť zdrojový kód Cloud SDK, je dostupný na GitHub (publikovaný pod licenciou MIT). Nakoniec, v prípade, že sa pri používaní rozhrania API stretnete s akýmikoľvek problémami, môžete zvážiť, či nás požiadate o rýchle riešenie prostredníctvom bezplatného fóra podpory produktov.

Súvisiace články

Ak chcete získať viac informácií, navštívte nasledujúce odkazy: