slovo k markdownu

Převést Word na Markdown v Javě

Microsoft Word se široce používá k vytváření, úpravám a transformaci dokumentů aplikace Word (DOC/DOCX) do různých formátů. Podobně Markdown je lehký značkovací jazyk, který můžete použít k přidání prvků formátování do dokumentů ve formátu prostého textu. Jedná se o prostý textový dokument, který bude čitelný bez tagů, které by vše přehlušovaly, ale stále by měly existovat způsoby, jak přidat textové modifikátory, jako jsou seznamy, tučné písmo, kurzíva atd. Pokud tedy máme dokument aplikace Word a potřebujeme vytvořit ekvivalentní soubor v syntaxi Markdown je obtížné jej ručně vytvořit. Problém však může vyřešit programové řešení. Tento článek vysvětlí všechny podrobnosti o tom, jak vyvinout převodník word to markdown pomocí Java Cloud SDK.

Word to Markdown Conversion API

Naše API založené na REST s názvem Aspose.Words Cloud je úžasným řešením pro implementaci operací vytváření, manipulace a konverze dokumentů MS Word do různých podporovaných formátů. Nyní, abychom mohli implementovat stejné možnosti konverze a zpracování dokumentů v aplikaci Java, musíme použít Aspose.Words Cloud SDK for Java, což je obal kolem REST API. Takže v prvním kroku využití SDK musíme přidat jeho odkaz do našeho projektu Java tím, že zahrneme následující informace do pom.xml (projekt typu sestavení maven).

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

Po přidání reference SDK do projektu je dalším důležitým krokem získání přihlašovacích údajů klienta z Cloud Dashboard. Jinak si musíte nejprve zaregistrovat bezplatný účet a použít platnou e-mailovou adresu.

Word to MD v Javě

Tato část vysvětluje kroky a související podrobnosti o tom, jak můžeme převést Word do formátu MD pomocí fragmentu kódu Java. Použijeme dvě možnosti pro načtení vstupního dokumentu Word, tj. z cloudového úložiště nebo místního disku, a poté jej převedeme do formátu Markdown.

Načtěte dokument Word z místní jednotky

  • Nejprve vytvořte instanci WordsApi a předejte personalizované přihlašovací údaje jako argumenty
  • Za druhé, přečtěte si obsah vstupního dokumentu Word pomocí metody Files.readAllBytes(…) a získejte vrácenou hodnotu v poli byte[]
  • Za třetí vytvořte objekt ConvertDocumentRequest, který jako argumenty převezme vstupní soubor Word, formát MD a výsledný název souboru Markdown
  • Nyní zavolejte metodu convertDocument(…) pro převod Wordu na MD. Výsledný Markdown je vrácen jako tok odpovědí, který se uloží do instance byte[]
  • Nakonec, abyste mohli uložit výsledný Markdown na místní disk, vytvořte objekt FileOutputStream a použijte jeho metodu write(…)
// Další úryvky kódu najdete na https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// pokud je baseUrl null, WordsApi použije výchozí https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // načíst dokument aplikace Word z místního systému
        File file1 = new File("sample_EmbeddedOLE.docx");

        // číst obsah vstupního wordového dokumentu
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // výsledný formát souboru
        String format = "md";

        // vytvořit žádost o konverzi dokumentu, kde poskytneme výsledný název souboru
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // provést konverzi word na markdown a uložit výstup do bajtového pole
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // Uložte výslednou dokumentaci markdown na místní disk
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
slovo Markdownovi

Obrázek: - Náhled převodu Word na Markdown

Můžete zvážit stažení vstupního dokumentu aplikace Word z sampleEmbeddedOLE.docx.

Načtěte dokument Word z cloudového úložiště

  • Podobně nejprve musíme vytvořit instanci WordsApi a přitom předat personalizovaná pověření jako argumenty
  • Za druhé vytvořte objekt GetDocumentWithFormatRequest, který jako argumenty převezme název vstupního souboru Word, formát MD a výsledný název souboru Markdown.
  • Nakonec zavolejte metodu getDocumentWithFormat(..), která spustí operaci převodu Word na Markdown. Výsledný soubor MD se uloží do cloudového úložiště
// Další úryvky kódu najdete na https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// pokud je baseUrl null, WordsApi použije výchozí https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // nyní vytvořte nový objekt GetDocumentWithFormatRequest 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // nyní zavolejte metodu pro zahájení operace převodu
        // výsledný soubor je uložen v cloudovém úložišti
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

DOC do Markdown pomocí příkazů cURL

Rozhraní REST API také poskytují flexibilitu pro přístup z jakékoli platformy pomocí příkazů cURL. V této části tedy probereme podrobnosti o tom, jak načíst dokument Word z cloudového úložiště, provést konverzi DOCX na Markdown a uložit výsledný soubor MD na místní disk. Nyní nejprve musíme vygenerovat přístupový token JWT (na základě přihlašovacích údajů klienta) pomocí následujícího příkazu a poté provést konverzi DOCX na Markdown.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Po vygenerování JWT proveďte následující příkaz pro načtení dokumentu Word z cloudového úložiště a provedení převodu Word na Markdown. Výsledný soubor MD je poté uložen na místní disk

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

Závěr

Dostali jsme se na konec tohoto článku, kde jsme se dozvěděli podrobnosti o tom, jak můžeme programově převést Word na Markdown pomocí Javy. Podobně jsme také prozkoumali kroky pro převod DOCX na Markdown pomocí příkazů cURL.

Další možností, jak prozkoumat možnosti API, je SwaggerUI ve webovém prohlížeči. Doporučujeme také prozkoumat Produktovou dokumentaci, která je úžasným zdrojem informací o dalších zajímavých funkcích. V případě, že potřebujete stáhnout a upravit zdrojový kód Cloud SDK, je k dispozici na GitHub (publikováno pod licencí MIT). A konečně, v případě, že se při používání rozhraní API setkáte s nějakými problémy, můžete zvážit, zda nás kontaktovat pro rychlé vyřešení prostřednictvím bezplatného fóra podpory produktů.

Související články

Další informace naleznete na následujících odkazech: