слова да ўцэнкі

Пераўтварыце Word у Markdown у Java

Microsoft Word шырока выкарыстоўваецца для стварэння, рэдагавання і пераўтварэння дакументаў Word (DOC/DOCX) у розныя фарматы. Аналагічным чынам, Markdown - гэта лёгкая мова разметкі, якую можна выкарыстоўваць для дадання элементаў фарматавання ў простыя тэкставыя дакументы. Гэта просты тэкставы дакумент, які можна чытаць без тэгаў, якія блытаюць усё, але ўсё роўна павінны быць спосабы дадаць тэкставыя мадыфікатары, такія як спісы, паўтлусты шрыфт, курсіў і г.д. Такім чынам, калі ў нас ёсць дакумент Word і нам трэба стварыць эквівалентны файл у сінтаксісе Markdown становіцца цяжка стварыць яго ўручную. Аднак праграмнае рашэнне можа вырашыць праблему. У гэтым артыкуле будуць растлумачаны ўсе дэталі таго, як распрацаваць канвэртар слоў у ўцэнку з дапамогай Java Cloud SDK.

Word to Markdown Conversion API

Наш API на аснове REST пад назвай Aspose.Words Cloud з’яўляецца дзіўным рашэннем для рэалізацыі аперацый па стварэнні дакументаў MS Word, апрацоўцы і пераўтварэнні ў розныя падтрымоўваныя фарматы. Цяпер, каб рэалізаваць такія ж магчымасці пераўтварэння і апрацоўкі дакументаў у дадатку Java, нам трэба выкарыстоўваць Aspose.Words Cloud SDK для Java, які з’яўляецца абалонкай вакол REST API. Такім чынам, на першым этапе выкарыстання SDK нам трэба дадаць спасылку на яго ў наш праект Java, уключыўшы наступную інфармацыю ў pom.xml (праект тыпу зборкі Maven).

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

Пасля дадання спасылкі на SDK у праект наступным важным крокам з’яўляецца атрыманне ўліковых даных кліента з Cloud Dashboard. У адваротным выпадку вам трэба спачатку зарэгістраваць бясплатны рахунак, выкарыстоўваючы сапраўдны адрас электроннай пошты.

Word to MD на Java

У гэтым раздзеле тлумачацца крокі і адпаведныя падрабязнасці таго, як мы можам пераўтварыць Word у фармат MD з дапамогай фрагмента кода Java. Мы збіраемся выкарыстоўваць два варыянты для загрузкі ўваходнага дакумента Word, напрыклад, з воблачнага сховішча або лакальнага дыска, а затым пераўтварыць яго ў фармат Markdown.

Загрузіце дакумент Word з лакальнага дыска

  • Перш за ўсё, стварыце асобнік WordsApi і перадайце персаналізаваныя ўліковыя даныя ў якасці аргументаў
  • Па-другое, прачытаць змесціва ўваходнага дакумента Word з дапамогай метаду Files.readAllBytes(…) і атрымаць вернутае значэнне ў масіве byte[]
  • Па-трэцяе, стварыце аб’ект ConvertDocumentRequest, які прымае ўваходны файл Word, фармат MD і выніковае імя файла Markdown у якасці аргументаў
  • Цяпер выклічце метад convertDocument(…) для пераўтварэння Word у MD. Выніковая разметка вяртаецца ў выглядзе патоку адказу, які захоўваецца ў асобніку byte[].
  • Нарэшце, каб захаваць атрыманы Markdown на лакальны дыск, стварыце аб’ект FileOutputStream і выкарыстоўвайце яго метад write(…)
// Для атрымання дадатковых фрагментаў кода, калі ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// калі baseUrl роўны нулю, WordsApi выкарыстоўвае https://api.aspose.cloud па змаўчанні
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // загрузіць дакумент word з лакальнай сістэмы
        File file1 = new File("sample_EmbeddedOLE.docx");

        // прачытаць змесціва дакумента Word
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // выніковы фармат файла
        String format = "md";

        // стварыць запыт на пераўтварэнне дакумента, у якім мы прадстаўляем выніковае імя файла
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // выканаць пераўтварэнне слова ў ўцэнку і захаваць вывад у байтавым масіве
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // Захавайце выніковую дакументацыю па ўцэнцы на лакальны дыск
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
слова ў Markdown

Малюнак: - Папярэдні прагляд пераўтварэння Word у Markdown

Вы можаце загрузіць дакумент Word з sampleEmbeddedOLE.docx.

Загрузіце дакумент Word з воблачнага сховішча

  • Аналагічным чынам спачатку нам трэба стварыць асобнік WordsApi, перадаючы персаналізаваныя ўліковыя даныя ў якасці аргументаў
  • Па-другое, стварыце аб’ект GetDocumentWithFormatRequest, які прымае ў якасці аргументаў назву файла Word, фармат MD і выніковае імя файла Markdown
  • Нарэшце, выклічце метад getDocumentWithFormat(..), які запускае аперацыю пераўтварэння Word у Markdown. Атрыманы файл MD захоўваецца ў воблачным сховішчы
// Для атрымання дадатковых фрагментаў кода, калі ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// калі baseUrl роўны нулю, WordsApi выкарыстоўвае https://api.aspose.cloud па змаўчанні
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // цяпер стварыце новы аб'ект GetDocumentWithFormatRequest 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // зараз выклічце метад, каб пачаць аперацыю пераўтварэння
        // выніковы файл захоўваецца ў воблачным сховішчы
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

DOC у Markdown з дапамогай каманд cURL

API REST таксама забяспечваюць гнуткасць доступу з любой платформы з дапамогай каманд cURL. Такім чынам, у гэтым раздзеле мы збіраемся абмеркаваць падрабязнасці таго, як загрузіць дакумент Word з воблачнага сховішча, выканаць пераўтварэнне DOCX у Markdown і захаваць атрыманы файл MD на лакальным дыску. Цяпер спачатку нам трэба згенераваць маркер доступу JWT (на аснове ўліковых дадзеных кліента), выкарыстоўваючы наступную каманду, а затым выканаць пераўтварэнне DOCX у Markdown.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Пасля стварэння JWT выканайце наступную каманду, каб загрузіць дакумент Word з воблачнага сховішча і выканаць пераўтварэнне Word у Markdown. Затым атрыманы файл MD захоўваецца на лакальным дыску

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

Заключэнне

Мы падышлі да канца гэтага артыкула, дзе мы даведаліся падрабязнасці аб тым, як мы можам праграмна пераўтварыць Word у Markdown з дапамогай Java. Аналагічным чынам мы таксама вывучылі этапы пераўтварэння DOCX у Markdown з дапамогай каманд cURL.

Іншы варыянт вывучэння магчымасцей API - праз SwaggerUI у вэб-браўзеры. Мы таксама рэкамендуем азнаёміцца з Дакументацыяй па прадукту, якая з’яўляецца цудоўнай крыніцай інфармацыі, каб даведацца пра іншыя цікавыя магчымасці. Калі вам спатрэбіцца загрузіць і змяніць зыходны код Cloud SDK, ён даступны на GitHub (публікуецца па ліцэнзіі MIT). Нарэшце, калі ў вас узнікнуць праблемы пры выкарыстанні API, вы можаце звярнуцца да нас для хуткага вырашэння праблемы праз бясплатны форум падтрымкі прадукту.

Звязаныя артыкулы

Перайдзіце па наступных спасылках, каб даведацца больш пра: