Microsoft Word шырока выкарыстоўваецца для стварэння, рэдагавання і пераўтварэння дакументаў Word (DOC/DOCX) у розныя фарматы. Аналагічным чынам, Markdown - гэта лёгкая мова разметкі, якую можна выкарыстоўваць для дадання элементаў фарматавання ў простыя тэкставыя дакументы. Гэта просты тэкставы дакумент, які можна чытаць без тэгаў, якія блытаюць усё, але ўсё роўна павінны быць спосабы дадаць тэкставыя мадыфікатары, такія як спісы, паўтлусты шрыфт, курсіў і г.д. Такім чынам, калі ў нас ёсць дакумент Word і нам трэба стварыць эквівалентны файл у сінтаксісе Markdown становіцца цяжка стварыць яго ўручную. Аднак праграмнае рашэнне можа вырашыць праблему. У гэтым артыкуле будуць растлумачаны ўсе дэталі таго, як распрацаваць канвэртар слоў у ўцэнку з дапамогай Java Cloud SDK.
Word to Markdown Conversion API
Наш API на аснове REST пад назвай Aspose.Words Cloud з’яўляецца дзіўным рашэннем для рэалізацыі аперацый па стварэнні дакументаў MS Word, апрацоўцы і пераўтварэнні ў розныя падтрымоўваныя фарматы. Цяпер, каб рэалізаваць такія ж магчымасці пераўтварэння і апрацоўкі дакументаў у дадатку Java, нам трэба выкарыстоўваць Aspose.Words Cloud SDK для Java, які з’яўляецца абалонкай вакол REST API. Такім чынам, на першым этапе выкарыстання SDK нам трэба дадаць спасылку на яго ў наш праект Java, уключыўшы наступную інфармацыю ў pom.xml (праект тыпу зборкі Maven).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Пасля дадання спасылкі на SDK у праект наступным важным крокам з’яўляецца атрыманне ўліковых даных кліента з Cloud Dashboard. У адваротным выпадку вам трэба спачатку зарэгістраваць бясплатны рахунак, выкарыстоўваючы сапраўдны адрас электроннай пошты.
Word to MD на Java
У гэтым раздзеле тлумачацца крокі і адпаведныя падрабязнасці таго, як мы можам пераўтварыць Word у фармат MD з дапамогай фрагмента кода Java. Мы збіраемся выкарыстоўваць два варыянты для загрузкі ўваходнага дакумента Word, напрыклад, з воблачнага сховішча або лакальнага дыска, а затым пераўтварыць яго ў фармат Markdown.
Загрузіце дакумент Word з лакальнага дыска
- Перш за ўсё, стварыце асобнік WordsApi і перадайце персаналізаваныя ўліковыя даныя ў якасці аргументаў
- Па-другое, прачытаць змесціва ўваходнага дакумента Word з дапамогай метаду Files.readAllBytes(…) і атрымаць вернутае значэнне ў масіве byte[]
- Па-трэцяе, стварыце аб’ект ConvertDocumentRequest, які прымае ўваходны файл Word, фармат MD і выніковае імя файла Markdown у якасці аргументаў
- Цяпер выклічце метад convertDocument(…) для пераўтварэння Word у MD. Выніковая разметка вяртаецца ў выглядзе патоку адказу, які захоўваецца ў асобніку byte[].
- Нарэшце, каб захаваць атрыманы Markdown на лакальны дыск, стварыце аб’ект FileOutputStream і выкарыстоўвайце яго метад write(…)
// Для атрымання дадатковых фрагментаў кода, калі ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// калі baseUrl роўны нулю, WordsApi выкарыстоўвае https://api.aspose.cloud па змаўчанні
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// загрузіць дакумент word з лакальнай сістэмы
File file1 = new File("sample_EmbeddedOLE.docx");
// прачытаць змесціва дакумента Word
byte[] documentStream = Files.readAllBytes(file1.toPath());
// выніковы фармат файла
String format = "md";
// стварыць запыт на пераўтварэнне дакумента, у якім мы прадстаўляем выніковае імя файла
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// выканаць пераўтварэнне слова ў ўцэнку і захаваць вывад у байтавым масіве
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// Захавайце выніковую дакументацыю па ўцэнцы на лакальны дыск
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
Вы можаце загрузіць дакумент Word з sampleEmbeddedOLE.docx.
Загрузіце дакумент Word з воблачнага сховішча
- Аналагічным чынам спачатку нам трэба стварыць асобнік WordsApi, перадаючы персаналізаваныя ўліковыя даныя ў якасці аргументаў
- Па-другое, стварыце аб’ект GetDocumentWithFormatRequest, які прымае ў якасці аргументаў назву файла Word, фармат MD і выніковае імя файла Markdown
- Нарэшце, выклічце метад getDocumentWithFormat(..), які запускае аперацыю пераўтварэння Word у Markdown. Атрыманы файл MD захоўваецца ў воблачным сховішчы
// Для атрымання дадатковых фрагментаў кода, калі ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// калі baseUrl роўны нулю, WordsApi выкарыстоўвае https://api.aspose.cloud па змаўчанні
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// цяпер стварыце новы аб'ект GetDocumentWithFormatRequest
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// зараз выклічце метад, каб пачаць аперацыю пераўтварэння
// выніковы файл захоўваецца ў воблачным сховішчы
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC у Markdown з дапамогай каманд cURL
API REST таксама забяспечваюць гнуткасць доступу з любой платформы з дапамогай каманд cURL. Такім чынам, у гэтым раздзеле мы збіраемся абмеркаваць падрабязнасці таго, як загрузіць дакумент Word з воблачнага сховішча, выканаць пераўтварэнне DOCX у Markdown і захаваць атрыманы файл MD на лакальным дыску. Цяпер спачатку нам трэба згенераваць маркер доступу JWT (на аснове ўліковых дадзеных кліента), выкарыстоўваючы наступную каманду, а затым выканаць пераўтварэнне DOCX у Markdown.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Пасля стварэння JWT выканайце наступную каманду, каб загрузіць дакумент Word з воблачнага сховішча і выканаць пераўтварэнне Word у Markdown. Затым атрыманы файл MD захоўваецца на лакальным дыску
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
Заключэнне
Мы падышлі да канца гэтага артыкула, дзе мы даведаліся падрабязнасці аб тым, як мы можам праграмна пераўтварыць Word у Markdown з дапамогай Java. Аналагічным чынам мы таксама вывучылі этапы пераўтварэння DOCX у Markdown з дапамогай каманд cURL.
Іншы варыянт вывучэння магчымасцей API - праз SwaggerUI у вэб-браўзеры. Мы таксама рэкамендуем азнаёміцца з Дакументацыяй па прадукту, якая з’яўляецца цудоўнай крыніцай інфармацыі, каб даведацца пра іншыя цікавыя магчымасці. Калі вам спатрэбіцца загрузіць і змяніць зыходны код Cloud SDK, ён даступны на GitHub (публікуецца па ліцэнзіі MIT). Нарэшце, калі ў вас узнікнуць праблемы пры выкарыстанні API, вы можаце звярнуцца да нас для хуткага вырашэння праблемы праз бясплатны форум падтрымкі прадукту.
Звязаныя артыкулы
Перайдзіце па наступных спасылках, каб даведацца больш пра: