Microsoft Word широко використовується для створення, редагування та перетворення документів Word (DOC/DOCX) у різні формати. Подібним чином Markdown — це полегшена мова розмітки, яку можна використовувати для додавання елементів форматування до простих текстових документів. Це звичайний текстовий документ, який можна читати без тегів, які все плутають, але все одно повинні бути способи додавання модифікаторів тексту, таких як списки, жирний шрифт, курсив тощо. Отже, якщо у нас є документ Word і нам потрібно створити еквівалентний файл у синтаксисі Markdown стає важко створити його вручну. Однак програмне рішення може вирішити проблему. Ця стаття пояснить усі деталі того, як розробити конвертер Word to Markdown за допомогою Java Cloud SDK.
Word to Markdown Conversion API
Наш API на основі REST під назвою Aspose.Words Cloud є чудовим рішенням для реалізації операцій створення документів MS Word, обробки та перетворення в різні підтримувані формати. Тепер, щоб реалізувати такі ж можливості перетворення та обробки документів у програмі Java, нам потрібно використовувати Aspose.Words Cloud SDK для Java, який є оболонкою REST API. Отже, на першому кроці використання SDK нам потрібно додати його посилання в наш проект Java, включивши наступну інформацію в pom.xml (проект типу збірки maven).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Після додавання посилання SDK у проект наступним важливим кроком стане отримання облікових даних клієнта з Cloud Dashboard. В іншому випадку вам потрібно спочатку зареєструвати безкоштовний обліковий запис, використовуючи дійсну адресу електронної пошти.
Word to MD на Java
У цьому розділі пояснюється кроки та відповідні деталі того, як ми можемо перетворити Word у формат MD за допомогою фрагмента коду Java. Ми будемо використовувати два варіанти завантаження вхідного документа Word, тобто форму хмарного сховища або локального диска, а потім перетворимо його у формат Markdown.
Завантажте документ Word з локального диска
- Перш за все, створіть екземпляр WordsApi і передайте персоналізовані облікові дані як аргументи
- По-друге, прочитайте вміст вхідного документа Word за допомогою методу Files.readAllBytes(…) і отримайте повернуте значення в масиві byte[].
- По-третє, створіть об’єкт ConvertDocumentRequest, який приймає вхідний файл Word, формат MD і результуюче ім’я файлу Markdown як аргументи
- Тепер викличте метод convertDocument(…) для перетворення Word у MD. Результат Markdown повертається як потік відповіді, який буде збережено в екземплярі byte[].
- Нарешті, щоб зберегти отриманий Markdown на локальний диск, створіть об’єкт FileOutputStream і скористайтеся його методом write(…)
// Щоб отримати додаткові фрагменти коду, будь ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// якщо baseUrl має значення null, WordsApi використовує https://api.aspose.cloud за замовчуванням
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// завантажити документ Word з локальної системи
File file1 = new File("sample_EmbeddedOLE.docx");
// прочитати вміст вхідного документа word
byte[] documentStream = Files.readAllBytes(file1.toPath());
// результуючий формат файлу
String format = "md";
// створити запит на перетворення документа, де ми надамо результуючу назву файлу
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// виконати перетворення слова в уцінку та зберегти результат у масиві байтів
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// Збережіть отриману документацію про уцінку на локальному диску
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
Ви можете завантажити вхідний документ Word із sampleEmbeddedOLE.docx.
Завантажте документ Word із хмарного сховища
- Так само спочатку нам потрібно створити екземпляр WordsApi, передаючи персоналізовані облікові дані як аргументи
- По-друге, створіть об’єкт GetDocumentWithFormatRequest, який приймає вхідне ім’я файлу Word, формат MD і результуюче ім’я файлу Markdown як аргументи
- Нарешті, викличте метод getDocumentWithFormat(..), який ініціює операцію перетворення Word у Markdown. Отриманий файл MD зберігається в хмарному сховищі
// Щоб отримати додаткові фрагменти коду, будь ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// якщо baseUrl має значення null, WordsApi використовує https://api.aspose.cloud за замовчуванням
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// тепер створіть новий об’єкт GetDocumentWithFormatRequest
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// тепер викличте метод для ініціювання операції перетворення
// отриманий файл зберігається в хмарному сховищі
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC у Markdown за допомогою команд cURL
REST API також забезпечує гнучкість доступу з будь-якої платформи за допомогою команд cURL. Тож у цьому розділі ми збираємося обговорити деталі того, як завантажити документ Word із хмарного сховища, виконати перетворення DOCX у Markdown і зберегти отриманий файл MD на локальному диску. Тепер спочатку нам потрібно створити маркер доступу JWT (на основі облікових даних клієнта) за допомогою наступної команди, а потім виконати перетворення DOCX у Markdown.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Після створення JWT виконайте таку команду, щоб завантажити документ Word із хмарного сховища та виконати перетворення Word у Markdown. Потім отриманий файл MD зберігається на локальному диску
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
Висновок
Ми дійшли до кінця цієї статті, де ми дізналися подробиці про те, як ми можемо програмно конвертувати Word у Markdown за допомогою Java. Подібним чином ми дослідили кроки для перетворення DOCX у Markdown за допомогою команд cURL.
Ще один варіант вивчення можливостей API — це SwaggerUI у веб-переглядачі. Ми також рекомендуємо ознайомитися з Документацією продукту, яка є чудовим джерелом інформації, щоб дізнатися про інші цікаві функції. Якщо вам потрібно завантажити та змінити вихідний код Cloud SDK, він доступний на GitHub (опубліковано за ліцензією MIT). Нарешті, якщо у вас виникнуть проблеми під час використання API, ви можете звернутися до нас за швидким вирішенням через безкоштовний форум підтримки продуктів.
Схожі статті
Перейдіть за наведеними нижче посиланнями, щоб дізнатися більше про: