У нашому повсякденному житті ми маємо справу з документами Microsoft Word (DOC/DOCX) як для особистих, так і для офіційних цілей. Подібним чином ми можемо мати вимогу надати доступ до цих документів через Інтернет, і для того, щоб відкрити/переглянути ці документи, одержувачу потрібні певні програми, наприклад MS Word, OpenOffice тощо. Крім того, деякі обмежувальні середовища можуть не мати дозволу на встановлення будь-яких додаткових програм, тому в таких сценаріях перетворення Word на HTML може бути життєздатним рішенням. Завдяки такому підходу ми можемо легко відкрити документ Word у веб-браузері (без встановлення додаткового програмного забезпечення). Отже, у цій статті пояснюється, як перетворити Word на HTML за допомогою Java Cloud SDK.
- REST API для перетворення Word у HTML
- Перетворення Word на HTML у Java
- DOCX у HTML за допомогою команд cURL
REST API для перетворення Word у HTML
Aspose.Words Cloud — це рішення на основі REST, яке пропонує можливості програмного створення, редагування та перетворення документів MS Word у різні підтримувані формати. Відповідно до змісту цієї статті ми збираємося використовувати Aspose.Words Cloud SDK для Java, який дає нам змогу використовувати всі можливості перетворення документів Word у програмі Java. Отже, щоб використовувати цей SDK, нам потрібно додати його посилання в наш проект Java, включивши наступну інформацію в pom.xml (проект типу збірки maven).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Наступним важливим кроком є отримання облікових даних клієнта з Cloud Dashboard. Якщо ви ще не зареєстровані, вам потрібно спочатку зареєструвати безкоштовний обліковий запис за допомогою дійсної електронної адреси, а потім отримати облікові дані.
Перетворення Word на HTML у Java
Ми збираємося обговорити кроки та пов’язані з ними деталі щодо того, як перетворити Word на HTML за допомогою фрагмента коду Java.
- Створіть об’єкт WordsApi, де ми передамо персоналізовані облікові дані як аргументи
- Тепер завантажте вхідний вміст документа Word за допомогою методу readAllBytes(…) і отримайте повернуте значення в масиві byte[]
- Наступним кроком є створення об’єкта класу ConvertDocumentRequest, який приймає вхідний файл Word, формат HTML і результуюче ім’я файлу як аргументи
- Нарешті, викличте метод convertDocument(…), щоб виконати перетворення Word у HTML. Після успішного перетворення отриманий HTML-документ зберігається в хмарному сховищі
// Щоб отримати додаткові фрагменти коду, будь ласка, https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// якщо baseUrl має значення null, WordsApi використовує https://api.aspose.cloud за замовчуванням
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// завантажити документ Word з локальної системи
File file1 = new File("test_multi_pages.docx");
// прочитати вміст вхідного документа word
byte[] documentStream = Files.readAllBytes(file1.toPath());
// результуючий формат файлу
String format = "html";
// створити запит на перетворення документа, де ми надамо результуючу назву файлу
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, "output.html",null, null, null);
// виконати перетворення слова в html
wordsApi.convertDocument(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
Зразок документа Word, використаний у прикладі вище, можна завантажити з testmultipages.docx.
DOCX у HTML за допомогою команд cURL
API REST забезпечують легкий доступ за допомогою команд cURL на будь-якій платформі. Тому в цьому розділі ми збираємося обговорити деталі того, як конвертувати DOCX у HTML за допомогою команд cURL. Тож першим кроком є створення маркера доступу JWT (на основі облікових даних клієнта) за допомогою наступної команди.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Тепер нам потрібно виконати наступну команду, щоб виконати перетворення Word у HTML, де очікується, що вхідний документ Word буде доступним у хмарному сховищі, а після перетворення ми збережемо отриманий HTML-документ на локальному диску.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.html"
Ми також можемо зберегти отриманий файл безпосередньо в хмарному сховищі, і з цієї причини нам просто потрібно надати значення для параметра outPath (як показано нижче)
curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html&outPath=output.html" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Висновок
Тепер, коли ми дійшли до кінця цієї статті, ми дізналися подробиці про те, як програмно перетворити Word на HTML за допомогою Java. Ми також бачили варіанти перетворення DOCX на HTML за допомогою команд cURL. Для швидкого тестування ви також можете спробувати отримати доступ до API через SwaggerUI у веб-переглядачі та водночас розглянути Документацію продукту, яка є чудовим джерелом інформації.
Якщо вам знадобиться завантажити та змінити вихідний код Cloud SDK, він є у вільному доступі на GitHub (опубліковано за ліцензією MIT). Нарешті, якщо у вас виникнуть проблеми під час використання API або у вас виникне пов’язаний запит, ви можете звернутися до нас за швидким вирішенням через безкоштовний форум підтримки продукту.
Схожі статті
Перейдіть за наведеними нижче посиланнями, щоб дізнатися більше про: