Microsoft Word banyak digunakan untuk membuat, mengedit, dan mengubah dokumen Word (DOC/DOCX) ke dalam berbagai format. Demikian pula, Markdown adalah bahasa markup ringan yang dapat Anda gunakan untuk menambahkan elemen pemformatan ke dokumen teks biasa. Ini adalah dokumen teks biasa yang dapat dibaca tanpa tag yang mengacaukan semuanya, tetapi masih ada cara untuk menambahkan pengubah teks seperti daftar, huruf tebal, huruf miring, dll. Jadi jika kita memiliki dokumen Word dan kita perlu membuat file yang setara dalam sintaks Markdown, sulit untuk membuatnya secara manual. Namun, solusi terprogram dapat memecahkan masalah. Artikel ini akan menjelaskan semua detail tentang cara mengembangkan konverter word to markdown menggunakan Java Cloud SDK.
API Konversi Word ke Markdown
API berbasis REST kami bernama Aspose.Words Cloud adalah solusi luar biasa untuk menerapkan operasi pembuatan, manipulasi, dan konversi dokumen MS Word ke berbagai format yang didukung. Sekarang untuk mengimplementasikan konversi dokumen dan kemampuan pemrosesan yang sama dalam aplikasi Java, kita perlu menggunakan Aspose.Words Cloud SDK for Java yang merupakan pembungkus dari REST API. Jadi pada langkah pertama pemanfaatan SDK, kita perlu menambahkan referensinya di proyek Java kita dengan memasukkan informasi berikut di pom.xml (proyek tipe maven build).
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
Setelah referensi SDK ditambahkan dalam proyek, langkah penting berikutnya adalah mendapatkan kredensial klien Anda dari Cloud Dashboard. Jika tidak, Anda harus terlebih dahulu mendaftarkan akun gratis saat menggunakan alamat email yang valid.
Kata ke MD di Jawa
Bagian ini menjelaskan langkah-langkah & detail terkait tentang cara mengonversi format Word ke MD menggunakan cuplikan kode Java. Kami akan menggunakan dua opsi untuk memuat Dokumen Word input yaitu dari penyimpanan Cloud atau drive lokal, dan kemudian mengubahnya menjadi format Markdown.
Muat Dokumen Word dari drive lokal
- Pertama-tama, buat instance WordsApi dan berikan kredensial yang dipersonalisasi sebagai argumen
- Kedua, baca konten dokumen Word input menggunakan metode Files.readAllBytes(…) dan dapatkan nilai yang dikembalikan dalam array byte[]
- Ketiga, buat objek ConvertDocumentRequest yang menggunakan file Word input, format MD, dan nama file Markdown yang dihasilkan sebagai argumen
- Sekarang, panggil metode convertDocument(…) untuk konversi Word ke MD. Markdown yang dihasilkan dikembalikan sebagai aliran respons, untuk disimpan ke dalam instance byte[].
- Terakhir, untuk menyimpan Markdown yang dihasilkan ke drive lokal, buat objek FileOutputStream dan gunakan metode write(…)
// Untuk cuplikan kode lainnya, silakan https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// jika baseUrl adalah null, WordsApi menggunakan default https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// memuat dokumen kata dari sistem lokal
File file1 = new File("sample_EmbeddedOLE.docx");
// membaca isi dokumen kata masukan
byte[] documentStream = Files.readAllBytes(file1.toPath());
// format file yang dihasilkan
String format = "md";
// buat permintaan konversi Dokumen tempat kami memberikan nama file yang dihasilkan
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// melakukan konversi kata ke markdown dan menyimpan output dalam byte Array
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// Simpan dokumentasi penurunan harga yang dihasilkan ke drive lokal
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
Anda dapat mempertimbangkan mengunduh dokumen Word masukan dari sampleEmbeddedOLE.docx.
Muat Dokumen Word dari Cloud Storage
- Demikian pula, pertama-tama kita perlu membuat instance WordsApi sambil mengirimkan kredensial yang dipersonalisasi sebagai argumen
- Kedua, buat objek GetDocumentWithFormatRequest yang menggunakan nama file Word input, format MD, dan nama file Markdown yang dihasilkan sebagai argumen
- Terakhir, panggil metode getDocumentWithFormat(..) yang memicu operasi konversi Word ke Markdown. File MD yang dihasilkan disimpan di penyimpanan Cloud
// Untuk cuplikan kode lainnya, silakan https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// jika baseUrl adalah null, WordsApi menggunakan default https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// sekarang buat objek baru GetDocumentWithFormatRequest
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// sekarang panggil metode untuk memulai operasi konversi
// file yang dihasilkan disimpan di penyimpanan cloud
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC ke Markdown menggunakan Perintah cURL
REST API juga menyediakan fleksibilitas untuk diakses dari platform apa pun dengan bantuan perintah cURL. Jadi di bagian ini, kita akan membahas detail tentang cara memuat dokumen Word dari penyimpanan Cloud, melakukan konversi DOCX ke Markdown dan menyimpan file MD yang dihasilkan di drive lokal. Sekarang pertama-tama kita perlu membuat token akses JWT (berdasarkan kredensial klien) menggunakan perintah berikut dan kemudian melakukan konversi DOCX ke Markdown.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Setelah JWT dibuat, harap jalankan perintah berikut untuk memuat dokumen Word dari penyimpanan Cloud dan melakukan konversi Word ke Markdown. File MD yang dihasilkan kemudian disimpan di drive lokal
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
Kesimpulan
Kami telah mencapai akhir artikel ini di mana kami telah mempelajari detail tentang bagaimana kami dapat mengonversi Word menjadi Markdown secara terprogram menggunakan Java. Demikian pula, kami juga telah mempelajari langkah-langkah untuk mengonversi DOCX ke Markdown melalui perintah cURL.
Opsi lain untuk menjelajahi kemampuan API adalah melalui SwaggerUI di dalam browser web. Kami juga merekomendasikan untuk menjelajahi Dokumentasi Produk yang merupakan sumber informasi yang luar biasa untuk mempelajari tentang fitur menarik lainnya. Jika Anda perlu mengunduh dan memodifikasi kode sumber Cloud SDK, tersedia di GitHub (diterbitkan di bawah lisensi MIT). Terakhir, jika Anda mengalami masalah apa pun saat menggunakan API, Anda dapat mempertimbangkan untuk menghubungi kami untuk mendapatkan penyelesaian cepat melalui forum dukungan produk gratis.
Artikel Terkait
Silakan kunjungi tautan berikut untuk mempelajari lebih lanjut tentang: