Microsoft Word ใช้กันอย่างแพร่หลายในการสร้าง แก้ไข และแปลงเอกสาร Word (DOC/DOCX) เป็นรูปแบบต่างๆ ในทำนองเดียวกัน Markdown เป็นภาษามาร์กอัปขนาดเล็กที่คุณสามารถใช้เพื่อเพิ่มองค์ประกอบการจัดรูปแบบให้กับเอกสารข้อความล้วน เป็นเอกสารข้อความธรรมดาที่สามารถอ่านได้โดยไม่ต้องมีแท็กที่ทำให้สับสน แต่ก็ยังมีวิธีเพิ่มตัวแก้ไขข้อความ เช่น รายการ ตัวหนา ตัวเอียง ฯลฯ ดังนั้น หากเรามีเอกสาร Word และเราจำเป็นต้องสร้างไฟล์ที่เทียบเท่า ในไวยากรณ์ของ Markdown การสร้างด้วยตนเองเป็นเรื่องยาก อย่างไรก็ตาม โซลูชันแบบเป็นโปรแกรมสามารถแก้ปัญหาได้ บทความนี้จะอธิบายรายละเอียดทั้งหมดเกี่ยวกับวิธีการพัฒนาตัวแปลง word เป็น markdown โดยใช้ Java Cloud SDK
API การแปลง Word เป็น Markdown
API ที่ใช้ REST ของเราชื่อ Aspose.Words Cloud เป็นโซลูชันที่ยอดเยี่ยมในการปรับใช้การสร้าง การจัดการ และการแปลงเอกสาร MS Word เป็น รูปแบบที่รองรับ ที่หลากหลาย ในตอนนี้ เพื่อใช้ความสามารถในการแปลงเอกสารและการประมวลผลแบบเดียวกันในแอปพลิเคชัน Java เราจำเป็นต้องใช้ Aspose.Words Cloud SDK for Java ซึ่งเป็นตัวห่อหุ้มรอบ REST API ดังนั้นในขั้นตอนแรกของการใช้งาน SDK เราจำเป็นต้องเพิ่มการอ้างอิงในโครงการ Java ของเราโดยใส่ข้อมูลต่อไปนี้ใน pom.xml (โครงการประเภท maven build)
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
เมื่อเพิ่มข้อมูลอ้างอิง SDK ในโครงการแล้ว ขั้นตอนสำคัญถัดไปคือการขอรับข้อมูลรับรองไคลเอ็นต์จาก Cloud Dashboard มิฉะนั้น คุณต้องลงทะเบียนบัญชีฟรีก่อนในขณะที่ใช้ที่อยู่อีเมลที่ถูกต้อง
Word to MD ใน Java
ส่วนนี้อธิบายขั้นตอนและรายละเอียดที่เกี่ยวข้องเกี่ยวกับวิธีที่เราสามารถแปลงรูปแบบ Word เป็น MD โดยใช้ข้อมูลโค้ด Java เราจะใช้สองตัวเลือกในการโหลดเอกสาร Word อินพุต เช่น จากที่เก็บข้อมูลบนคลาวด์หรือไดรฟ์ในเครื่อง จากนั้นแปลงเป็นรูปแบบ Markdown
โหลดเอกสาร Word จากไดรฟ์ในเครื่อง
- ก่อนอื่น สร้างอินสแตนซ์ของ WordsApi และส่งข้อมูลส่วนตัวเป็นอาร์กิวเมนต์
- ประการที่สอง อ่านเนื้อหาของเอกสาร Word ที่ป้อนโดยใช้เมธอด Files.readAllBytes(…) และรับค่าที่ส่งคืนในอาร์เรย์ไบต์[]
- ประการที่สาม สร้างวัตถุของ ConvertDocumentRequest ซึ่งรับไฟล์ Word อินพุต รูปแบบ MD และชื่อไฟล์ Markdown ที่เป็นผลลัพธ์เป็นอาร์กิวเมนต์
- ตอนนี้ โทรเมธอด converterDocument(…) สำหรับการแปลง Word เป็น MD Markdown ที่เป็นผลลัพธ์จะถูกส่งกลับเป็นสตรีมตอบกลับ เพื่อบันทึกลงในอินสแตนซ์ byte[]
- สุดท้าย เพื่อบันทึกผลลัพธ์ Markdown ไปยังไดรฟ์ในเครื่อง ให้สร้างวัตถุของ FileOutputStream และใช้วิธีการเขียน (…)
// สำหรับข้อมูลโค้ดเพิ่มเติม โปรด https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// โหลดเอกสารคำจากระบบภายในเครื่อง
File file1 = new File("sample_EmbeddedOLE.docx");
// อ่านเนื้อหาของเอกสารคำที่ป้อน
byte[] documentStream = Files.readAllBytes(file1.toPath());
// รูปแบบไฟล์ผลลัพธ์
String format = "md";
// สร้างคำขอแปลงเอกสารที่เราระบุชื่อไฟล์ที่เป็นผลลัพธ์
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// ทำการแปลงคำเป็นมาร์กดาวน์และบันทึกเอาต์พุตเป็นไบต์อาร์เรย์
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// บันทึกเอกสารมาร์กดาวน์ที่เป็นผลลัพธ์ลงในไดรฟ์ในเครื่อง
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
คุณอาจลองดาวน์โหลดเอกสาร Word ที่ป้อนจาก sampleEmbeddedOLE.docx
โหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์
- ในทำนองเดียวกัน อันดับแรกเราต้องสร้างอินสแตนซ์ของ WordsApi ในขณะที่ส่งข้อมูลรับรองส่วนบุคคลเป็นอาร์กิวเมนต์
- ประการที่สอง สร้างวัตถุของ GetDocumentWithFormatRequest ซึ่งใช้ชื่อไฟล์ Word, รูปแบบ MD และชื่อไฟล์ Markdown ที่เป็นผลลัพธ์เป็นอาร์กิวเมนต์
- สุดท้าย เรียกใช้เมธอด getDocumentWithFormat(..) ซึ่งทริกเกอร์การดำเนินการแปลง Word เป็น Markdown ไฟล์ MD ที่เป็นผลลัพธ์จะถูกบันทึกในที่เก็บข้อมูลบนคลาวด์
// สำหรับข้อมูลโค้ดเพิ่มเติม โปรด https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// ตอนนี้สร้างวัตถุใหม่ของ GetDocumentWithFormatRequest
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// ตอนนี้เรียกเมธอดเพื่อเริ่มต้นการดำเนินการแปลง
// ไฟล์ผลลัพธ์จะถูกเก็บไว้ในที่เก็บข้อมูลบนคลาวด์
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
DOC เป็น Markdown โดยใช้คำสั่ง cURL
REST APIs ยังให้ความยืดหยุ่นในการเข้าถึงจากทุกแพลตฟอร์มด้วยความช่วยเหลือของคำสั่ง cURL ดังนั้นในส่วนนี้ เราจะพูดถึงรายละเอียดเกี่ยวกับวิธีโหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์ ทำการแปลง DOCX เป็น Markdown และบันทึกไฟล์ MD ที่เป็นผลลัพธ์ลงในไดรฟ์ในเครื่อง ก่อนอื่นเราต้องสร้างโทเค็นการเข้าถึง JWT (ตามข้อมูลรับรองลูกค้า) โดยใช้คำสั่งต่อไปนี้ จากนั้นทำการแปลง DOCX เป็น Markdown
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
เมื่อสร้าง JWT แล้ว โปรดดำเนินการคำสั่งต่อไปนี้เพื่อโหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์และดำเนินการแปลง Word เป็น Markdown จากนั้นไฟล์ MD ที่เป็นผลลัพธ์จะถูกจัดเก็บไว้ในไดรฟ์ในเครื่อง
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
บทสรุป
เราได้มาถึงตอนท้ายของบทความนี้ซึ่งเราได้เรียนรู้รายละเอียดเกี่ยวกับวิธีที่เราสามารถแปลง Word เป็น Markdown โดยทางโปรแกรมโดยใช้ Java ในทำนองเดียวกัน เรายังได้สำรวจขั้นตอนการแปลง DOCX เป็น Markdown ผ่านคำสั่ง cURL
อีกทางเลือกหนึ่งในการสำรวจความสามารถของ API คือผ่าน SwaggerUI ภายในเว็บเบราว์เซอร์ นอกจากนี้ เราขอแนะนำให้สำรวจ เอกสารคู่มือผลิตภัณฑ์ ซึ่งเป็นแหล่งข้อมูลที่น่าทึ่งเพื่อเรียนรู้เกี่ยวกับคุณลักษณะที่น่าตื่นเต้นอื่นๆ ในกรณีที่คุณจำเป็นต้องดาวน์โหลดและแก้ไขซอร์สโค้ดของ Cloud SDK จะมีอยู่ใน GitHub (เผยแพร่ภายใต้ใบอนุญาต MIT) สุดท้ายนี้ ในกรณีที่คุณพบปัญหาใดๆ ขณะใช้ API คุณอาจลองติดต่อหาเราเพื่อขอวิธีแก้ไขปัญหาอย่างรวดเร็วผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ ฟรี
บทความที่เกี่ยวข้อง
โปรดไปที่ลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: