คำที่จะทำเครื่องหมาย

แปลง Word เป็น Markdown ใน Java

Microsoft Word ใช้กันอย่างแพร่หลายในการสร้าง แก้ไข และแปลงเอกสาร Word (DOC/DOCX) เป็นรูปแบบต่างๆ ในทำนองเดียวกัน Markdown เป็นภาษามาร์กอัปขนาดเล็กที่คุณสามารถใช้เพื่อเพิ่มองค์ประกอบการจัดรูปแบบให้กับเอกสารข้อความล้วน เป็นเอกสารข้อความธรรมดาที่สามารถอ่านได้โดยไม่ต้องมีแท็กที่ทำให้สับสน แต่ก็ยังมีวิธีเพิ่มตัวแก้ไขข้อความ เช่น รายการ ตัวหนา ตัวเอียง ฯลฯ ดังนั้น หากเรามีเอกสาร Word และเราจำเป็นต้องสร้างไฟล์ที่เทียบเท่า ในไวยากรณ์ของ Markdown การสร้างด้วยตนเองเป็นเรื่องยาก อย่างไรก็ตาม โซลูชันแบบเป็นโปรแกรมสามารถแก้ปัญหาได้ บทความนี้จะอธิบายรายละเอียดทั้งหมดเกี่ยวกับวิธีการพัฒนาตัวแปลง word เป็น markdown โดยใช้ Java Cloud SDK

API การแปลง Word เป็น Markdown

API ที่ใช้ REST ของเราชื่อ Aspose.Words Cloud เป็นโซลูชันที่ยอดเยี่ยมในการปรับใช้การสร้าง การจัดการ และการแปลงเอกสาร MS Word เป็น รูปแบบที่รองรับ ที่หลากหลาย ในตอนนี้ เพื่อใช้ความสามารถในการแปลงเอกสารและการประมวลผลแบบเดียวกันในแอปพลิเคชัน Java เราจำเป็นต้องใช้ Aspose.Words Cloud SDK for Java ซึ่งเป็นตัวห่อหุ้มรอบ REST API ดังนั้นในขั้นตอนแรกของการใช้งาน SDK เราจำเป็นต้องเพิ่มการอ้างอิงในโครงการ Java ของเราโดยใส่ข้อมูลต่อไปนี้ใน pom.xml (โครงการประเภท maven build)

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

เมื่อเพิ่มข้อมูลอ้างอิง SDK ในโครงการแล้ว ขั้นตอนสำคัญถัดไปคือการขอรับข้อมูลรับรองไคลเอ็นต์จาก Cloud Dashboard มิฉะนั้น คุณต้องลงทะเบียนบัญชีฟรีก่อนในขณะที่ใช้ที่อยู่อีเมลที่ถูกต้อง

Word to MD ใน Java

ส่วนนี้อธิบายขั้นตอนและรายละเอียดที่เกี่ยวข้องเกี่ยวกับวิธีที่เราสามารถแปลงรูปแบบ Word เป็น MD โดยใช้ข้อมูลโค้ด Java เราจะใช้สองตัวเลือกในการโหลดเอกสาร Word อินพุต เช่น จากที่เก็บข้อมูลบนคลาวด์หรือไดรฟ์ในเครื่อง จากนั้นแปลงเป็นรูปแบบ Markdown

โหลดเอกสาร Word จากไดรฟ์ในเครื่อง

  • ก่อนอื่น สร้างอินสแตนซ์ของ WordsApi และส่งข้อมูลส่วนตัวเป็นอาร์กิวเมนต์
  • ประการที่สอง อ่านเนื้อหาของเอกสาร Word ที่ป้อนโดยใช้เมธอด Files.readAllBytes(…) และรับค่าที่ส่งคืนในอาร์เรย์ไบต์[]
  • ประการที่สาม สร้างวัตถุของ ConvertDocumentRequest ซึ่งรับไฟล์ Word อินพุต รูปแบบ MD และชื่อไฟล์ Markdown ที่เป็นผลลัพธ์เป็นอาร์กิวเมนต์
  • ตอนนี้ โทรเมธอด converterDocument(…) สำหรับการแปลง Word เป็น MD Markdown ที่เป็นผลลัพธ์จะถูกส่งกลับเป็นสตรีมตอบกลับ เพื่อบันทึกลงในอินสแตนซ์ byte[]
  • สุดท้าย เพื่อบันทึกผลลัพธ์ Markdown ไปยังไดรฟ์ในเครื่อง ให้สร้างวัตถุของ FileOutputStream และใช้วิธีการเขียน (…)
// สำหรับข้อมูลโค้ดเพิ่มเติม โปรด https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // โหลดเอกสารคำจากระบบภายในเครื่อง
        File file1 = new File("sample_EmbeddedOLE.docx");

        // อ่านเนื้อหาของเอกสารคำที่ป้อน
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // รูปแบบไฟล์ผลลัพธ์
        String format = "md";

        // สร้างคำขอแปลงเอกสารที่เราระบุชื่อไฟล์ที่เป็นผลลัพธ์
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // ทำการแปลงคำเป็นมาร์กดาวน์และบันทึกเอาต์พุตเป็นไบต์อาร์เรย์
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // บันทึกเอกสารมาร์กดาวน์ที่เป็นผลลัพธ์ลงในไดรฟ์ในเครื่อง
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
คำพูดของ Markdown

รูปภาพ: - แสดงตัวอย่างการแปลง Word เป็น Markdown

คุณอาจลองดาวน์โหลดเอกสาร Word ที่ป้อนจาก sampleEmbeddedOLE.docx

โหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์

  • ในทำนองเดียวกัน อันดับแรกเราต้องสร้างอินสแตนซ์ของ WordsApi ในขณะที่ส่งข้อมูลรับรองส่วนบุคคลเป็นอาร์กิวเมนต์
  • ประการที่สอง สร้างวัตถุของ GetDocumentWithFormatRequest ซึ่งใช้ชื่อไฟล์ Word, รูปแบบ MD และชื่อไฟล์ Markdown ที่เป็นผลลัพธ์เป็นอาร์กิวเมนต์
  • สุดท้าย เรียกใช้เมธอด getDocumentWithFormat(..) ซึ่งทริกเกอร์การดำเนินการแปลง Word เป็น Markdown ไฟล์ MD ที่เป็นผลลัพธ์จะถูกบันทึกในที่เก็บข้อมูลบนคลาวด์
// สำหรับข้อมูลโค้ดเพิ่มเติม โปรด https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // ตอนนี้สร้างวัตถุใหม่ของ GetDocumentWithFormatRequest 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // ตอนนี้เรียกเมธอดเพื่อเริ่มต้นการดำเนินการแปลง
        // ไฟล์ผลลัพธ์จะถูกเก็บไว้ในที่เก็บข้อมูลบนคลาวด์
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

DOC เป็น Markdown โดยใช้คำสั่ง cURL

REST APIs ยังให้ความยืดหยุ่นในการเข้าถึงจากทุกแพลตฟอร์มด้วยความช่วยเหลือของคำสั่ง cURL ดังนั้นในส่วนนี้ เราจะพูดถึงรายละเอียดเกี่ยวกับวิธีโหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์ ทำการแปลง DOCX เป็น Markdown และบันทึกไฟล์ MD ที่เป็นผลลัพธ์ลงในไดรฟ์ในเครื่อง ก่อนอื่นเราต้องสร้างโทเค็นการเข้าถึง JWT (ตามข้อมูลรับรองลูกค้า) โดยใช้คำสั่งต่อไปนี้ จากนั้นทำการแปลง DOCX เป็น Markdown

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

เมื่อสร้าง JWT แล้ว โปรดดำเนินการคำสั่งต่อไปนี้เพื่อโหลดเอกสาร Word จากที่เก็บข้อมูลบนคลาวด์และดำเนินการแปลง Word เป็น Markdown จากนั้นไฟล์ MD ที่เป็นผลลัพธ์จะถูกจัดเก็บไว้ในไดรฟ์ในเครื่อง

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

บทสรุป

เราได้มาถึงตอนท้ายของบทความนี้ซึ่งเราได้เรียนรู้รายละเอียดเกี่ยวกับวิธีที่เราสามารถแปลง Word เป็น Markdown โดยทางโปรแกรมโดยใช้ Java ในทำนองเดียวกัน เรายังได้สำรวจขั้นตอนการแปลง DOCX เป็น Markdown ผ่านคำสั่ง cURL

อีกทางเลือกหนึ่งในการสำรวจความสามารถของ API คือผ่าน SwaggerUI ภายในเว็บเบราว์เซอร์ นอกจากนี้ เราขอแนะนำให้สำรวจ เอกสารคู่มือผลิตภัณฑ์ ซึ่งเป็นแหล่งข้อมูลที่น่าทึ่งเพื่อเรียนรู้เกี่ยวกับคุณลักษณะที่น่าตื่นเต้นอื่นๆ ในกรณีที่คุณจำเป็นต้องดาวน์โหลดและแก้ไขซอร์สโค้ดของ Cloud SDK จะมีอยู่ใน GitHub (เผยแพร่ภายใต้ใบอนุญาต MIT) สุดท้ายนี้ ในกรณีที่คุณพบปัญหาใดๆ ขณะใช้ API คุณอาจลองติดต่อหาเราเพื่อขอวิธีแก้ไขปัญหาอย่างรวดเร็วผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ ฟรี

บทความที่เกี่ยวข้อง

โปรดไปที่ลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: