降價的話

在 Java 中將 Word 轉換為 Markdown

Microsoft Word 廣泛用於創建、編輯 Word 文檔 (DOC/DOCX) 並將其轉換為各種格式。同樣,Markdown 是一種輕量級標記語言,您可以使用它向純文本文檔添加格式元素。它是一個純文本文檔,應該是可讀的,沒有標籤會弄亂一切,但仍然應該有添加文本修飾符的方法,如列表、粗體、斜體等。所以如果我們有一個 Word 文檔,我們需要創建一個等效的文件在 Markdown 語法中,很難手動創建它。但是,編程解決方案可以解決問題。本文將解釋有關如何使用 Java Cloud SDK 開發 word 到 markdown 轉換器的所有細節。

Word 到 Markdown 轉換 API

我們名為 Aspose.Words Cloud 的基於 REST 的 API 是實現 MS Word 文檔創建、操作和轉換為各種支持格式 的出色解決方案。現在,為了在 Java 應用程序中實現相同的文檔轉換和處理功能,我們需要使用 Aspose.Words Cloud SDK for Java,它是 REST API 的包裝器。所以在使用SDK的第一步,我們需要通過在pom.xml(maven構建類型項目)中包含以下信息來在我們的Java項目中添加它的引用。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

在項目中添加 SDK 參考後,下一個重要步驟是從 Cloud Dashboard 獲取您的客戶端憑據。否則,您需要先使用有效的電子郵件地址註冊一個免費帳戶。

Java 中的 Word 到 MD

本節解釋了我們如何使用 Java 代碼片段將 Word 轉換為 MD 格式的步驟和相關細節。我們將使用兩種選項來加載輸入的 Word 文檔,即從雲存儲或本地驅動器,然後將其轉換為 Markdown 格式。

從本地驅動器加載 Word 文檔

  • 首先,創建一個 WordsApi 實例並將個性化憑據作為參數傳遞
  • 其次,使用 Files.readAllBytes(…) 方法讀取輸入 Word 文檔的內容,並在 byte[] 數組中獲取返回值
  • 第三,創建一個 ConvertDocumentRequest 對象,它將輸入的 Word 文件、MD 格式和生成的 Markdown 文件名作為參數
  • 現在,調用方法 convertDocument(…) 將 Word 轉換為 MD。生成的 Markdown 作為響應流返回,保存到 byte[] 實例中
  • 最後,為了將生成的 Markdown 保存到本地驅動器,創建一個 FileOutputStream 對象並使用其 write(…) 方法
// 更多代碼片段,請訪問 https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// 如果 baseUrl 為 null,WordsApi 使用默認的 https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // 從本地系統加載word文檔
        File file1 = new File("sample_EmbeddedOLE.docx");

        // 讀取輸入的word文檔內容
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // 結果文件格式
        String format = "md";

        // 在我們提供結果文件名的地方創建文檔轉換請求
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
  
        // 執行單詞到降價轉換並將輸出保存在字節數組中
        byte[] resultantFile = wordsApi.convertDocument(convertRequest);
        
        // 將生成的降價文檔保存到本地驅動器
	FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
	fos.write(resultantFile);
	fos.close();
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
降價的話

圖片:- Word 到 Markdown 的轉換預覽

您可以考慮從 sampleEmbeddedOLE.docx 下載輸入的 Word 文檔。

從雲存儲加載 Word 文檔

  • 同樣,首先我們需要創建一個 WordsApi 實例,同時將個性化憑證作為參數傳遞
  • 其次,創建一個 GetDocumentWithFormatRequest 對象,它以輸入的 Word 文件名、MD 格式和生成的 Markdown 文件名作為參數
  • 最後,調用 getDocumentWithFormat(..) 方法觸發 Word 到 Markdown 的轉換操作。生成的 MD 文件保存在雲存儲中
// 更多代碼片段,請訪問 https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// 如果 baseUrl 為 null,WordsApi 使用默認的 https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

        String format = "md";
        // 現在創建一個新的 GetDocumentWithFormatRequest 對象 
        GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);

        // 現在調用方法啟動轉換操作
        // 結果文件存儲在雲存儲中
        wordsApi.getDocumentWithFormat(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }

使用 cURL 命令將 DOC 轉換為 Markdown

REST API 還提供了在 cURL 命令的幫助下從任何平台訪問的靈活性。因此,在本節中,我們將詳細討論如何從雲存儲加載 Word 文檔,執行 DOCX 到 Markdown 轉換並將生成的 MD 文件保存在本地驅動器上。現在首先我們需要使用以下命令生成 JWT 訪問令牌(基於客戶端憑據),然後執行 DOCX 到 Markdown 的轉換。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

生成 JWT 後,請執行以下命令從雲存儲加載 Word 文檔並執行 Word 到 Markdown 轉換。然後將生成的 MD 文件存儲在本地驅動器上

curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"

結論

我們已經到達本文的結尾,在那裡我們了解了有關如何使用 Java 以編程方式將 Word 轉換為 Markdown 的詳細信息。同樣,我們也探索了通過 cURL 命令將 DOCX 轉換為 Markdown 的步驟。

探索 API 功能的另一種選擇是通過 Web 瀏覽器中的 SwaggerUI。我們還建議瀏覽 產品文檔,這是了解其他令人興奮的功能的絕佳信息來源。如果您需要下載和修改 Cloud SDK 的源代碼,可以在 GitHub(根據 MIT 許可發布)上獲得。最後,如果您在使用 API 時遇到任何問題,您可以考慮通過免費的 產品支持論壇 聯繫我們尋求快速解決方案。

相關文章

請訪問以下鏈接以了解更多信息: