word轉html

在 Java 中將 Word 轉換為 HTML

在我們的日常生活中,我們不得不處理 Microsoft Word(DOC/DOCX) 文件,既用於個人目的,也用於官方目的。同樣,我們可能需要通過 Internet 共享這些文檔,並且為了打開/查看這些文檔,收件人需要特定的應用程序,例如 MS Word、OpenOffice 等。此外,某些限制性環境可能無權安裝任何其他應用程序,因此在這種情況下,將 Word 轉換為 HTML 可能是一種可行的解決方案。使用這種方法,我們可以輕鬆地在網絡瀏覽器中打開 Word 文檔(無需安裝任何其他軟件)。因此,本文將解釋如何使用 Java Cloud SDK 將 Word 轉換為 HTML 的步驟。

Word 到 HTML 轉換 REST API

Aspose.Words Cloud 是一個基於 REST 的解決方案,提供以編程方式創建、編輯 MS Word 文檔並將其轉換為各種支持的格式 的功能。現在,根據本文的範圍,我們將使用 Aspose.Words Cloud SDK for Java,它使我們能夠利用 Java 應用程序中的所有 word 文檔轉換功能。因此,為了使用此 SDK,我們需要通過在 pom.xml(maven 構建類型項目)中包含以下信息來在我們的 Java 項目中添加它的引用。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-words-cloud</artifactId>
        <version>22.12.0</version>
    </dependency>
</dependencies>

下一個重要步驟是從 Cloud Dashboard 獲取您的客戶端憑據。如果您尚未註冊,則需要先通過有效的電子郵件地址註冊一個免費帳戶,然後獲取您的憑據。

在 Java 中將 Word 轉換為 HTML

我們將討論有關如何使用 Java 代碼片段將 Word 轉換為 HTML 的步驟及其相關細節。

  • 創建一個 WordsApi 對象,我們在其中將個性化憑據作為參數傳遞
  • 現在使用 readAllBytes(…) 方法加載輸入的 Word 文檔內容,並在 byte[] 數組中獲取返回值
  • 下一步是創建一個 ConvertDocumentRequest 類的對象,它以輸入的 Word 文件、HTML 格式和結果文件名作為參數
  • 最後,調用方法convertDocument(…) 執行Word 到HTML 的轉換。轉換成功後,生成的 HTML 文檔存儲在雲存儲中
// 更多代碼片段,請訪問 https://github.com/aspose-words-cloud/aspose-words-cloud-java

try
    {
        String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
	String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
	// 如果 baseUrl 為 null,WordsApi 使用默認的 https://api.aspose.cloud
	WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
			
        // 從本地系統加載word文檔
        File file1 = new File("test_multi_pages.docx");

        // 讀取輸入的word文檔內容
        byte[] documentStream = Files.readAllBytes(file1.toPath());
  
        // 結果文件格式
        String format = "html";

        // 在我們提供結果文件名的地方創建文檔轉換請求
        ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, "output.html",null, null, null);
  
        // 執行 word 到 html 的轉換
        wordsApi.convertDocument(convertRequest);
      
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
word轉html

圖片:- Word 到 HTML 文檔轉換預覽

上例中使用的示例 Word 文檔可以從 testmultipages.docx 下載。

使用 cURL 命令將 DOCX 轉換為 HTML

REST API 提供了在任何平台上通過 cURL 命令進行訪問的便利性。因此,在本節中,我們將討論有關如何使用 cURL 命令將 DOCX 轉換為 HTML 的詳細信息。因此,第一步是使用以下命令生成 JWT 訪問令牌(基於客戶端憑據)。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

現在我們需要執行以下命令來執行 Word 到 HTML 的轉換,其中輸入的 Word 文檔預計在雲存儲中可用,轉換後,我們將把生成的 HTML 文檔保存在本地驅動器上。

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>" \
-o "newOutput.html"

我們還可以將生成的文件直接保存在雲存儲中,因此,我們只需要為 outPath 參數提供值(如下所示)

curl -v -X GET "https://api.aspose.cloud/v4.0/words/test_multi_pages.docx?format=html&outPath=output.html" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

結論

現在我們已經到了本文的結尾,我們了解了有關如何使用 Java 以編程方式將 Word 轉換為 HTML 的詳細信息。我們還看到了通過 cURL 命令將 DOCX 轉換為 HTML 的選項。為了快速測試,您還可以嘗試在 Web 瀏覽器中通過 SwaggerUI 訪問 API,同時,您可以考慮瀏覽 產品文檔,這是一個了不起的信息來源。

如果您需要下載和修改 Cloud SDK 的源代碼,可以在 GitHub(根據 MIT 許可發布)上免費獲得。最後,如果您在使用 API 時遇到任何問題或有任何相關疑問,您可以考慮通過免費的 產品支持論壇 聯繫我們尋求快速解決方案。

相關文章

請訪問以下鏈接以了解更多信息: