PDF 到 HTML 轉換器

使用 Java 將 PDF 轉換為 HTML

PDF 是通過 Internet 共享信息和數據的事實標準之一。它受歡迎的原因是在任何平台(包括桌面或移動設備)上查看時,它都能保持文檔的佈局和保真度。但是,為了查看這些文件,您需要使用 PDF 查看器應用程序。然而,一個簡單的解決方法是將 PDF 轉換為 HTML 並在 Web 瀏覽器中輕鬆加載 HTML。因此在本文中,我們將進一步討論如何使用 REST API 開發 PDF 到 HTML 轉換器的細節。

SXC 到 Excel 轉換 API

為了創建、操作和轉換 PDF 文件為其他格式,請嘗試使用 Aspose.PDF Cloud SDK for Java。現在為了使用 SDK,請在 maven 構建類型項目的 pom.xml 中添加以下信息。

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

現在 Aspose.PDF Cloud SDK for Java 參考已添加到您的項目中,下一步是在 Aspose Cloud 上創建一個免費帳戶。使用新創建的帳戶登錄,並在 Cloud Dashboard 中查找/創建客戶端 ID 和客戶端密碼。後續部分需要這些詳細信息。

Java 中的 PDF 到 HTML 轉換器

讓我們討論一下如何使用 Java Cloud SDK 開發 PDF 到 HTML 轉換器的細節。請注意,在以下代碼片段中,在轉換操作期間使用了非常基本的參數,但我們強烈建議訪問 API 參考 部分以獲取所有受支持參數的列表及其相關描述。

  • 首先,我們需要創建一個 PdfApi 對象,同時提供 ClientID 和 Client secret 作為參數
  • 其次,使用 File 實例加載輸入 PDF 文件
  • 第三,使用 uploadFile(…) 方法將輸入的 PDF 上傳到雲存儲
  • 因為我們只需要轉換 PDF 的第二頁,所以我們在 List 對像中提供第二頁值
  • 現在調用 putPdfInStorageToHtml(…) 方法,需要輸入 PDF、結果 HTML 的名稱和各種其他轉換參數
try
    {
    // 從 https://dashboard.aspose.cloud/ 獲取 ClientID 和 ClientSecret
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // 創建 PdfApi 的實例
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // 輸入 PDF 文檔的名稱 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // 生成的 HTML 文件的名稱
    String resultantImage = "Resultant.html";
	  
    // 讀取輸入PDF文件的內容
    File file = new File("//Users//"+inputFile);
	    
    // 上傳PDF到雲存儲
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // 要轉換的 PDF 頁面列表
    List<Integer> list = new ArrayList<Integer>();
    //列表.添加(1);
    list.add(2);  // only convert second page of PDF
	    
    // 調用 PDF 到 HTML 轉換的 API
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // 打印成功信息
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
PDF 到 HTML 轉換器

Image1:- PDF 到 HTML 轉換預覽

上例中使用的示例 PDF 文件可以從 PdfWithScreenAnnotations.pdf 下載

使用 cURL 命令將 PDF 轉換為 HTML

cURL 命令也是通過命令行終端訪問 REST API 的便捷方式之一。現在,此方法的先決條件是在執行以下命令時生成 JWT 訪問令牌(基於客戶端憑據)。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

獲得 JWT 令牌後,我們需要執行以下命令將 PDF 轉換為 HTML。生成的 HTML 在雲存儲上保存為 Zip 存檔。

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

結論

我們已經學習了使用 Java Cloud SDK 開發 PDF 到 HTML 轉換器的步驟。因此,我們可以使用 Jave 代碼片段將 PDF 轉換為 HTML,也可以使用 cULR 命令將 PDF 轉換為 HTML5。如果您想對 Java Cloud SDK 的源代碼進行任何更改,可以從 GitHub 下載完整的源代碼。您可以考慮通過免費的 產品支持論壇 聯繫我們以快速解決問題。

相關文章

我們強烈建議訪問以下鏈接以了解更多信息: