pdf 轉 html

了解如何使用 Python 將 PDF 轉換為 HTML

在當今快節奏的數位世界中,文件可訪問性是企業和個人考慮的關鍵因素。將 PDF 文件轉換為 HTML 的需求從未如此明顯。儘管 PDF 文件非常適合保存文件格式,但在網路上使用它們可能會變得麻煩。它們通常缺乏現代線上體驗所需的互動性和適應性。這就是 Python REST API 介入彌補差距的地方。本文探討了對 PDFHTML 轉換的日益增長的需求,以及 Python REST API 如何徹底改變這個過程。

用於 PDF 到 HTML 轉換的 Python REST API

使用 Aspose.PDF Cloud SDK for Python 可以將 PDF 文件轉換為 HTML 格式,這項任務變得簡單且有效率。這個強大的 SDK 提供了一系列功能,可以無縫解決 PDF 到 HTML 轉換的挑戰。無論您需要在網路上展示您的文件、跨各種平台共享內容或增強文件的可存取性,Aspose.PDF Cloud 都能滿足您的需求。

Python Cloud SDK 完全能夠建立、編輯或將 PDF 檔案轉換為各種格式,包括 EPUBPSSVGXLSXPPTXDOCXHTML

該 SDK 可透過 PIPGitHub 儲存庫下載。現在請在終端機/命令提示字元上執行以下命令,在系統上安裝最新版本的 SDK。

pip install asposepdfcloud

如果您需要在 Visual Studio IDE 中的 Python 專案中直接新增引用,請在 Python 環境視窗下搜尋 asposepdfcloud 作為套件。請依照下圖編號的步驟完成安裝程序。

pdftohtml 介面

圖 1:PDF 到 HTML 轉換 API。

使用 Python 將 PDF 轉換為 HTML

請按照下面給出的說明將 PDF 轉換為 HTML 格式。

  • 首先,建立 ApiClient 類別的實例,並傳遞 ClinetID 和客戶端機密詳細資訊作為參數。
  • 其次,建立一個 PdfApi 對象,我們將 ApiClient 物件作為參數傳遞。
  • 第三,指定輸入PDF的名稱和結果輸出。
  • 最後,呼叫PdfApi類別的putpdfinstoragetohtml(…)方法,啟動轉換。輸出儲存在雲端儲存。
# 完整的程式碼範例,請造訪https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
        pdf_api = PdfApi(pdf_api_client)

        # 來源 PDF 文件
        input_file_name = 'completeWorkbook.pdf'

        # 結果文件的名稱
        resultant_file_name = 'CodeConversion.zip'
    
        # 呼叫API進行轉換
        # 我們已將輸出格式設定為 zip,將文件類型設為 xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # 在控制台中列印訊息(可選)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

使用 cURL 指令將 PDF 轉換為 HTML

或者,也可以使用 cURL 指令與 Aspose.PDF Cloud 結合來簡化 PDF 到 HTML 的轉換。這種方法提供了一種方便的方法來利用 Aspose.PDF Cloud 的功能來滿足您的 PDF 到 HTML 轉換需求。當您正在尋找獨立於平台和語言的方法來實現無縫的 PDF 到 HTML 轉換流程時,這種方法最適合您的要求。

首先,我們需要根據客戶端憑證產生 JWT 存取權杖。請執行以下命令來產生 JWT 令牌。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

一旦我們有了 JWT 令牌,我們就可以執行以下命令將雲端儲存中可用的 PDF 檔案轉換為 HTML 格式,結果輸出會作為串流回應傳回。

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

如果您需要將 PDF 文件轉換為 HTML 並且還想將輸出保存在雲端儲存中,請嘗試使用以下命令。

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
PDF 轉 HTML 預覽

圖 2:PDF 到 HTML 轉換預覽。

結論

總之,從 PDF 到 HTML 的旅程從未如此順暢。我們探索了 Python REST API 的轉換能力以及 Aspose.PDF Cloud 使用 cURL 命令將 PDF 文件轉換為動態、適用於網路的 HTML 的效率。這些方法不僅確保了文件的完整性,而且還增強了可存取性和可共享性。因此,現在是時候讓更廣泛的受眾能夠存取您的內容並提升您的線上影響力了。

如果您在使用 API 時遇到任何問題或有任何其他疑問,請隨時透過 免費產品支援論壇 與我們聯絡。

相關文章

我們強烈建議您訪問以下連結以了解更多資訊: