PDF 表格是著名的文件類型之一,您可以在其中輸入資訊、從下拉方塊中選擇項目,也可以根據需要檢查欄位。 PDF 目前支援兩種不同的方法來整合資料和 PDF 表單,即 AcroForms(也稱為 Acrobat 表單)和 XML 表單架構 (XFA) 表單。為了填寫表格,您可以在線上填寫表格,也可以在電腦上儲存表格的副本,然後使用 Adobe Acrobat Reader 填寫表格。填寫完表格後,您可能有興趣使用文件中填寫的數據,為此,您可能需要將其匯出為 XML、FDF 和 XFDF 格式。在本文中,我們將詳細討論如何使用 Python 以及其他支援的格式以程式設計方式將 PDF 匯出為 XML。

PDF處理API

Aspose.PDF Cloud 是一款屢獲殊榮的 REST API,提供建立、編輯和將各種文件格式轉換為 PDF 格式的功能。同時,它也支援將PDF檔案匯出為XLSXPPTXDOCXEPUBHTML等功能,以及其他各種支援格式

它還使您能夠使用 PDF 表單,您可以:

從 PDF 文件取得所有表單欄位

由於 API 是基於 REST 的,因此可以在任何平台和任何應用程式(即桌面、行動裝置、Web、混合等)上存取它。

現在為了在 Python 應用程式中實作 PDF 處理功能,我們建立了 Aspose.PDF Cloud SDK for Python,它是 Aspose.PDF Cloud 的包裝器。因此,使用此 SDK 時,您可以在 Python 應用程式中獲得所有 PDF 處理功能。現在,為了開始使用此 SDK,第一步是安裝它。該 SDK 可透過 PIPGitHub 儲存庫免費下載。只需在終端機/命令提示字元上執行以下命令即可在系統上安裝最新版本的 SDK。

pip install asposepdfcloud

免費雲端儀表板帳戶

下一個重要步驟是透過 Aspose.Cloud 儀表板 免費訂閱我們的雲端服務。此訂閱的目的是僅允許授權人員存取我們的文件處理服務。如果您有 GitHub 或 Google 帳戶,只需註冊或點擊 建立新帳戶 按鈕並提供所需的資訊。現在使用憑證登入儀表板並從儀表板展開應用程式部分並向下捲動至用戶端憑證部分以查看用戶端 ID 和用戶端金鑰詳細資訊。

客戶端憑證Client credentials

圖 1:- Aspose.Cloud 儀表板上的客戶端憑證。

使用 Python 將 PDF 匯出為 XML

請按照下面指定的說明使用 Python 將 PDF 匯出為 XML。我們提供了兩個 API 來實現此要求

| API |類型 |網址 |描述 |

| ——————- | —– | —– | ———— |

| /pdf/{名稱}/導出/xml |獲取 | 從Pdf到XmlInStorage取得導出欄位 |將儲存中的 PDF 中的欄位匯出到 XML 檔案。 |

| /pdf/{名稱}/導出/xml |放置 | [將匯出欄位從 PDF 匯出到 XML]]26 |將欄位從儲存中的 PDF 匯出到儲存中的 XML 檔案。 |

  • 首先,建立 ApiClient 類別的實例,並提供客戶端 ID 客戶端金鑰作為參數。
  • 其次,建立一個 PdfApi 類別的實例,該實例以 ApiClient 物件作為輸入參數。
  • 現在呼叫 putexportfieldsfrompdftoxmlinstorage(..) 方法將 PDF 表單資料匯出為 XML 並將結果檔案儲存到雲端儲存。
def exportPDFtoXML():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
        pdf_api = PdfApi(pdf_api_client)

        # 來源 PDF 文件
        input_file = 'FormData-Filled.pdf'

        # 產生的 XML 名稱
        outputXML = 'exportedData.xml'
        
        # 將 PDF 表單資料匯出為 XML 並將輸出保存在雲端儲存中
        response = pdf_api.put_export_fields_from_pdf_to_xml_in_storage(name = input_file, xml_output_file_path=outputXML)
        
        # 在控制台上列印回應
        print(response)
        
        # 在控制台中列印訊息(可選)
        print('PDF Form data successfully exported to XML !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
PDF 至 XML 匯出預覽

圖 2:- 以 XML 形式匯出的 PDF 資料。

使用 Python 將 PDF 匯出為 FDF

請依照以下說明將 PDF 表單資料匯出為 FDF 格式,並將輸出儲存在雲端儲存中。

  • 建立 ApiClient 類別的實例,並提供客戶端 ID 客戶端金鑰作為參數。
  • 現在建立一個 PdfApi 類別的實例,它將 ApiClient 物件作為輸入參數。
  • 最後,呼叫 putexportfieldsfrompdftofdfinstorage(..) 方法將 PDF 表單資料匯出為 FDF,並將結果檔案儲存到雲端儲存。
def exportPDFtoFDF():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
        pdf_api = PdfApi(pdf_api_client)

        # 來源 PDF 文件
        input_file = 'FormData-Filled.pdf'

        # 產生的 FDF 名稱
        outputFDF = 'exportedData.fdf'
        
        # 將 PDF 表單資料匯出為 FDF 並將輸出保存在雲端儲存中
        response = pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(name = input_file, fdf_output_file_path=outputFDF)
        
        # 在控制台上列印回應
        print(response)
        
        # 在控制台中列印訊息(可選)
        print('PDF Form data successfully exported to FDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

請造訪以下連結下載來源檔案 FormData-Filled.pdf 和匯出檔案 exportedData.fdf

使用 Python 將 PDF 匯出為 XFDF

XFDF 文件是一種 Acrobat 表單文件文件,其中儲存了 PDF 文件可用的信息,因此 XFDF 文件將該數據直接插入 PDF 中。因此,我們可能需要從一個 PDF 表單匯出資料並填寫其他 PDF 表單。因此在本節中,我們將討論如何將 PDF 表單資料匯出為 XFDF 格式的步驟。

  • 建立 ApiClient 類別的實例,並提供客戶端 ID 客戶端金鑰作為參數。
  • 現在建立一個 PdfApi 類別的實例,它將 ApiClient 物件作為輸入參數。
  • 最後,呼叫 putexportfieldsfrompdftoxfdfinstorage(..) 方法將 PDF 表單資料匯出為 XFDF,並將結果檔案儲存到雲端儲存。
def exportPDFtoXFDF():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
        pdf_api = PdfApi(pdf_api_client)

        # 來源 PDF 文件
        input_file = 'FormData-Filled.pdf'

        # 產生的 XFDF 名稱
        outputXFDF = 'exportedData.xfdf'
        
        # 將 PDF 表單資料匯出為 XFDF 並將輸出保存在雲端儲存中
        response = pdf_api.put_export_fields_from_pdf_to_xfdf_in_storage(name = input_file, xml_output_file_path=outputXFDF)
        
        # 在控制台上列印回應
        print(response)
        
        # 在控制台中列印訊息(可選)
        print('PDF Form data successfully exported to XFDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

上述程式碼產生的範例輸出可以從 exportedData.xfdf 下載。

將 PDF 匯出為 XFDF

圖 3:匯出到 XFDF 的 PDF 數據

使用 cURL 指令將 PDF 轉換為 XML

REST API 也可以透過 cURL 命令訪問,並且可以使用任何平台上的終端應用程式存取。由於 Aspose.PDF Cloud 是按照 REST 架構開發的,因此也可以透過 cURL 指令存取。但是,在執行任何操作之前,我們需要根據您在 Aspose.Cloud 儀表板上指定的個人用戶端憑證產生 JSON Web Token (JWT)。這是強制性的,因為我們的 API 只有註冊用戶才能存取。請執行以下命令來產生 JWT 令牌。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

一旦產生 JWT 令牌,請執行下列命令將 PDF 表單資料匯出為 XML 格式。

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/FormData-Filled.pdf/export/xml?xmlOutputFilePath=FormDataExported.xml" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-d{}

結論

在本文中,我們探討如何將 PDF 表單資料匯出為 XML、FDF 和 XFDF 格式的細節和步驟。這些要求可以使用 Python 程式碼片段以及 cURL 命令來實現。我們也建議您探索開發者指南以了解 API 提供的其他令人興奮的功能。此外,Aspose.PDF Cloud SDK for Python 的完整原始碼已經可以透過 GitHub 下載。如果您在使用 API 時遇到任何問題或有任何其他疑問,請隨時透過 免費產品支援論壇 與我們聯絡。

相關文章

我們還建議您訪問以下連結以了解更多資訊: