使用 Python Cloud SDK 開發 PDF 到 Excel 轉換器。

如何將 PDF 轉換為 Excel |使用 Python SDK 將 PDF 匯出到 Excel
PDF 文件非常適合保存文件格式,但從中提取和利用資料可能很複雜。這時將 PDF 轉換為 Excel 的必要性就變得明顯了。 Excel 工作簿採用電子表格格式,提供了組織和處理資料的結構化方法。想像一下從 PDF 中無縫提取表格、圖形和文本,並將它們整齊地排列在 Excel 單元格中,以便進行分析。這種轉換不僅簡化了資料處理,而且提高了效率和生產力。
此外,Excel 主要用於儲存和組織收入、薪資和會計資訊等資料。它們允許用戶使用這些數據進行計算並生成圖形和圖表。現在在本文中,我們將討論如何將 PDF 轉換為 Excel 格式的細節。
用於 PDF 處理的 Python Cloud SDK
Aspose.PDF Cloud SDK for Python 成為簡化 PDF 到 XLS 轉換過程的強大工具。它不僅支援無縫的“pdf到excel”轉換,而且還提供了大量其他功能。想像一下輕鬆利用操作 PDF、提取特定資料和產生 Excel 就緒檔案的能力。
第一步是安裝 Python Cloud SDK,可以透過 PIP 和 GitHub 儲存庫下載。因此,請在終端機/命令提示字元上執行以下命令來安裝最新版本的 Cloud SDK。
pip install asposepdfcloud
微軟 Visual Studio
如果您需要在 Visual Studio IDE 中的 Python 專案中直接新增引用,請在 Python 環境視窗下搜尋 asposepdfcloud 作為套件。請依照下圖編號的步驟完成安裝程序。

圖 1:- Aspose.PDF Cloud SDK for Python 套件。
PyCharm
PyCharm 是一款流行的 Python 開發 IDE。在本節中,我們將討論 Windows 平台上的 PyCharm 設定。
- 點擊文件選單並選擇設定…選單項目。

圖 2:- PyCharm 設定選單項目。
- 從左側展開專案樹並選擇 Python 解釋器選項。
- 按一下右側的 +(加號),然後在可用套件對話方塊的搜尋欄位中輸入 asposepdfcloud。
- 現在點選安裝套件按鈕。

圖 3:Aspose.PDF Cloud for Python 套件。
SDK 安裝完成後,會顯示成功訊息。

圖 4:Aspose.PDF Cloud for Python 安裝成功後顯示的訊息。
- 如果您在 雲端儀表板 上沒有現有帳戶,您可以使用 GitHub 或 Google 憑證建立免費帳戶。現在登入儀表板並取得您的個人化用戶端憑證。

圖 5:- Aspose.Cloud 儀表板上的客戶端憑證。
使用 Python 將 PDF 轉換為 Excel
請依照以下說明使用 Python 程式碼片段將 PDF 轉換為 Excel 工作簿(XLSX)。請注意,以下程式碼片段要求輸入的 PDF 在雲端儲存中可用。
- 首先,建立 ApiClient 類別的實例,並提供客戶端 ID 客戶端金鑰作為參數。
- 其次,建立一個 PdfApi 類別的實例,該實例以 ApiClient 物件作為參數。
- 現在指定輸入 PDF 的名稱和產生的 XLSX 檔名。
- 最後,呼叫方法 putpdfinstoragetoxlsx(..),該方法採用輸入 PDF 檔案、產生的 XLSX 檔名和可選參數來產生統一的工作表。
# 更多程式碼範例,請造訪https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# 如需客戶端憑證,請造訪 https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# 產生的 Excel 工作簿的名稱
resultant_file_name = 'Resultant.xlsx'
# 呼叫API將PDF轉換為Excel格式
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# 在控制台中列印訊息(可選)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

圖 6:- PDF 到 Excel 轉換預覽。
上述範例使用的範例檔案可以從awesomeTable.pdf和Resultant.xlsx下載。
使用 cURL 指令將 PDF 轉換為 XLS
可以使用 Aspose.PDF Cloud 和 cURL 指令輕鬆完成 PDf 到 XLS 的轉換,因為它代表了一種簡化和自動化的方法。透過結合 cURL 指令和 Aspose.PDF Cloud,我們不僅簡化了轉換過程,而且還能夠無縫整合到各種工作流程中。
此方法的第一步是根據客戶端憑證產生 JSON Web Token (JWT)。因此,請執行以下命令來產生 JWT 令牌。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
一旦我們有了 JWT 令牌,請執行以下命令將 PDF 轉換為 XLS 格式。
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
結論
總之,無論是選擇強大的 Aspose.PDF Cloud SDK for Python 或是結合使用 cURL 指令與 Aspose.PDF Cloud,我們都可以輕鬆實現將 PDF 轉換為 Excel 格式的目標。 Aspose.PDF Cloud SDK for Python 提供了全面且開發人員友好的解決方案,為您提供了轉換之外的一系列功能。另一方面,利用 cURL 指令提供了一種多功能且可編寫腳本的方法。無論選擇哪種方法,這兩種方法都是強大的工具,徹底改變了我們建立和從 PDF 中提取資料的方式。
- 如果您在使用 Python Cloud SDK 時遇到任何問題,請隨時透過 免費客戶支援論壇 與我們聯絡。
相關文章
我們建議您閱讀以下文章來了解: