
PDF 廣泛用於儲存和共享各種類型的文檔,包括報告、簡報和小冊子。然而,當從這些文件中提取圖像時,這個過程可能非常耗時且繁瑣。無論您需要提取圖像以進行進一步編輯、分析還是納入您自己的專案中,擁有可靠且有效的方法都至關重要。因此,利用程式 SDK 的功能可以簡化影像擷取過程,節省寶貴的時間和精力。現在,在本文中,我們將詳細探討如何使用 Python Cloud SDK 從 PDF 檔案中擷取影像,並實現全新的生產力和便利性等級。
PDF處理雲SDK
當使用 Python 從 PDF 檔案中提取映像時,Aspose.PDF Cloud API 是一個功能強大且用途廣泛的工具。使用 Aspose.PDF Cloud SDK for Python,您不僅可以從 PDF 中提取圖像,還可以執行各種其他任務,例如將 PDF 轉換為不同的格式、新增註釋、合併或分割 PDF 文件等等。此外,SDK 提供了一套全面的 API,使您能夠以程式設計方式操作 PDF 文件,從而節省您的時間和精力。
現在,為了安裝 SDK,請從 PIP 或 GitHub 儲存庫下載它。因此,請在終端機/命令提示字元上執行以下命令,在系統上安裝最新版本的 SDK。
pip install asposepdfcloud
PyCharm IDE
如果您正在使用 PyCharm IDE,您可以直接將 SDK 作為相依性新增至您的專案。
檔案 ->設定 ->專案 ->Python 解釋器 ->asposepdfcloud

圖 1:- PyCharm 設定選項。

圖 2:- Aspose.PDF Cloud Python 套件。
另一個重要步驟是使用 GitHub 或 Google 帳戶透過 雲端儀表板 建立免費帳戶。或者,點擊建立新帳戶按鈕並提供所需資訊並取得您的個人化客戶憑證。

圖像 3:- 雲端儀表板上的客戶端憑證。
使用 Python 從 PDF 提取圖像
請按照以下步驟從 JPEG 格式的 PDF 文件中提取影像並將其保存在雲端儲存的資料夾中。
- 首先,建立 ApiClient 類別的實例,並提供客戶端 ID 客戶端金鑰作為參數。
- 其次,建立一個 PdfApi 類別的實例,該實例以 ApiClient 物件作為參數。
- 現在,呼叫方法 putimagesextractasjpeg(…),該方法接受輸入 PDF 名稱、相應的 PDF 頁碼以及指定用於保存提取圖像的目標資料夾的可選參數。
def extractImages():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 建立 PdfApi 實例並傳遞 PdfApiClient 作為參數
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'URL2PDF.pdf'
# 呼叫 API 將圖像提取為 JPEG 並將其儲存到雲端儲存中的 ExtractedImages 資料夾
response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
print(response)
# 在控制台中列印訊息(可選)
print('Images successfully extracted from PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
此 API 還支援兩個可選參數來指定提取影像的寬度和高度。

Image 4:- Preview of extracted images.
如果您需要擷取其他格式的圖片,可以考慮使用下列API:
- PutImagesExtractAsTiff - 以 TIFF 格式擷取文件影像
- PutImagesExtractAsGif - 以 GIF 格式擷取文件影像
- PutImagesExtractAsPng - 以 PNG 格式擷取文件影像
使用 cURL 指令下載 PDF 影像
也可以透過使用帶有 cURL 命令的 Aspose.PDF Cloud API 從 PDF 檔案中提取圖像。透過使用 cURL 命令,您可以向 API 端點發出 HTTP 請求並輕鬆地從 PDF 中提取圖像。這種方法提供了靈活性和便利性,因為您可以將影像擷取功能直接整合到腳本或應用程式中。此外,您還可以透過任何平台(即 Windows、Linux、macOS 或其他作業系統)上的命令列終端存取 REST API。
在本節中,我們將使用 cURL 命令提取 PNG 格式的映像並將輸出儲存到雲端儲存。因此,第一步是透過執行以下命令來產生 JSON Web Token (JWT)。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
現在,請執行以下命令僅從 PDF 文件的第 3 頁提取影像。影像以 PNG 格式擷取。
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H "Accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
上述範例中使用的範例 PDF 檔案可以從 URL2PDF.pdf 下載。
結論
總之,從 PDF 檔案中提取圖像是一項很有價值的功能,可以使用 Aspose.PDF Cloud SDK for Python 和 cURL 命令來實現。無論您喜歡 Python 程式設計的便利性和簡單性還是 cURL 命令的多功能性,Aspose.PDF Cloud 都提供了強大的 API 來完成此任務。透過利用雲端的強大功能,您可以輕鬆地從 PDF 文件中提取影像,從而增強您的工作流程。儘管如此,使用 Aspose.PDF Cloud,您可以靈活地選擇最適合您要求的方法,並將影像擷取功能無縫整合到您的專案中。
有用的資源
-許可訂閱
相關文章
我們還建議您訪問以下連結以了解更多資訊: