使用 Python Cloud SDK 从 PDF 中提取图像

PDF 广泛用于存储和共享各种类型的文档，包括报告、演示文稿和小册子。但是，从这些文件中提取图像时，该过程可能非常耗时且繁琐。无论您是需要提取图像进行进一步编辑、分析还是将其包含在自己的项目中，拥有可靠而高效的方法都至关重要。因此，利用编程 SDK 的功能可以简化图像提取过程，节省宝贵的时间和精力。现在，在本文中，我们将探讨如何使用 Python Cloud SDK 从 PDF 文件中提取图像的详细信息，并实现全新的生产力和便利性。

PDF处理云SDK
使用 Python 从 PDF 中提取图像
使用 cURL 命令下载 PDF 图像

PDF处理云SDK

在使用 Python 从 PDF 文件中提取图像时，Aspose.PDF Cloud API 是一款功能强大且用途广泛的工具。使用 Aspose.PDF Cloud SDK for Python，您不仅可以从 PDF 中提取图像，还可以执行各种其他任务，例如将 PDF 转换为不同格式、添加注释、合并或拆分 PDF 文档等等。此外，SDK 提供了一套全面的 API，使您能够以编程方式操作 PDF 文件，从而节省您的时间和精力。

现在，为了安装 SDK，请从 PIP 或 GitHub 存储库下载。因此，请在终端/命令提示符上执行以下命令，在系统上安装最新版本的 SDK。

 pip install asposepdfcloud

PyCharm IDE

如果您正在使用 PyCharm IDE，您可以直接将 SDK 作为依赖项添加到您的项目中。

文件 ->设置 ->项目 ->Python 解释器 ->asposepdfcloud

Aspose.PDF Python 包 — 图 2：- Aspose.PDF Cloud Python 包。

另一个重要步骤是使用 GitHub 或 Google 帐户在云仪表板上创建一个免费帐户。或者，单击创建新帐户按钮并提供所需信息并获取您的个性化客户端凭据。

使用 Python 从 PDF 中提取图像

请按照以下步骤从 JPEG 格式的 PDF 文档中提取图像并将其保存在云存储的文件夹中。

首先，创建 ApiClient 类的实例，并提供客户端 ID 客户端密钥作为参数。
其次，创建一个 PdfApi 类的实例，该实例以 ApiClient 对象作为参数。
现在，调用方法 putimagesextractasjpeg(…)，该方法接受输入 PDF 名称、相应的 PDF 页码以及指定用于保存提取图像的目标文件夹的可选参数。

def extractImages():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # 创建 PdfApi 实例并传递 PdfApiClient 作为参数
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'

        # 调用 API 将图像提取为 JPEG 并将其保存到云存储中的 ExtractedImages 文件夹
        response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
        
        print(response)
        # 在控制台中打印消息(可选)
        print('Images successfully extracted from PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

该 API 还支持两个可选参数来指定提取图像的宽度和高度。

如果您需要提取其他格式的图片，可以考虑使用以下API：

PutImagesExtractAsTiff - 以 TIFF 格式提取文档图像

PutImagesExtractAsGif - 以 GIF 格式提取文档图像

PutImagesExtractAsPng - 以 PNG 格式提取文档图像

使用 cURL 命令下载 PDF 图像

还可以使用 Aspose.PDF Cloud API 和 cURL 命令从 PDF 文件中提取图像。通过使用 cURL 命令，您可以向 API 端点发出 HTTP 请求并轻松从 PDF 中提取图像。这种方法提供了灵活性和便利性，因为您可以将图像提取功能直接集成到脚本或应用程序中。此外，您还可以通过任何平台(即 Windows、Linux、macOS 或其他操作系统)上的命令行终端访问 REST API。

在本节中，我们将使用 cURL 命令提取 PNG 格式的图像并将输出保存到云存储。因此，第一步是通过执行以下命令生成 JSON Web Token (JWT)。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

现在，请执行以下命令，仅从 PDF 文档的第 3 页提取图像。图像以 PNG 格式提取。

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H  "Accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-d{}

上述示例中使用的示例 PDF 文件可以从 URL2PDF.pdf 下载。

结论

总之，从 PDF 文件中提取图像是一项很有价值的功能，可以使用 Aspose.PDF Cloud SDK for Python 和 cURL 命令来实现。无论您喜欢 Python 编程的便利性和简单性还是 cURL 命令的多功能性，Aspose.PDF Cloud 都提供了强大的 API 来完成此任务。通过利用云的强大功能，您可以轻松地从 PDF 文档中提取图像，从而增强您的工作流程。尽管如此，使用 Aspose.PDF Cloud，您可以灵活地选择最适合您需求的方法，并将图像提取功能无缝集成到您的项目中。

有用的资源

-许可订阅

Python SDK 源代码

-免费产品支持论坛

我们还建议您访问以下链接以了解更多信息：

PDF处理云SDK#

PyCharm IDE#

使用 Python 从 PDF 中提取图像#

使用 cURL 命令下载 PDF 图像#

结论#

有用的资源#

相关文章#

PDF处理云SDK

PyCharm IDE

使用 Python 从 PDF 中提取图像

使用 cURL 命令下载 PDF 图像

结论

有用的资源

相关文章