
PDF 广泛用于存储和共享各种类型的文档,包括报告、演示文稿和小册子。但是,从这些文件中提取图像时,该过程可能非常耗时且繁琐。无论您是需要提取图像进行进一步编辑、分析还是将其包含在自己的项目中,拥有可靠而高效的方法都至关重要。因此,利用编程 SDK 的功能可以简化图像提取过程,节省宝贵的时间和精力。现在,在本文中,我们将探讨如何使用 Python Cloud SDK 从 PDF 文件中提取图像的详细信息,并实现全新的生产力和便利性。
PDF处理云SDK
在使用 Python 从 PDF 文件中提取图像时,Aspose.PDF Cloud API 是一款功能强大且用途广泛的工具。使用 Aspose.PDF Cloud SDK for Python,您不仅可以从 PDF 中提取图像,还可以执行各种其他任务,例如将 PDF 转换为不同格式、添加注释、合并或拆分 PDF 文档等等。此外,SDK 提供了一套全面的 API,使您能够以编程方式操作 PDF 文件,从而节省您的时间和精力。
现在,为了安装 SDK,请从 PIP 或 GitHub 存储库下载。因此,请在终端/命令提示符上执行以下命令,在系统上安装最新版本的 SDK。
pip install asposepdfcloud
PyCharm IDE
如果您正在使用 PyCharm IDE,您可以直接将 SDK 作为依赖项添加到您的项目中。
文件 ->设置 ->项目 ->Python 解释器 ->asposepdfcloud

图 1:- PyCharm 设置选项。

图 2:- Aspose.PDF Cloud Python 包。
另一个重要步骤是使用 GitHub 或 Google 帐户在 云仪表板 上创建一个免费帐户。或者,单击 创建新帐户 按钮并提供所需信息并获取您的个性化客户端凭据。

图像 3:- 云仪表板上的客户端凭据。
使用 Python 从 PDF 中提取图像
请按照以下步骤从 JPEG 格式的 PDF 文档中提取图像并将其保存在云存储的文件夹中。
- 首先,创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
- 其次,创建一个 PdfApi 类的实例,该实例以 ApiClient 对象作为参数。
- 现在,调用方法 putimagesextractasjpeg(…),该方法接受输入 PDF 名称、相应的 PDF 页码以及指定用于保存提取图像的目标文件夹的可选参数。
def extractImages():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'URL2PDF.pdf'
# 调用 API 将图像提取为 JPEG 并将其保存到云存储中的 ExtractedImages 文件夹
response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
print(response)
# 在控制台中打印消息(可选)
print('Images successfully extracted from PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
该 API 还支持两个可选参数来指定提取图像的宽度和高度。

Image 4:- Preview of extracted images.
如果您需要提取其他格式的图片,可以考虑使用以下API:
- PutImagesExtractAsTiff - 以 TIFF 格式提取文档图像
- PutImagesExtractAsGif - 以 GIF 格式提取文档图像
- PutImagesExtractAsPng - 以 PNG 格式提取文档图像
使用 cURL 命令下载 PDF 图像
还可以使用 Aspose.PDF Cloud API 和 cURL 命令从 PDF 文件中提取图像。通过使用 cURL 命令,您可以向 API 端点发出 HTTP 请求并轻松从 PDF 中提取图像。这种方法提供了灵活性和便利性,因为您可以将图像提取功能直接集成到脚本或应用程序中。此外,您还可以通过任何平台(即 Windows、Linux、macOS 或其他操作系统)上的命令行终端访问 REST API。
在本节中,我们将使用 cURL 命令提取 PNG 格式的图像并将输出保存到云存储。因此,第一步是通过执行以下命令生成 JSON Web Token (JWT)。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
现在,请执行以下命令,仅从 PDF 文档的第 3 页提取图像。图像以 PNG 格式提取。
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H "Accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
上述示例中使用的示例 PDF 文件可以从 URL2PDF.pdf 下载。
结论
总之,从 PDF 文件中提取图像是一项很有价值的功能,可以使用 Aspose.PDF Cloud SDK for Python 和 cURL 命令来实现。无论您喜欢 Python 编程的便利性和简单性还是 cURL 命令的多功能性,Aspose.PDF Cloud 都提供了强大的 API 来完成此任务。通过利用云的强大功能,您可以轻松地从 PDF 文档中提取图像,从而增强您的工作流程。尽管如此,使用 Aspose.PDF Cloud,您可以灵活地选择最适合您需求的方法,并将图像提取功能无缝集成到您的项目中。
有用的资源
-许可订阅
相关文章
我们还建议您访问以下链接以了解更多信息: