提取PDF图像

使用 .NET REST API 提取 PDF 图像。

在当今的数字时代,信息丰富,视觉效果比以往更有效地传达信息,从 PDF 中提取图像的需求是不可否认的。 PDF 是一种流行的共享文档格式,这些文件通常包含需要访问或重新利用的关键图像。无论您是想在演示文稿中使用图像、将它们合并到报告中还是在各种平台上共享它们,从 PDF 中提取图像的功能都是一个强大的工具。

本文重点介绍了 PDF 图像提取的迫切需求,并深入介绍了使用 .NET Cloud SDK 实现这一目标的有效方法。

.NET Cloud SDK 提取 PDF 图像

Aspose.PDF Cloud SDK for .NET 是一个功能强大的工具包,不仅可以让您高效地提取图像,还提供一系列管理和操作功能PDF 文档。此外,它还提供图像提取之外的功能,例如文本提取、水印、注释添加和文档转换。

现在,第一步是在我们的项目中添加 SDK 引用,为此,请在 Visual Studio IDE 内的 NuGet 包管理器中搜索“Aspose.PDF-Cloud”,然后单击“添加包”按钮。

您还需要从云仪表板 获取您的客户端凭据。如果您没有现有帐户,只需按照快速启动 中指定的说明创建一个免费帐户即可。

使用 C# .NET 提取 PDF 图像

让我们重点关注图像提取的细节,以使用 C# .NET 将文档处理和数据提取提升到一个全新的水平。

// 有关更多示例,https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// 从 https://dashboard.aspose.cloud/ 获取客户端凭据
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// 创建 PdfApi 的实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// 使用.NET REST API调用API提取PDF图像
var response = pdfApi.PutImagesExtractAsJpeg("Instructions-for-Adding-Your-Logo-2.pdf", 1);

// 
if (response != null && response.Status.Equals("OK"))
{
    Console.WriteLine("Operation completed successfully !");
    Console.ReadKey();
}
从pdf中提取图片

预览从 PDF 文件中提取的 pf 图像。

下面给出了有关上述代码片段的快速详细信息。

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

创建 PdfApi 类的对象,同时传递客户端凭据作为输入参数。

var response = pdfApi.PutImagesExtractAsJpeg("Instructions-for-Adding-Your-Logo-2.pdf", 1);

现在,调用API从PDF文档的第一页中提取图像。成功完成后,提取的JPG图像将存储在云存储中。

上述示例中使用的示例 PDF 文件可以从 [Instructions-for-Adding-Your-Logo-2.pdf](https://www.entnet.org/wp-content/uploads/2021/04/Instructions -用于添加您的徽标-2.pdf)。

使用 cURL 命令从 PDF 中提取图片

使用 Aspose.PDF Cloud 和 cURL 命令从 PDF 中提取图像是一个简单而高效的过程。通过使用 cURL 命令,您可以向 Aspose.PDF Cloud API 发送 HTTP 请求以无缝启动图像提取。这种方法简化了流程,可以有效地从 PDF 中提取图片,而无需进行大量编码。

此方法的第一步是生成 JWT 访问令牌。因此,请执行以下命令:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

现在,请执行以下命令从 PDF 文档的第 3 页中提取照片,并将提取的图像以 JPG 格式保存在云存储中。

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/pages/3/images/extract/jpeg?width=0&height=0" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-d{}

将“inputPDF”替换为云存储中可用的输入 PDF 文件的名称,并将“accessToken”替换为上面生成的 JWT 访问令牌。

结论

总之,从 PDF 文档中提取图像的能力是利用 PDF 中经常嵌入的丰富视觉内容的重要组成部分。本文探讨了实现此目的的两种有效方法:使用适用于 .NET 的 Aspose.PDF Cloud SDK 以及通过 cURL 命令利用 Aspose.PDF Cloud。因此,这两种方法之间的选择取决于具体的项目要求、技术专长和首选集成方法,为用户提供满足其独特需求的灵活性。

有用的链接

相关文章

我们强烈建议访问以下博客: