pdf 到 xml

使用 .NET REST API 将 PDF 转换为 XML。

在数字领域,需要将 PDF 转换为 XML(可扩展标记语言) )从未如此重要。尽管 PDF 在保留格式和共享方面非常出色,但在提取和构建数据时往往会带来挑战。另一方面,XML 是一种通用标记语言,旨在组织、存储和传输数据。通过将 PDF 转换为 XML,我们弥合了非结构化内容和结构化数据之间的差距,从而支持从数据分析到内容可重用性的大量应用程序。

让我们深入研究如何使用 .NET REST API 将 PDF 转换为 XML 的详细信息。

用于 PDF 到 XML 转换的 REST API

利用 Aspose.PDF Cloud SDK for .NET 的功能,转换变得无缝且有效。除了 PDF 到 XML 的转换之外,这个强大的 SDK 还提供从文档操作到数据提取的一系列功能。让我们探索将 PDF 转换为 XML 的过程,以彻底改变我们处理和利用文档数据的方式。

请在 Visual Studio IDE 中的 NuGet 包管理器中搜索“Aspose.PDF-Cloud”,然后单击“添加包”按钮,以便将 SDK 引用添加到项目中。

您还需要从云仪表板 获取您的客户端凭据。如果您没有现有帐户,只需按照快速启动 中指定的说明创建一个免费帐户即可。

在 C# .NET 中开发 PDF 到 XML 文件转换器

请按照下面给出的说明将 PDF 文件转换为 XML 以实现数据的结构化表示。

// 有关更多示例,https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// 从 https://dashboard.aspose.cloud/ 获取客户端凭据
string clientSecret = "c71cfe618cc6c0944f8f96bdef9813ac";
string clientID = "163c02a1-fcaa-4f79-be54-33012487e783";

// 创建 PdfApi 的实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

var response = pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

if (response != null)
{
    Console.WriteLine("PDF to XML conversion completed successfully !");
}
saveToDisk(response,"ResultantFile.xml");


// 将流内容保存到本地驱动器上的文件的自定义方法
public static void saveToDisk(Stream responseStream, String resultantFile)
{
    var fileStream = File.Create(resultantFile);
    responseStream.Seek(0, SeekOrigin.Begin);
    responseStream.CopyTo(fileStream);
    fileStream.Close();
}

下面给出了有关上述代码片段的快速详细信息。

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

创建 PdfApi 类的对象,同时传递客户端凭据作为输入参数。

pdfApi.GetPdfInStorageToXml("Hardy02.pdf");

现在,调用 API 将带标签的 PDF 文件转换为 XML 格式。然后我们使用自定义方法将输出保存到本地驱动器。

使用 cURL 命令将 PDF 转换为 XML

当将 Aspose.PDF Cloud API 与 cURL 命令结合使用时,从 PDF 到 XML 的转换变得非常高效和灵活。这种强大的组合不仅简化了转换过程,还增强了各种应用程序中的数据可访问性和可用性。现在让我们进一步探讨此转换的一些细节,因为它有助于轻松地提取、共享和解释数据。

此方法的第一步是生成 JWT 访问令牌。因此,请执行以下命令:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=163c02a1-fcaa-4f79-be54-33012487e783&client_secret=c71cfe618cc6c0944f8f96bdef9813ac" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

生成 JWT 令牌后,我们需要执行以下命令将带标签的 PDF 文件转换为 XML 格式。转换后,生成的 XML 存储在本地驱动器上。

curl -v "https://api.aspose.cloud/v3.0/pdf/{sourceFile}/convert/xml" \
-X GET \
-H "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.xml"

sourceFile 替换为云存储中已有的输入 PDF 文件的名称,并将 accessToken 替换为上面生成的 JWT 访问令牌。

结论

总之,无论是选择强大的 Aspose.PDF Cloud SDK for .NET 还是将 cURL 命令与 Aspose.PDF Cloud 结合使用,我们都可以轻松实现从 PDF 无缝转换为 XML 格式的目标,从而提高数据利用率。因此,无论选择哪种方法,这两种方法都是强大的工具,彻底改变了我们从 PDF 中构建和提取数据的方式。

有用的链接

相关文章

我们强烈建议访问以下博客: