
PDF 表单是常见的文件类型之一,您可以在其中输入信息、从下拉框中选择项目以及根据需要勾选字段。PDF 目前支持两种不同的数据和 PDF 表单集成方法,即 AcroForms(也称为 Acrobat 表单)和 XML 表单架构 (XFA) 表单。要填写表单,您可以在线填写表单,也可以在计算机上保存表单副本,然后使用 Adobe Acrobat Reader 填写表单。填写完表单后,您可能想要使用文档中填写的数据,为此,您可能需要将其导出为 XML、FDF 和 XFDF 格式。在本文中,我们将讨论如何使用 Python 和其他受支持的格式以编程方式将 PDF 导出为 XML 的详细信息。
- PDF处理API
- 使用 Python 将 PDF 导出为 XML
- 使用 Python 将 PDF 导出为 FDF
- 使用 Python 将 PDF 导出为 XFDF
- 使用 cURL 命令将 PDF 转换为 XML
PDF处理API
Aspose.PDF Cloud 是一款屡获殊荣的 REST API,提供创建、编辑和将各种文件格式转换为 PDF 格式的功能。同时,它还支持将 PDF 文件导出为 XLSX、PPTX、DOCX、EPUB、HTML 等以及各种其他 支持格式 的功能。
它还使您能够使用 PDF 表单,您可以:
由于 API 是基于 REST 的,因此可以在任何平台和任何应用程序(即桌面、移动、Web、混合等)上访问它。现在,为了进一步方便我们的用户,我们创建了特定于编程语言的 SDK,以便您获得您选择的语言中的所有 PDF 处理功能。
现在,为了在 Python 应用程序中实现 PDF 处理功能,我们创建了 Aspose.PDF Cloud SDK for Python,它是 Aspose.PDF Cloud 的包装器。因此,使用此 SDK 时,您可以在 Python 应用程序中获得所有 PDF 处理功能。现在,为了开始使用此 SDK,第一步是安装它。SDK 可通过 PIP 和 GitHub 存储库免费下载。只需在终端/命令提示符上执行以下命令即可在系统上安装最新版本的 SDK。
pip install asposepdfcloud
免费云仪表板帐户
下一个重要步骤是通过 Aspose.Cloud 仪表板 免费订阅我们的云服务。此订阅的目的是仅允许授权人员访问我们的文件处理服务。如果您有 GitHub 或 Google 帐户,只需注册或单击 创建新帐户 按钮并提供所需信息。现在使用凭据登录仪表板并从仪表板展开应用程序部分,然后向下滚动到客户端凭据部分以查看客户端 ID 和客户端密钥详细信息。

图 1:- Aspose.Cloud 仪表板上的客户端凭证。
使用 Python 将 PDF 导出为 XML
请按照以下说明使用 Python 将 PDF 导出为 XML。我们提供了两个 API 来满足此要求
| API | 类型 | URL | 描述 |
| ——————- | —–| —–| ———— |
| /pdf/{name}/export/xml | GET | GetExportFieldsFromPdfToXmlInStorage | 将存储中的 PDF 中的字段导出到 XML 文件。|
| /pdf/{name}/export/xml | PUT | PutExportFieldsFromPdfToXmlInStorage | 将存储中的 PDF 中的字段导出到存储中的 XML 文件。|
- 首先,创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
- 其次,创建一个 PdfApi 类的实例,该实例以 ApiClient 对象作为输入参数。
- 现在调用 putexportfieldsfrompdftoxmlinstorage(..) 方法将 PDF 表单数据导出为 XML 并将结果文件保存到云存储。
def exportPDFtoXML():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
# 源 PDF 文件
input_file = 'FormData-Filled.pdf'
# 生成的 XML 名称
outputXML = 'exportedData.xml'
# 将 PDF 表单数据导出为 XML 并将输出保存在云存储中
response = pdf_api.put_export_fields_from_pdf_to_xml_in_storage(name = input_file, xml_output_file_path=outputXML)
# 在控制台上打印响应
print(response)
# 在控制台中打印消息(可选)
print('PDF Form data successfully exported to XML !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)

图 2:- 以 XML 形式导出的 PDF 数据。
使用 Python 将 PDF 导出为 FDF
请按照以下说明将 PDF 表单数据导出为 FDF 格式,并将输出保存在云存储中。
- 创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
- 现在创建一个 PdfApi 类的实例,它将 ApiClient 对象作为输入参数。
- 最后,调用 putexportfieldsfrompdftofdfinstorage(..) 方法将 PDF 表单数据导出为 FDF,并将结果文件保存到云存储。
def exportPDFtoFDF():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
# 源 PDF 文件
input_file = 'FormData-Filled.pdf'
# 生成的 FDF 名称
outputFDF = 'exportedData.fdf'
# 将 PDF 表单数据导出为 FDF 并将输出保存在云存储中
response = pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(name = input_file, fdf_output_file_path=outputFDF)
# 在控制台上打印响应
print(response)
# 在控制台中打印消息(可选)
print('PDF Form data successfully exported to FDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
请访问以下链接下载源文件 FormData-Filled.pdf 和导出文件 exportedData.fdf。
使用 Python 将 PDF 导出为 XFDF
XFDF 文件是 Acrobat 表单文档文件,用于存储 PDF 文件可用的信息,因此 XFDF 文件会将该数据直接插入 PDF。因此,我们可能需要从一个 PDF 表单导出数据并填写其他 PDF 表单。因此,在本节中,我们将讨论如何将 PDF 表单数据导出为 XFDF 格式的步骤。
- 创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
- 现在创建一个 PdfApi 类的实例,它将 ApiClient 对象作为输入参数。
- 最后,调用 putexportfieldsfrompdftoxfdfinstorage(..) 方法将 PDF 表单数据导出为 XFDF,并将结果文件保存到云存储。
def exportPDFtoXFDF():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
# 源 PDF 文件
input_file = 'FormData-Filled.pdf'
# 生成的 XFDF 名称
outputXFDF = 'exportedData.xfdf'
# 将 PDF 表单数据导出为 XFDF 并将输出保存在云存储中
response = pdf_api.put_export_fields_from_pdf_to_xfdf_in_storage(name = input_file, xml_output_file_path=outputXFDF)
# 在控制台上打印响应
print(response)
# 在控制台中打印消息(可选)
print('PDF Form data successfully exported to XFDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
上述代码生成的示例输出可以从 exportedData.xfdf 下载。

图 3:导出到 XFDF 的 PDF 数据
使用 cURL 命令将 PDF 转换为 XML
REST API 也可以通过 cURL 命令访问,并且可以使用任何平台上的终端应用程序访问它们。由于 Aspose.PDF Cloud 是按照 REST 架构开发的,因此也可以通过 cURL 命令访问它。但是,在执行任何操作之前,我们需要根据您在 Aspose.Cloud 仪表板上指定的个人客户端凭据生成 JSON Web 令牌 (JWT)。这是强制性的,因为我们的 API 仅供注册用户访问。请执行以下命令来生成 JWT 令牌。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
一旦生成 JWT 令牌,请执行以下命令将 PDF 表单数据导出为 XML 格式。
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/FormData-Filled.pdf/export/xml?xmlOutputFilePath=FormDataExported.xml" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
结论
在本文中,我们探讨了如何将 PDF 表单数据导出为 XML、FDF 和 XFDF 格式的细节和步骤。这些要求可以使用 Python 代码片段以及 cURL 命令来实现。我们还建议您浏览 开发人员指南,以了解 API 提供的其他令人兴奋的功能。此外,Aspose.PDF Cloud SDK for Python 的完整源代码已在 GitHub 上提供下载。如果您在使用 API 时遇到任何问题或有任何其他疑问,请随时通过 免费产品支持论坛 与我们联系。
相关文章
我们还建议您访问以下链接以了解更多信息: