使用 Python Cloud SDK 开发 PDF 到 Excel 转换器。

如何将 PDF 转换为 Excel | 使用 Python SDK 将 PDF 导出到 Excel
PDF 文件非常适合保存文档格式,但从中提取和利用数据可能很复杂。这就是将 PDF 转换为 Excel 的必要性所在。Excel 工作簿采用电子表格格式,提供了一种组织和处理数据的结构化方法。想象一下无缝地从 PDF 中提取表格、图形和文本,并将它们整齐地排列在 Excel 单元格中,以供分析。这种转换不仅简化了数据处理,还提高了效率和生产力。
此外,Excel 主要用于存储和组织数据,例如收入、工资单和会计信息。它们允许用户使用这些数据进行计算并生成图形和图表。现在,在本文中,我们将讨论如何将 PDF 转换为 Excel 格式的详细信息。
用于 PDF 处理的 Python Cloud SDK
Aspose.PDF Cloud SDK for Python 是一款功能强大的工具,可简化 PDF 到 XLS 的转换过程。它不仅有助于实现无缝的“pdf 到 excel”转换,而且还提供了大量其他功能。想象一下,利用这种功能,您可以轻松操作 PDF、提取特定数据并生成 Excel 就绪文件。
第一步是安装 Python Cloud SDK,可通过 PIP 和 GitHub 存储库下载。因此,请在终端/命令提示符上执行以下命令来安装最新版本的 Cloud SDK。
pip install asposepdfcloud
微软 Visual Studio
如果您需要在Visual Studio IDE中直接在Python项目中添加引用,请在Python环境窗口下搜索asposepdfcloud作为包。 请按照下图中编号的步骤完成安装过程。

图 1:- Aspose.PDF Cloud SDK for Python 包。
PyCharm
PyCharm 是一款流行的 Python 开发 IDE。在本节中,我们将讨论 Windows 平台上的 PyCharm 设置。
- 单击文件菜单并选择设置…菜单项。

图 2:- PyCharm 设置菜单项。
- 从左侧展开项目树并选择 Python 解释器选项。
- 单击右侧的 +(加号),然后在可用包对话框的搜索字段中输入 asposepdfcloud。
- 现在单击安装包按钮。

图 3:Aspose.PDF Cloud for Python 包。
SDK 安装完成后,会显示成功消息。

图 4:Aspose.PDF Cloud for Python 安装成功后显示的消息。
- 如果您在 云仪表板 上没有现有帐户,您可以使用 GitHub 或 Google 凭证创建一个免费帐户。现在登录仪表板并获取您的个性化客户端凭证。

图 5:- Aspose.Cloud 仪表板上的客户端凭证。
使用 Python 将 PDF 转换为 Excel
请按照以下说明使用 Python 代码片段将 PDF 转换为 Excel 工作簿 (XLSX)。请注意,以下代码片段要求输入 PDF 可在云存储中使用。
- 首先,创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
- 其次,创建一个 PdfApi 类的实例,该实例以 ApiClient 对象作为参数。
- 现在指定输入 PDF 的名称和生成的 XLSX 文件名。
- 最后,调用方法 putpdfinstoragetoxlsx(..),该方法采用输入 PDF 文件、生成的 XLSX 文件名和可选参数来生成统一的工作表。
# 有关更多代码示例,请访问https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# 如需客户端凭证,请访问 https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# 生成的 Excel 工作簿的名称
resultant_file_name = 'Resultant.xlsx'
# 调用API将PDF转换为Excel格式
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# 在控制台中打印消息(可选)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

图 6:- PDF 到 Excel 转换预览。
上述示例使用的示例文件可以从awesomeTable.pdf和Resultant.xlsx下载。
使用 cURL 命令将 PDF 转换为 XLS
使用 Aspose.PDF Cloud 和 cURL 命令可以轻松将 PDf 转换为 XLS,因为它代表了一种简化且自动化的方法。通过结合使用 cURL 命令和 Aspose.PDF Cloud,我们不仅简化了转换过程,而且还实现了与各种工作流程的无缝集成。
此方法的第一步是根据客户端凭据生成 JSON Web Token (JWT)。因此,请执行以下命令来生成 JWT 令牌。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
一旦我们有了 JWT 令牌,请执行以下命令将 PDF 转换为 XLS 格式。
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
结论
总之,无论是选择强大的 Aspose.PDF Cloud SDK for Python 还是结合使用 cURL 命令与 Aspose.PDF Cloud,我们都可以轻松实现将 PDF 转换为 Excel 格式的目标。Aspose.PDF Cloud SDK for Python 提供了一个全面且开发人员友好的解决方案,为您提供了除转换之外的一系列功能。另一方面,利用 cURL 命令提供了一种多功能且可编写脚本的方法。无论选择哪种方法,这两种方法都是强大的工具,彻底改变了我们构造和提取 PDF 数据的方式。
- 如果您在使用 Python Cloud SDK 时遇到任何问题,请随时通过 免费客户支持论坛 联系我们。
相关文章
我们建议您阅读以下文章来了解: