使用 Python Cloud SDK 开发 PDF 到 Excel 转换器。

将 PDF 转换为 Excel

如何将 PDF 转换为 Excel | 使用 Python SDK 将 PDF 导出到 Excel

PDF 文件非常适合保存文档格式,但从中提取和利用数据可能很复杂。这就是将 PDF 转换为 Excel 的必要性所在。Excel 工作簿采用电子表格格式,提供了一种组织和处理数据的结构化方法。想象一下无缝地从 PDF 中提取表格、图形和文本,并将它们整齐地排列在 Excel 单元格中,以供分析。这种转换不仅简化了数据处理,还提高了效率和生产力。

此外,Excel 主要用于存储和组织数据,例如收入、工资单和会计信息。它们允许用户使用这些数据进行计算并生成图形和图表。现在,在本文中,我们将讨论如何将 PDF 转换为 Excel 格式的详细信息。

用于 PDF 处理的 Python Cloud SDK

Aspose.PDF Cloud SDK for Python 是一款功能强大的工具,可简化 PDF 到 XLS 的转换过程。它不仅有助于实现无缝的“pdf 到 excel”转换,而且还提供了大量其他功能。想象一下,利用这种功能,您可以轻松操作 PDF、提取特定数据并生成 Excel 就绪文件。

第一步是安装 Python Cloud SDK,可通过 PIPGitHub 存储库下载。因此,请在终端/命令提示符上执行以下命令来安装最新版本的 Cloud SDK。

pip install asposepdfcloud

微软 Visual Studio

如果您需要在Visual Studio IDE中直接在Python项目中添加引用,请在Python环境窗口下搜索asposepdfcloud作为包。 请按照下图中编号的步骤完成安装过程。

将 PDF 保存为 Excel

图 1:- Aspose.PDF Cloud SDK for Python 包。

PyCharm

PyCharm 是一款流行的 Python 开发 IDE。在本节中,我们将讨论 Windows 平台上的 PyCharm 设置。

  • 单击文件菜单并选择设置…菜单项。
PyCharm 设置

图 2:- PyCharm 设置菜单项。

  • 从左侧展开项目树并选择 Python 解释器选项。
  • 单击右侧的 +(加号),然后在可用包对话框的搜索字段中输入 asposepdfcloud。
  • 现在单击安装包按钮。
将 PDF 转换为 Excel SDK

图 3:Aspose.PDF Cloud for Python 包。

SDK 安装完成后,会显示成功消息。

PDF 转 Excel SDK

图 4:Aspose.PDF Cloud for Python 安装成功后显示的消息。

  • 如果您在 云仪表板 上没有现有帐户,您可以使用 GitHub 或 Google 凭证创建一个免费帐户。现在登录仪表板并获取您的个性化客户端凭证。
客户端凭证

图 5:- Aspose.Cloud 仪表板上的客户端凭证。

使用 Python 将 PDF 转换为 Excel

请按照以下说明使用 Python 代码片段将 PDF 转换为 Excel 工作簿 (XLSX)。请注意,以下代码片段要求输入 PDF 可在云存储中使用。

  • 首先,创建 ApiClient 类的实例,并提供客户端 ID 客户端密钥作为参数。
  • 其次,创建一个 PdfApi 类的实例,该实例以 ApiClient 对象作为参数。
  • 现在指定输入 PDF 的名称和生成的 XLSX 文件名。
  • 最后,调用方法 putpdfinstoragetoxlsx(..),该方法采用输入 PDF 文件、生成的 XLSX 文件名和可选参数来生成统一的工作表。
# 有关更多代码示例,请访问https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# 如需客户端凭证,请访问 https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # 创建 PdfApi 实例并传递 PdfApiClient 作为参数
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # 生成的 Excel 工作簿的名称
        resultant_file_name = 'Resultant.xlsx'
    
        # 调用API将PDF转换为Excel格式
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # 在控制台中打印消息(可选)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
PDF 到 XLSX 预览

图 6:- PDF 到 Excel 转换预览。

上述示例使用的示例文件可以从awesomeTable.pdfResultant.xlsx下载。

使用 cURL 命令将 PDF 转换为 XLS

使用 Aspose.PDF Cloud 和 cURL 命令可以轻松将 PDf 转换为 XLS,因为它代表了一种简化且自动化的方法。通过结合使用 cURL 命令和 Aspose.PDF Cloud,我们不仅简化了转换过程,而且还实现了与各种工作流程的无缝集成。

此方法的第一步是根据客户端凭据生成 JSON Web Token (JWT)。因此,请执行以下命令来生成 JWT 令牌。

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

一旦我们有了 JWT 令牌,请执行以下命令将 PDF 转换为 XLS 格式。

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

结论

总之,无论是选择强大的 Aspose.PDF Cloud SDK for Python 还是结合使用 cURL 命令与 Aspose.PDF Cloud,我们都可以轻松实现将 PDF 转换为 Excel 格式的目标。Aspose.PDF Cloud SDK for Python 提供了一个全面且开发人员友好的解决方案,为您提供了除转换之外的一系列功能。另一方面,利用 cURL 命令提供了一种多功能且可编写脚本的方法。无论选择哪种方法,这两种方法都是强大的工具,彻底改变了我们构造和提取 PDF 数据的方式。

相关文章

我们建议您阅读以下文章来了解: