
PDF 到 Word 转换器 | PDF 到 DOC 转换 API
PDF 是广泛用于信息共享的文件格式之一。它之所以受欢迎,是因为它能够在所有平台和所有设备(桌面、移动设备等)上保留文档保真度。但是,如果我们需要对 PDF 文件进行任何更改,则需要使用特定应用程序来打开和编辑 PDF 文档。但对于大量更新,将 PDF 文件转换为 Word 文档是一种可行的解决方案。此外,对于批量转换,编程 SDK 是一种有效的解决方案。在本文中,我们将讨论如何使用 Python SDK 将 PDF 转换为 Word 的详细信息。
文字处理API
Aspose.Words Cloud 是我们屡获殊荣的基于 REST 的 API,提供创建、编辑和转换 Word 文件 HTML、JPEG、PNG 和其他 支持的文件格式 的功能。同时,它还支持加载 PDF 文档并将其呈现为 MS Word (DOCX、DOC、DOT、RTF、DOCM) 或 OpenDocument (ODT、OTT) 的功能。为了执行此转换,无需下载或安装第三方软件,并使用我们云端的文档处理引擎执行所有转换。现在,为了在 Python 应用程序中实现文档转换操作,您需要尝试使用 Aspose.Words Cloud SDK for Python,它是 Cloud API 的包装器。
安装
SDK 可以在 PIP 和 GitHub 下载。在命令行终端执行以下命令安装 SDK
pip install aspose-words-cloud
PyCharm IDE
如果您正在使用 PyCharm IDE,您可以直接将 SDK 作为依赖项添加到您的项目中。
文件 ->设置 ->项目 ->Python 解释器 ->asposewordscloud

图 1:- PyCharm 设置选项。

图 2:- Aspose.Words Python 包。
使用 Python 将 PDF 转换为 Word
请按照以下说明将 PDF 文件转换为 Word 格式。
- 首先,我们需要创建 ApiClient 对象,并传递 ClientID 和 ClientSecret 详细信息作为参数。
- 其次,创建 WordsApi 的实例并传递 ApiClient 实例作为参数。
- 第三,使用 UploadFileRequest(..) 方法将 PDF 文件上传到云存储。
- 现在创建一个 SaveOptionsData 对象的对象,其中我们将 docx 定义为导出格式。
- 下一步是创建一个 SaveAsRequest 实例,它以 PDF 文件名和 SaveOptionsData 对象作为参数。
- 最后调用WordsApi类的saveas(..)执行转换操作。
# 如需更多示例,请访问 https://github.com/aspose-words-cloud/aspose-words-cloud-python
# 初始化 Aspose.Words Python 对象
words_api = WordsApi("6185429e-17ce-468d-bb81-a51ac9d96c16","73a07e2fb010f559e482d854fe5a8f49")
# 输入PDF文档
inputFileName = 'awesome_table_in_pdf.pdf'
# 生成的 Word 文档的名称
resultantFile = 'Converted.docx'
# 将 PDF 文档上传至云存储
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open(inputFileName, 'rb'), "", None))
# 文档导出选项
request_save_options_data = asposewordscloud.SaveOptionsData(save_format='docx', file_name=resultantFile)
# 在传递输入 PDF 名称和 Word 导出选项的同时创建文档 SaveAs 请求
request = asposewordscloud.models.requests.SaveAsRequest(name=inputFileName,
save_options_data=request_save_options_data,
folder=None)
# 启动转换操作
result = words_api.words_api.save_as(request)
# 在控制台打印结果
print("Result {}".format(result))
上述代码片段中使用的示例文件可以从awesometableinpdf.pdf和Converted.docx下载。
使用 cURL 命令将 PDF 转换为 DOC
与其他 REST API 一样,Aspose.Words Cloud 也可以通过 cURL 命令访问。但在进行 API 访问之前,我们需要根据 Aspose.Cloud 仪表板 上指定的客户端凭据生成 JWT 访问令牌。请执行以下 cURL 命令来生成 JWT 访问令牌。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
现在我们可以使用以下命令将云存储中的 PDF 文件转换为 Word 格式。在以下命令中,我们使用 -o 参数将输出保存在本地驱动器上。
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o Converted.docx
如果需要将输出的word文档直接保存到云存储中,请使用以下命令。请注意以下命令中的outPath请求参数。
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx&outPath=newResultant.docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
结论
在本文中,我们探索了 Aspose.Words Cloud 的惊人功能,即如何使用 Python API 将 PDF 转换为 Word。同样,我们还探索了使用 cURL 命令将 PDF 导出为 DOC 或其他受支持格式的细节。此外,您还可以尝试使用 Swagger 接口 在 Web 浏览器中访问 API。此外,Cloud SDK 是在 MIT 许可下开发的,因此其完整的源代码可在 GitHub 存储库中找到。
如果您在使用 API 时遇到任何问题或有任何相关疑问,请通过 免费产品支持论坛 联系我们。
相关文章
我们建议您访问以下链接以了解更多信息: