
了解如何使用 Python 将 PDF 转换为 HTML
在当今快节奏的数字世界中,文档可访问性是企业和个人的关键考虑因素。将 PDF 文档转换为 HTML 的需求从未如此明显。尽管 PDF 文件非常适合保留文档格式,但在网络上使用它们可能会很麻烦。它们通常缺乏现代在线体验所需的交互性和适应性。这就是 Python REST API 介入以弥补差距的地方。本文探讨了对 PDF 到 HTML 转换的不断增长的需求,以及 Python REST API 如何彻底改变这一过程。
用于 PDF 到 HTML 转换的 Python REST API
使用 Aspose.PDF Cloud SDK for Python,将 PDF 文档转换为 HTML 格式是一项简单而高效的任务。这个功能强大的 SDK 提供了一系列功能,可以无缝解决 PDF 到 HTML 转换的挑战。无论您需要在网络上展示文档、跨各种平台共享内容还是增强文档可访问性,Aspose.PDF Cloud 都能满足您的需求。
Python Cloud SDK 完全能够创建、编辑或将 PDF 文件转换为各种格式,包括 EPUB、PS、SVG、XLSX、PPTX、DOCX、HTML。
SDK 可通过 PIP 和 GitHub 存储库下载。现在请在终端/命令提示符上执行以下命令,在系统上安装最新版本的 SDK。
pip install asposepdfcloud
如果您需要在Visual Studio IDE中直接在Python项目中添加引用,请在Python环境窗口下搜索asposepdfcloud作为包。 请按照下图中编号的步骤完成安装过程。

图 1:PDF 到 HTML 转换 API。
使用 Python 将 PDF 转换为 HTML
请按照下面给出的说明将 PDF 转换为 HTML 格式。
- 首先,创建 ApiClient 类的实例,并传递 ClinetID 和客户端机密详细信息作为参数。
- 其次,创建一个 PdfApi 对象,我们将 ApiClient 对象作为参数传递。
- 第三,指定输入PDF的名称和结果输出。
- 最后,调用 PdfApi 类的 putpdfinstoragetohtml(…) 方法,启动转换。输出存储在云存储中。
# 有关完整的代码示例,请访问https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi
def pdf2html():
try:
#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")
# 创建 PdfApi 实例并传递 PdfApiClient 作为参数
pdf_api = PdfApi(pdf_api_client)
# 源 PDF 文档
input_file_name = 'completeWorkbook.pdf'
# 结果文件的名称
resultant_file_name = 'CodeConversion.zip'
# 调用API进行转换
# 我们已将输出格式设置为 zip,将文档类型设置为 xhtml
response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)
# 在控制台中打印消息(可选)
print('PDF successfully converted to HTML format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
使用 cURL 命令将 PDF 转换为 HTML
另外,也可以使用 cURL 命令结合 Aspose.PDF Cloud 简化 PDF 到 HTML 的转换。这种方法提供了一种便捷的方式来利用 Aspose.PDF Cloud 的功能来满足您的 PDF 到 HTML 转换需求。当您正在寻找独立于平台和语言的方法来实现无缝的 PDF 到 HTML 转换过程时,这种方法最适合您的要求。
首先,我们需要根据客户端凭证生成 JWT 访问令牌。请执行以下命令来生成 JWT 令牌。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
一旦我们有了 JWT 令牌,我们就可以执行以下命令将云存储中可用的 PDF 文件转换为 HTML 格式,结果输出作为流响应返回。
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip
如果您需要将 PDF 文件转换为 HTML 并且还想将输出保存在云存储中,请尝试使用以下命令。
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

图 2:PDF 到 HTML 转换预览。
结论
总之,从 PDF 到 HTML 的转换过程从未如此顺利。我们探索了 Python REST API 的转换能力以及 Aspose.PDF Cloud 使用 cURL 命令将 PDF 文档转换为动态、可用于 Web 的 HTML 的效率。这些方法不仅可以确保文档的完整性,还可以增强可访问性和可共享性。因此,现在是时候让您的内容可供更广泛的受众访问并提升您的在线形象了。
如果您在使用 API 时遇到任何问题或有任何其他疑问,请随时通过 免费产品支持论坛 与我们联系。
相关文章
我们强烈建议您访问以下链接以了解更多信息: