PDF 到 HTML

使用 .NET REST API 将 PDF 转换为 HTML。

PDF 文档因其在不同设备和平台上的一致格式而成为共享信息的热门选择。但当涉及到在网站上显示内容时,PDF 可能并不总是最用户友好的选择。然而,将 PDF 文件转换为 HTML 格式为 Web 开发人员和内容创建者打开了一个充满可能性的世界。这种转换的另一个原因是内容呈现和可访问性是在线成功的关键因素,因为它可以被搜索引擎索引。

在本文中,我们将深入研究如何使用 .NET REST API 将 PDF 转换为 HTML 的详细信息。

用于 PDF 到 HTML 转换的 REST API

借助 Aspose.PDF Cloud SDK for .NET 的强大功能,可以轻松完成 PDF 到 HTML 的转换。该 API 允许您将 PDF 转换功能无缝集成到您的 .NET 应用程序和工作流程中。只需几行代码,您就可以轻松地将 PDF 文档转换为 HTML 格式,使其适合 Web 显示和交互。 REST API 提供了广泛的功能来控制转换过程。您还可以通过指定默认字体名称、文档类型、布局、图像分辨率和各种其他配置来自定义输出 HTML。

为了开始此转换过程,首先我们需要在项目中添加 SDK 引用,为此,请在 Visual Studio IDE 内的 NuGet 包管理器中搜索“Aspose.PDF-Cloud”,然后单击“添加包”按钮。您还需要从云仪表板获取您的客户端凭据。如果您没有现有帐户,只需按照快速启动 中指定的说明创建一个免费帐户即可。

使用 C# .NET 将 PDF 转换为 HTML

现在我们需要执行以下代码片段来执行转换,以便我们可以将 PDF 渲染到网站。

// 有关更多示例,https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// 从 https://dashboard.aspose.cloud/ 获取客户端凭据
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// 创建 PdfApi 的实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// 输入PDF文件名
String inputFile = "Binder1-1.pdf";
// 读取输入PDF文件的内容
var pdfFile = System.IO.File.OpenRead(inputFile);

// 调用API将PDF文件转换为HTML并将输出保存到云存储
// 我们已将输出 HTML 格式指定为“HTML5” 
// 启用将每个 PDF 页面保存为单独的 HTML 文件的标志
// 输出将生成为 .ZIP 存档
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF 到 HTML

PDF 到 HTML 转换预览。

下面给出了有关上述代码片段的快速详细信息。

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

首先,创建 PdfApi 类的对象,同时传递客户端凭据作为输入参数。

var pdfFile = System.IO.File.OpenRead(inputFile);

从本地驱动器读取 PDF 文件的内容。

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

调用 API 将 PDF 从输入流转换为 HTML 格式。在转换过程中,我们指定了将每个 PDF 页面保存到单个 HTML 文件的值。

请访问 PutPdfInRequestToHtml 以获取此 API 调用支持的参数的完整列表及其相关详细信息。

上面示例中使用的输入PDF文档可以从Binder1.pdf

使用 cURL 命令在线将 PDF 转换为 HTML

使用 cURL 命令结合 Aspose.PDF Cloud 将 PDF 转换为 HTML 也是一种多功能且高效的方法。通过利用 cURL 命令的强大功能,您可以轻松地将 Aspose.PDF Cloud API 集成到您的应用程序中,并自动执行 PDF 到 HTML 的转换过程。此外,使用 cURL 命令可以轻松地与 RESTful 端点进行交互,从而实现无缝通信和数据交换。因此,为了在 HTML 浏览器中显示 PDF,我们只需调用几个 cURL 命令即可将 PDF 文件转换为 HTML,这显着减少了开发时间和精力。

此方法的第一步是生成 JWT 访问令牌。因此,请执行以下命令:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

现在我们需要执行以下 cURL 命令,该命令从云存储加载 PDF 文件,将整个文档转换为 HTML 格式,并将输出另存为本地驱动器上的 .ZIP 存档(名称由 -o 参数指定)。

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

将“inputPDF”替换为云存储中可用的输入 PDF 文档的名称,将“accessToken”替换为上面生成的 JWT 访问令牌。

结论

总之,使用 Aspose.PDF Cloud API 将 PDF 转换为 HTML 提供了全面且多功能的解决方案。无论是使用 .NET REST API 进行无缝集成,还是使用 cURL 命令进行高效转换,Aspose.PDF Cloud SDK 都提供了广泛的功能和自定义选项。这些方法可确保将 PDF 内容准确呈现为响应式 HTML,保留布局和格式以获得最佳用户体验。此外,在 HTML 页面中嵌入 PDF 内容的功能允许多功能和交互式 Web 应用程序,从而增强可访问性和用户参与度。

有用的链接

相关文章

我们强烈建议访问以下博客: