
使用 C# .NET 开发 PDF 到 HTML 转换器
大多数人使用可移植文档格式 (PDF),因为在任何平台上查看这些文件时,文档格式都会保留。无论是在桌面还是移动平台上查看,文档的保真度都不会受到影响。但是,为了查看 PDF 文件,您需要使用特定的查看器应用程序。因此,为了克服这些缺点,HTML 格式可以成为可行的解决方案之一。在本文中,我们将讨论如何使用 C# .NET 将 PDF 转换为 HTML 的详细信息。
在本文中,我们将详细讨论以下主题
PDF 到 HTML 转换 API
Aspose.PDF Cloud 基于 REST 架构,提供创建、编辑以及将 PDF 转换为 支持的文档格式 的功能,包括 HTML、JPEG、DOCX、PPTX、XLSX、SVG 等。在本文中,我们将重点介绍如何使用 C# .NET 将 PDF 转换为 HTML 的步骤。此任务可以使用 Aspose.PDF Cloud SDK for .NET 来完成,它是 Aspose.PDF Cloud 的包装器,因此您可以在 .NET 应用程序中获得 REST API 的所有功能。
该 SDK 可在 NuGet 和 GitHub 上下载,要从 NuGet 库安装它,请在 NuGet 包管理器中执行以下命令:
Install-Package Aspose.Pdf-Cloud
或者,您也可以考虑将 SDK 直接作为 NuGet 包安装在 Visual Studio 项目中。您需要做的就是在解决方案资源管理器中展开项目树,右键单击“包”文件夹,然后从上下文菜单中选择“管理 NuGet 包…”选项。

图 1:- 管理 NuGet 包。
现在在搜索栏中搜索 Aspose.PDF Cloud,启用包名称旁边的复选框,然后单击添加包按钮。

图 2:- NuGet 包中的 Aspose.PDF Cloud SDK。
请注意 Aspose.Pdf-Cloud.dll 出现在 Packages 文件夹下。

图 3:- 解决方案资源管理器下的 Aspose.Pdf-cloud.dll。
安装完成后,您需要使用现有的 GitHub 或 Google 帐户登录云仪表板,或者单击 创建新帐户 按钮。
将 PDF 转换为 HTML - 结果响应
请按照以下步骤执行 PDF 到 HTML 的转换操作。输入 PDF 从云存储加载,并将生成的 HTML 作为响应流上下文返回,该上下文可以保存在本地驱动器中或直接显示在 Web 浏览器中。
- 第一步是创建一个字符串变量来定义客户端 ID 和客户端机密的详细信息。
- 其次,创建 PdfApi 的实例,并传递客户端 ID 和客户端密钥变量作为参数。
- 第三,读取PDF文件的内容并将其加载到Stream实例中。
- 然后使用 PdfApi 类的 UploadFile(…) 方法将 PDF 文件上传到云存储。
- 最后调用GetPdfInStorageToHtml(…)方法执行转换。
// 从 https://dashboard.aspose.cloud/ 获取客户端凭证
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// 创建 PdfApi 实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 输入PDF文件的路径
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// 将PDF文件内容读入Stream实例
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// 云存储中的文件名称
String fileNameinStorage = "MyUploaded.pdf";
try
{
// 将 PDF 上传至云存储
pdfApi.UploadFile(fileNameinStorage, fs);
// 执行文档转换
var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
// 在控制台中写入结果
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF 转 HTML - 结果存储在云中
在本节中,我们将使用一种方法将 PDF 文件转换为 HTML 并将输出保存在云存储中。请按照以下步骤完成此要求:
- 首先,通过传递客户端 ID 和客户端机密详细信息作为参数来创建 PdfApi 类的实例。
- 其次,将输入的PDF文件读入Stream实例,并指定以.zip为扩展名的输出文件名。
- 第三,使用 UploadFile(…) 方法将 PDF 文件上传到云存储。
- 倒数第二,调用 PutPdfInStorageToHtml(…) 方法,该方法以输入的 PDF 文件名和结果文件名作为参数。
- 最后在控制台打印响应代码。
// 从 https://dashboard.aspose.cloud/ 获取客户端凭证
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// 创建 PdfApi 实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 输入PDF文件的路径
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// 将PDF文件内容读入Stream实例
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// 云存储中的文件名称
String fileNameinStorage = "MyUploaded.pdf";
// 云存储中结果文件的名称
string resFileName = "result.zip";
// 将文件上传至云存储
try
{
// 将文件上传至云存储
pdfApi.UploadFile(fileNameinStorage, fs);
// 执行 PDF 到 HTML 的转换并将文件保存在云存储中
var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
// 在控制台中打印响应代码
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
本地驱动器 PDF 转 HTML - 云存储中输出
在本节中,我们将讨论如何从本地驱动器加载 PDF,然后在线将 PDF 转换为 HTML 并将输出保存在云存储中的步骤。
- 第一步是创建 PdfApi 的实例,同时传递客户端 ID 和客户端密钥作为参数。
- 其次,定义输入 PDF 和结果 .zip 的字符串变量,以便存储在云存储中。
- 第三,将输入的 PDF 加载到流实例中。
- 最后,调用 PutPdfInRequestToHtml(…) 方法,该方法以结果文件名和保存 PDF 的流作为参数。输出保存在云存储中。
// 从 https://dashboard.aspose.cloud/ 获取客户端凭证
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// 创建 PdfApi 实例
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// 输入PDF文件的路径
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// 云存储中的文件名称
String resultantFile = "converted.zip";
try
{
using (Stream stream = System.IO.File.OpenRead(inputFile))
{
// 启动 PDF 到 HTML 的转换
var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
// 在控制台中打印响应代码(成功为 200)
Console.WriteLine(response);
} // stream ends here
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
结论
在本文中,我们讨论了如何通过各种方法将 PDF 转换为 HTML 的步骤。我们设法加载已存储在云存储中的 PDF 文件,并从本地驱动器加载文件并将其转换为 HTML 格式。请注意,Aspose.PDF Cloud SDK for .NET 是根据 MIT 许可证分发的,其完整源代码可通过 GitHub 下载。如果您在使用 API 时遇到任何问题,或者您有任何相关疑问,请随时通过 免费产品支持论坛 与我们联系。
相关链接
我们还建议您访问以下链接以了解更多信息: