
Desarrollar un convertidor de PDF a HTML con C# .NET
La mayoría de las personas utilizan el formato de documento portátil (PDF) debido a que el formato del documento se conserva al visualizar estos archivos en cualquier plataforma. La fidelidad del documento no se ve comprometida cuando se visualiza en una plataforma de escritorio o móvil. Pero, para ver el archivo PDF, debe utilizar una aplicación de visualización específica. Por lo tanto, para superar estas deficiencias, el formato HTML puede ser una de las soluciones viables. En este artículo, vamos a analizar los detalles sobre cómo convertir PDF a HTML utilizando C# .NET.
En este artículo, vamos a discutir los siguientes temas en detalle.
- API de conversión de PDF a HTML
- Convertir PDF a HTML - Resultado en respuesta
- PDF a HTML: resultado en almacenamiento en la nube
- PDF de unidad local a HTML: salida en almacenamiento en la nube
API de conversión de PDF a HTML
Aspose.PDF Cloud se basa en la arquitectura REST y ofrece la capacidad de crear, editar y transformar archivos PDF en Formatos de documentos admitidos, incluidos HTML, JPEG, DOCX, PPTX, XLSX, SVG, etc. En este artículo, nos centramos en los pasos para convertir archivos PDF a HTML con C# .NET. Esta tarea se puede realizar con Aspose.PDF Cloud SDK for .NET, que es un contenedor de Aspose.PDF Cloud para que obtenga todas las funciones de la API REST dentro de su aplicación .NET.
El SDK está disponible para descargar en NuGet y GitHub y para instalarlo desde la biblioteca NuGet, ejecute el siguiente comando en el administrador de paquetes NuGet:
Install-Package Aspose.Pdf-Cloud
O bien, también puede considerar instalar el SDK directamente dentro del proyecto de Visual Studio como paquete NuGet. Todo lo que necesita hacer es expandir el árbol del proyecto en el Explorador de soluciones, hacer clic con el botón derecho en la carpeta Paquetes y seleccionar la opción Administrar paquetes NuGet… en el menú contextual.

Imagen 1: Administrar paquetes NuGet.
Ahora busque Aspose.PDF Cloud en el campo de búsqueda, habilite la casilla de verificación junto al nombre del paquete y haga clic en el botón Agregar paquete.

Imagen 2: Aspose.PDF Cloud SDK en paquetes NuGet.
Tenga en cuenta que Aspose.Pdf-Cloud.dll aparece en la carpeta Paquetes.

Imagen 3: Aspose.Pdf-cloud.dll en el explorador de soluciones.
Después de la instalación, debe iniciar sesión en el panel de la nube usando su cuenta de GitHub o Google existente o hacer clic en el botón Crear una nueva cuenta.
Convertir PDF a HTML - Resultado en respuesta
Siga los pasos que se indican a continuación para realizar la operación de conversión de PDF a HTML. El PDF de entrada se carga desde el almacenamiento en la nube y el HTML resultante se devuelve como un contexto de flujo de respuesta que se puede guardar en una unidad local o visualizar directamente en un navegador web.
- El primer paso es crear una variable String que defina los detalles del ID del cliente y del secreto del cliente.
- En segundo lugar, cree una instancia de PdfApi mientras pasa las variables Client ID y Client Secret como argumentos.
- En tercer lugar, lea el contenido del archivo PDF y cárguelo en la instancia Stream.
- Luego, cargue el archivo PDF al almacenamiento en la nube usando el método UploadFile(…) de la clase PdfApi.
- Por último, llame al método GetPdfInStorageToHtml(…) para realizar la conversión.
// Obtenga las credenciales del cliente desde https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// crear una instancia de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// ruta del archivo PDF de entrada
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// Leer el contenido del archivo PDF en la instancia Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// nombre del archivo en el almacenamiento en la nube
String fileNameinStorage = "MyUploaded.pdf";
try
{
// subir PDF al almacenamiento en la nube
pdfApi.UploadFile(fileNameinStorage, fs);
// Realizar la conversión del documento
var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
// Escribe el resultado en la consola
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF a HTML: resultado en almacenamiento en la nube
En esta sección, vamos a utilizar un enfoque para convertir archivos PDF a HTML y guardar el resultado en un almacenamiento en la nube. Siga los pasos que se indican a continuación para cumplir con este requisito:
- En primer lugar, cree una instancia de la clase PdfApi pasando los detalles del ID de cliente y del secreto de cliente como argumentos.
- En segundo lugar, lea el archivo PDF de entrada en la instancia Stream y especifique el nombre del archivo de salida con la extensión .zip.
- En tercer lugar, cargue el archivo PDF al almacenamiento en la nube utilizando el método UploadFile(…).
- Penúltimo, llame al método PutPdfInStorageToHtml(…) que toma el nombre del archivo PDF de entrada y el nombre del archivo resultante como argumentos.
- Por último, imprima el código de respuesta en la consola.
// Obtenga las credenciales del cliente desde https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// crear una instancia de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// ruta del archivo PDF de entrada
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// Leer el contenido del archivo PDF en la instancia Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// nombre del archivo en el almacenamiento en la nube
String fileNameinStorage = "MyUploaded.pdf";
// nombre del archivo resultante en el almacenamiento en la nube
string resFileName = "result.zip";
// Sube el archivo al almacenamiento en la nube
try
{
// Sube el archivo al almacenamiento en la nube
pdfApi.UploadFile(fileNameinStorage, fs);
// Realice la conversión de PDF a HTML y guarde el archivo en el almacenamiento en la nube
var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
// Imprima el código de respuesta en la consola
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF de unidad local a HTML: salida en almacenamiento en la nube
En esta sección, analizaremos los pasos sobre cómo podemos cargar un PDF desde una unidad local, luego convertir PDF a HTML en línea y guardar el resultado en el almacenamiento en la nube.
- El primer paso es crear una instancia de PdfApi mientras se pasa el ID de cliente y el secreto de cliente como argumentos.
- En segundo lugar, defina variables de cadena para el PDF de entrada y el .zip resultante que se almacenarán en el almacenamiento en la nube.
- En tercer lugar, cargue el PDF de entrada en la instancia de transmisión.
- Por último, llama al método PutPdfInRequestToHtml(…), que toma el nombre del archivo resultante y la secuencia que contiene el PDF como argumentos. El resultado se guarda en el almacenamiento en la nube.
// Obtenga las credenciales del cliente desde https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// crear una instancia de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// ruta del archivo PDF de entrada
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// nombre del archivo en el almacenamiento en la nube
String resultantFile = "converted.zip";
try
{
using (Stream stream = System.IO.File.OpenRead(inputFile))
{
// Iniciar la conversión de PDF a HTML
var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
// Imprima el código de respuesta (200 en caso de éxito) en la consola
Console.WriteLine(response);
} // stream ends here
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
Conclusión
En este artículo, analizamos los pasos para convertir PDF a HTML con distintos enfoques. Logramos cargar el archivo PDF que ya estaba almacenado en el almacenamiento en la nube, así como también un archivo desde la unidad local y lo convertimos a formato HTML. Tenga en cuenta que Aspose.PDF Cloud SDK para .NET se distribuye bajo una licencia MIT y su código fuente completo está disponible para descargar en GitHub. En caso de que tenga algún problema al usar la API o tenga alguna consulta relacionada, no dude en contactarnos a través del Foro de soporte gratuito de productos.
Enlaces relacionados
También recomendamos visitar los siguientes enlaces para conocer más sobre: