PDF a HTML

Convierta PDF a HTML utilizando la API REST de .NET.

Los documentos PDF son una opción popular para compartir información debido a su formato consistente en diferentes dispositivos y plataformas. Pero cuando se trata de mostrar contenido en un sitio web, es posible que los archivos PDF no siempre sean la opción más fácil de usar. Sin embargo, la conversión de archivos PDF al formato HTML abre un mundo de posibilidades para los desarrolladores web y creadores de contenido. Otra razón para esta conversión es que la presentación del contenido y la accesibilidad son factores cruciales para el éxito en línea, ya que los motores de búsqueda pueden indexarlo.

En este artículo, profundizaremos en los detalles sobre cómo convertir PDF a HTML usando .NET REST API.

API REST para conversión de PDF a HTML

Lograr la conversión de PDF a HTML es fácil con las poderosas capacidades de Aspose.PDF Cloud SDK para .NET. Esta API le permite integrar perfectamente la funcionalidad de conversión de PDF en sus aplicaciones y flujos de trabajo .NET. Con solo unas pocas líneas de código, puede convertir fácilmente documentos PDF a formato HTML, haciéndolos adecuados para su visualización e interacción en la web. La API REST proporciona una amplia gama de funciones para controlar el proceso de conversión. También puede personalizar el HTML de salida especificando el nombre de fuente predeterminado, el tipo de documento, el diseño, la resolución de la imagen y varias otras configuraciones.

Para comenzar con este proceso de conversión, primero debemos agregar la referencia del SDK en nuestro proyecto y, para ello, busque Aspose.PDF-Cloud en el administrador de paquetes NuGet dentro de Visual Studio IDE y haga clic en el botón Agregar paquete. . También debe obtener sus credenciales de cliente en el [panel de la nube] (https://dashboard.aspose.cloud/). En caso de que no tenga una cuenta existente, simplemente cree una cuenta gratuita siguiendo las instrucciones especificadas en [inicio rápido] (https://docs.aspose.cloud/total/getting-started/quickstart/).

Convertir PDF a HTML usando C# .NET

Ahora necesitamos ejecutar el siguiente fragmento de código para realizar la conversión y poder representar PDF en un sitio web.

// Para obtener más ejemplos, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Obtenga credenciales de cliente desde https://dashboard.aspose.cloud/
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// crear una instancia de PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Ingrese el nombre del archivo PDF
String inputFile = "Binder1-1.pdf";
// leer el contenido del archivo PDF de entrada
var pdfFile = System.IO.File.OpenRead(inputFile);

// Llame a la API para convertir un archivo PDF a HTML y guardar el resultado en el almacenamiento en la nube
// Hemos especificado el formato HTML de salida como `HTML5` 
// La bandera para guardar cada página PDF como archivo HTML independiente está habilitada
// La salida se generará como archivo .ZIP.
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF a HTML

Vista previa de conversión de PDF a HTML.

A continuación se detallan detalles breves sobre el fragmento de código indicado anteriormente.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

En primer lugar, cree un objeto de la clase PdfApi mientras pasa las credenciales del cliente como argumentos de entrada.

var pdfFile = System.IO.File.OpenRead(inputFile);

Lea el contenido del archivo PDF desde la unidad local.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Llame a la API para convertir el PDF del flujo de entrada al formato HTML. Durante la conversión, hemos especificado el valor para guardar cada página PDF en un archivo HTML individual.

Visite PutPdfInRequestToHtml para obtener una lista completa de los argumentos admitidos por esta llamada API y sus detalles relacionados.

El documento PDF de entrada utilizado en el ejemplo anterior se puede descargar desde Binder1.pdf.

PDF a HTML en línea usando comandos cURL

Convertir PDF a HTML usando comandos cURL en combinación con Aspose.PDF Cloud también es un enfoque versátil y eficiente. Al aprovechar el poder de los comandos cURL, puede integrar fácilmente la API de la nube Aspose.PDF en sus aplicaciones y automatizar el proceso de conversión de PDF a HTML. Además, el uso de comandos cURL permite una interacción sencilla con puntos finales RESTful, lo que permite una comunicación e intercambio de datos fluidos. Entonces, para mostrar PDF en el navegador HTML, simplemente necesitamos convertir archivos PDF a HTML llamando a algunos comandos cURL, y esto reduce significativamente el tiempo y el esfuerzo de desarrollo.

El primer paso de este enfoque es la generación de un token de acceso JWT. Entonces, ejecute el siguiente comando:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Ahora necesitamos ejecutar el siguiente comando cURL que carga el archivo PDF desde el almacenamiento en la nube, convierte todo el documento a formato HTML y guarda el resultado como archivo .ZIP en la unidad local (nombre especificado con el argumento -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Reemplace inputPDF con el nombre de un documento PDF de entrada disponible en el almacenamiento en la nube y accessToken con el token de acceso JWT generado anteriormente.

Conclusión

En conclusión, convertir PDF a HTML con Aspose.PDF Cloud API proporciona una solución integral y versátil. Ya sea que utilice la API REST de .NET para una integración perfecta o comandos cURL para una conversión eficiente, Aspose.PDF Cloud SDK ofrece amplias funciones y opciones de personalización. Estos enfoques garantizan una representación precisa del contenido PDF en HTML responsivo, preservando el diseño y el formato para una experiencia de usuario óptima. Además, la capacidad de incrustar contenido PDF en páginas HTML permite aplicaciones web versátiles e interactivas, lo que mejora la accesibilidad y la participación del usuario.

Enlaces útiles

Artículos relacionados

Recomendamos ampliamente visitar los siguientes blogs: