PDF в HTML

Преобразование PDF в HTML с помощью .NET REST API.

Документы PDF являются популярным выбором для обмена информацией благодаря единообразному форматированию на разных устройствах и платформах. Но когда дело доходит до отображения контента на веб-сайте, PDF-файлы не всегда могут быть самым удобным вариантом. Однако преобразование PDF-файлов в формат HTML открывает целый мир возможностей для веб-разработчиков и создателей контента. Другая причина этого преобразования заключается в том, что представление контента и его доступность являются решающими факторами успеха в Интернете, поскольку он становится индексируемым поисковыми системами.

В этой статье мы подробно рассмотрим, как конвертировать PDF в HTML с помощью .NET REST API.

REST API для преобразования PDF в HTML

Преобразование PDF в HTML упрощается благодаря мощным возможностям Aspose.PDF Cloud SDK для .NET. Этот API позволяет легко интегрировать функции преобразования PDF в ваши приложения и рабочие процессы .NET. С помощью всего лишь нескольких строк кода вы можете легко конвертировать PDF-документы в формат HTML, делая их пригодными для отображения и взаимодействия в Интернете. REST API предоставляет широкий спектр функций для управления процессом преобразования. Вы также можете настроить выходной HTML, указав имя шрифта по умолчанию, тип документа, макет, разрешение изображения и различные другие конфигурации.

Чтобы начать процесс преобразования, сначала нам нужно добавить ссылку на SDK в наш проект, для этого выполните поиск «Aspose.PDF-Cloud» в диспетчере пакетов NuGet в Visual Studio IDE и нажмите кнопку «Добавить пакет». . Вам также необходимо получить учетные данные клиента из облачной панели. Если у вас нет существующей учетной записи, просто создайте бесплатную учетную запись, следуя инструкциям, указанным в разделе быстрый старт.

Преобразование PDF в HTML с помощью C# .NET

Теперь нам нужно выполнить следующий фрагмент кода, чтобы выполнить преобразование, чтобы мы могли отображать PDF на веб-сайте.

// Дополнительные примеры: https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples.

// Получите учетные данные клиента с https://dashboard.aspose.cloud/.
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Введите имя PDF-файла
String inputFile = "Binder1-1.pdf";
// прочитать содержимое входного PDF-файла
var pdfFile = System.IO.File.OpenRead(inputFile);

// Вызовите API, чтобы преобразовать PDF-файл в HTML и сохранить результат в облачном хранилище.
// Мы указали выходной формат HTML как HTML5. 
// Включен флаг сохранения каждой страницы PDF как отдельного HTML-файла.
// Вывод будет сгенерирован в виде архива .ZIP.
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF в HTML

Предварительный просмотр преобразования PDF в HTML.

Ниже приведены краткие сведения о приведенном выше фрагменте кода.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Во-первых, создайте объект класса PdfApi, передав учетные данные клиента в качестве входных аргументов.

var pdfFile = System.IO.File.OpenRead(inputFile);

Прочитайте содержимое PDF-файла с локального диска.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Вызовите API, чтобы преобразовать PDF-файл из входного потока в формат HTML. Во время преобразования мы указали значение для сохранения каждой страницы PDF в отдельный файл HTML.

Посетите PutPdfInRequestToHtml для получения полного списка аргументов, поддерживаемых этим вызовом API, и связанных с ними подробностей.

Входной PDF-документ, использованный в приведенном выше примере, можно загрузить из Binder1.pdf.

PDF в HTML онлайн с использованием команд cURL

Преобразование PDF в HTML с использованием команд cURL в сочетании с Aspose.PDF Cloud также является универсальным и эффективным подходом. Используя возможности команд cURL, вы можете легко интегрировать облачный API Aspose.PDF в свои приложения и автоматизировать процесс преобразования PDF в HTML. Кроме того, использование команд cURL позволяет легко взаимодействовать с конечными точками RESTful, обеспечивая бесперебойную связь и обмен данными. Таким образом, чтобы отобразить PDF-файл в HTML-браузере, нам просто нужно преобразовать PDF-файлы в HTML, вызвав несколько команд cURL, и это значительно сокращает время и усилия на разработку.

Первым шагом в этом подходе является создание токена доступа JWT. Итак, выполните следующую команду:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Теперь нам нужно выполнить следующую команду cURL, которая загружает файл PDF из облачного хранилища, преобразует весь документ в формат HTML и сохраняет выходные данные в виде архива .ZIP на локальном диске (имя указано с аргументом -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Замените inputPDF на имя входного PDF-документа, доступного в облачном хранилище, а accessToken на токен доступа JWT, созданный выше.

Заключение

В заключение, преобразование PDF в HTML с помощью Aspose.PDF Cloud API представляет собой комплексное и универсальное решение. Независимо от того, используете ли вы .NET REST API для плавной интеграции или команды cURL для эффективного преобразования, Aspose.PDF Cloud SDK предлагает обширные функции и возможности настройки. Эти подходы обеспечивают точную визуализацию содержимого PDF в адаптивный HTML, сохраняя макет и форматирование для оптимального взаимодействия с пользователем. Кроме того, возможность встраивать PDF-контент в HTML-страницы позволяет создавать универсальные и интерактивные веб-приложения, повышая доступность и вовлечение пользователей.

Полезные ссылки

Статьи по Теме

Мы настоятельно рекомендуем посетить следующие блоги: