Документы PDF являются популярным выбором для обмена информацией благодаря единообразному форматированию на разных устройствах и платформах. Но когда дело доходит до отображения контента на веб-сайте, PDF-файлы не всегда могут быть самым удобным вариантом. Однако преобразование PDF-файлов в формат HTML открывает целый мир возможностей для веб-разработчиков и создателей контента. Другая причина этого преобразования заключается в том, что представление контента и его доступность являются решающими факторами успеха в Интернете, поскольку он становится индексируемым поисковыми системами.
В этой статье мы подробно рассмотрим, как конвертировать PDF в HTML с помощью .NET REST API.
- REST API для преобразования PDF в HTML
- Преобразование PDF в HTML с помощью C# .NET
- PDF в HTML онлайн с использованием команд cURL
REST API для преобразования PDF в HTML
Преобразование PDF в HTML упрощается благодаря мощным возможностям Aspose.PDF Cloud SDK для .NET. Этот API позволяет легко интегрировать функции преобразования PDF в ваши приложения и рабочие процессы .NET. С помощью всего лишь нескольких строк кода вы можете легко конвертировать PDF-документы в формат HTML, делая их пригодными для отображения и взаимодействия в Интернете. REST API предоставляет широкий спектр функций для управления процессом преобразования. Вы также можете настроить выходной HTML, указав имя шрифта по умолчанию, тип документа, макет, разрешение изображения и различные другие конфигурации.
Чтобы начать процесс преобразования, сначала нам нужно добавить ссылку на SDK в наш проект, для этого выполните поиск «Aspose.PDF-Cloud» в диспетчере пакетов NuGet в Visual Studio IDE и нажмите кнопку «Добавить пакет». . Вам также необходимо получить учетные данные клиента из облачной панели. Если у вас нет существующей учетной записи, просто создайте бесплатную учетную запись, следуя инструкциям, указанным в разделе быстрый старт.
Преобразование PDF в HTML с помощью C# .NET
Теперь нам нужно выполнить следующий фрагмент кода, чтобы выполнить преобразование, чтобы мы могли отображать PDF на веб-сайте.
// Дополнительные примеры: https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples.
// Получите учетные данные клиента с https://dashboard.aspose.cloud/.
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// Введите имя PDF-файла
String inputFile = "Binder1-1.pdf";
// прочитать содержимое входного PDF-файла
var pdfFile = System.IO.File.OpenRead(inputFile);
// Вызовите API, чтобы преобразовать PDF-файл в HTML и сохранить результат в облачном хранилище.
// Мы указали выходной формат HTML как HTML5.
// Включен флаг сохранения каждой страницы PDF как отдельного HTML-файла.
// Вывод будет сгенерирован в виде архива .ZIP.
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5",
splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg",
outputFormat: "Zip" , file: pdfFile);
Ниже приведены краткие сведения о приведенном выше фрагменте кода.
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
Во-первых, создайте объект класса PdfApi, передав учетные данные клиента в качестве входных аргументов.
var pdfFile = System.IO.File.OpenRead(inputFile);
Прочитайте содержимое PDF-файла с локального диска.
pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);
Вызовите API, чтобы преобразовать PDF-файл из входного потока в формат HTML. Во время преобразования мы указали значение для сохранения каждой страницы PDF в отдельный файл HTML.
Посетите PutPdfInRequestToHtml для получения полного списка аргументов, поддерживаемых этим вызовом API, и связанных с ними подробностей.
Входной PDF-документ, использованный в приведенном выше примере, можно загрузить из Binder1.pdf.
PDF в HTML онлайн с использованием команд cURL
Преобразование PDF в HTML с использованием команд cURL в сочетании с Aspose.PDF Cloud также является универсальным и эффективным подходом. Используя возможности команд cURL, вы можете легко интегрировать облачный API Aspose.PDF в свои приложения и автоматизировать процесс преобразования PDF в HTML. Кроме того, использование команд cURL позволяет легко взаимодействовать с конечными точками RESTful, обеспечивая бесперебойную связь и обмен данными. Таким образом, чтобы отобразить PDF-файл в HTML-браузере, нам просто нужно преобразовать PDF-файлы в HTML, вызвав несколько команд cURL, и это значительно сокращает время и усилия на разработку.
Первым шагом в этом подходе является создание токена доступа JWT. Итак, выполните следующую команду:
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Теперь нам нужно выполнить следующую команду cURL, которая загружает файл PDF из облачного хранилища, преобразует весь документ в формат HTML и сохраняет выходные данные в виде архива .ZIP на локальном диске (имя указано с аргументом -o).
curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H "accept: multipart/form-data" \
-H "authorization: Bearer {accessToken}" \
-o "Converted.zip"
Замените inputPDF
на имя входного PDF-документа, доступного в облачном хранилище, а accessToken
на токен доступа JWT, созданный выше.
Заключение
В заключение, преобразование PDF в HTML с помощью Aspose.PDF Cloud API представляет собой комплексное и универсальное решение. Независимо от того, используете ли вы .NET REST API для плавной интеграции или команды cURL для эффективного преобразования, Aspose.PDF Cloud SDK предлагает обширные функции и возможности настройки. Эти подходы обеспечивают точную визуализацию содержимого PDF в адаптивный HTML, сохраняя макет и форматирование для оптимального взаимодействия с пользователем. Кроме того, возможность встраивать PDF-контент в HTML-страницы позволяет создавать универсальные и интерактивные веб-приложения, повышая доступность и вовлечение пользователей.
Полезные ссылки
Статьи по Теме
Мы настоятельно рекомендуем посетить следующие блоги: