
Разработать конвертер PDF в HTML с использованием C# .NET
Большинство людей используют формат Portable Document Format (PDF) из-за того, что форматирование документа сохраняется при просмотре этих файлов на любой платформе. Точность документа не ухудшается при просмотре как на настольном компьютере, так и на мобильной платформе. Но для просмотра файла PDF вам необходимо использовать специальное приложение для просмотра. Поэтому для преодоления таких недостатков формат HTML может быть одним из жизнеспособных решений. В этой статье мы рассмотрим подробности о том, как преобразовать PDF в HTML с помощью C# .NET.
В этой статье мы подробно обсудим следующие темы:
- API преобразования PDF в HTML
- Конвертировать PDF в HTML - Результат в ответе
- PDF в HTML — результат в облачном хранилище
- Локальный диск PDF в HTML - Вывод в облачное хранилище
API преобразования PDF в HTML
Aspose.PDF Cloud основан на архитектуре REST и предлагает возможности создания, редактирования, а также преобразования PDF в Поддерживаемые форматы документов, включая HTML, JPEG, DOCX, PPTX, XLSX, SVG и т. д. В этой статье мы сосредоточимся на шагах по конвертации PDF в HTML с помощью C# .NET. Эту задачу можно выполнить с помощью Aspose.PDF Cloud SDK для .NET, который является оболочкой вокруг Aspose.PDF Cloud, так что вы получите все функции REST API в своем приложении .NET.
SDK доступен для загрузки на NuGet и GitHub. Чтобы установить его из библиотеки NuGet, выполните следующую команду в менеджере пакетов NuGet:
Install-Package Aspose.Pdf-Cloud
Или вы также можете рассмотреть возможность установки SDK непосредственно в проекте Visual Studio как пакета NuGet. Все, что вам нужно сделать, это развернуть дерево проекта в обозревателе решений, щелкнуть правой кнопкой мыши папку Packages и выбрать опцию Manage NuGet Packages… из контекстного меню.

Изображение 1: Управление пакетами NuGet.
Теперь найдите Aspose.PDF Cloud в поле поиска, установите флажок рядом с именем пакета и нажмите кнопку Добавить пакет.

Изображение 2: Aspose.PDF Cloud SDK в пакетах NuGet.
Обратите внимание, что Aspose.Pdf-Cloud.dll отображается в папке Packages.

Изображение 3: Aspose.Pdf-cloud.dll в обозревателе решений.
После установки вам необходимо войти в облачную панель управления, используя существующую учетную запись GitHub или Google, или нажать кнопку Создать новую учетную запись.
Конвертировать PDF в HTML - Результат в ответе
Пожалуйста, следуйте инструкциям ниже для выполнения операции преобразования PDF в HTML. Входной PDF загружается из облачного хранилища, а полученный HTML возвращается как контекст потока ответа, который можно сохранить на локальном диске или отобразить непосредственно в веб-браузере.
- Первым шагом является создание строковой переменной, определяющей идентификатор клиента и секретный код клиента.
- Во-вторых, создайте экземпляр PdfApi, передавая переменные Client ID и Client Secret в качестве аргументов.
- В-третьих, прочитайте содержимое PDF-файла и загрузите его в экземпляр Stream.
- Затем загрузите PDF-файл в облачное хранилище с помощью метода UploadFile(…) класса PdfApi.
- Наконец, вызовите метод GetPdfInStorageToHtml(…) для выполнения преобразования.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// прочитать содержимое файла PDF в экземпляре Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// имя файла в облачном хранилище
String fileNameinStorage = "MyUploaded.pdf";
try
{
// загрузить PDF в облачное хранилище
pdfApi.UploadFile(fileNameinStorage, fs);
// выполнить преобразование документа
var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
// записать результат в консоль
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF в HTML — результат в облачном хранилище
В этом разделе мы собираемся использовать подход для преобразования файлов PDF в HTML и сохранения вывода в облачном хранилище. Пожалуйста, следуйте шагам, указанным ниже, чтобы выполнить это требование:
- Сначала создайте экземпляр класса PdfApi, передав в качестве аргументов данные Client ID и Client Secret.
- Во-вторых, считайте входной PDF-файл в экземпляре Stream и укажите имя выходного файла с расширением .zip.
- В-третьих, загрузите PDF-файл в облачное хранилище с помощью метода UploadFile(…).
- Предпоследний вызовите метод PutPdfInStorageToHtml(…), который принимает в качестве аргументов входное имя PDF-файла и результирующее имя файла.
- Наконец, выведите код ответа в консоль.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// прочитать содержимое файла PDF в экземпляре Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// имя файла в облачном хранилище
String fileNameinStorage = "MyUploaded.pdf";
// имя результирующего файла в облачном хранилище
string resFileName = "result.zip";
// загрузить файл в облачное хранилище
try
{
// загрузить файл в облачное хранилище
pdfApi.UploadFile(fileNameinStorage, fs);
// выполнить преобразование PDF в HTML и сохранить файл в облачном хранилище
var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
// вывести код ответа в консоль
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
Локальный диск PDF в HTML - Вывод в облачное хранилище
В этом разделе мы рассмотрим шаги по загрузке PDF-файла с локального диска, а затем конвертации PDF в HTML онлайн и сохранению вывода в облачном хранилище.
- Первым шагом является создание экземпляра PdfApi с передачей Client ID и Client Secret в качестве аргументов.
- Во-вторых, определите строковые переменные для входного PDF-файла и результирующего .zip-файла, который будет сохранен в облачном хранилище.
- В-третьих, загрузите входной PDF-файл в потоковый экземпляр.
- Наконец, вызовите метод PutPdfInRequestToHtml(…), который принимает результирующее имя файла и поток, содержащий PDF, в качестве аргументов. Вывод сохраняется в облачном хранилище.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// имя файла в облачном хранилище
String resultantFile = "converted.zip";
try
{
using (Stream stream = System.IO.File.OpenRead(inputFile))
{
// инициировать преобразование PDF в HTML
var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
// вывести код ответа (200 в случае успеха) в консоли
Console.WriteLine(response);
} // stream ends here
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
Заключение
В этой статье мы обсудили шаги по конвертации PDF в HTML различными способами. Нам удалось загрузить PDF-файл, уже сохраненный в облачном хранилище, а также загрузить файл с локального диска и преобразовать его в формат HTML. Обратите внимание, что Aspose.PDF Cloud SDK для .NET распространяется по лицензии MIT, и его полный исходный код доступен для загрузки через GitHub. Если у вас возникнут какие-либо проблемы при использовании API или у вас возникнут какие-либо вопросы, свяжитесь с нами через бесплатный форум поддержки продукта.
Ссылки по теме
Мы также рекомендуем посетить следующие ссылки, чтобы узнать больше о: