PDF в HTML

Разработать конвертер PDF в HTML с использованием C# .NET

Большинство людей используют формат Portable Document Format (PDF) из-за того, что форматирование документа сохраняется при просмотре этих файлов на любой платформе. Точность документа не ухудшается при просмотре как на настольном компьютере, так и на мобильной платформе. Но для просмотра файла PDF вам необходимо использовать специальное приложение для просмотра. Поэтому для преодоления таких недостатков формат HTML может быть одним из жизнеспособных решений. В этой статье мы рассмотрим подробности о том, как преобразовать PDF в HTML с помощью C# .NET.

В этой статье мы подробно обсудим следующие темы:

API преобразования PDF в HTML

Aspose.PDF Cloud основан на архитектуре REST и предлагает возможности создания, редактирования, а также преобразования PDF в Поддерживаемые форматы документов, включая HTML, JPEG, DOCX, PPTX, XLSX, SVG и т. д. В этой статье мы сосредоточимся на шагах по конвертации PDF в HTML с помощью C# .NET. Эту задачу можно выполнить с помощью Aspose.PDF Cloud SDK для .NET, который является оболочкой вокруг Aspose.PDF Cloud, так что вы получите все функции REST API в своем приложении .NET.

SDK доступен для загрузки на NuGet и GitHub. Чтобы установить его из библиотеки NuGet, выполните следующую команду в менеджере пакетов NuGet:

Install-Package Aspose.Pdf-Cloud

Или вы также можете рассмотреть возможность установки SDK непосредственно в проекте Visual Studio как пакета NuGet. Все, что вам нужно сделать, это развернуть дерево проекта в обозревателе решений, щелкнуть правой кнопкой мыши папку Packages и выбрать опцию Manage NuGet Packages… из контекстного меню.

Управление пакетами NuGet.

Изображение 1: Управление пакетами NuGet.

Теперь найдите Aspose.PDF Cloud в поле поиска, установите флажок рядом с именем пакета и нажмите кнопку Добавить пакет.

Aspose.PDF Облачный SDK

Изображение 2: Aspose.PDF Cloud SDK в пакетах NuGet.

Обратите внимание, что Aspose.Pdf-Cloud.dll отображается в папке Packages.

Aspose.Pdf-облако.dll

Изображение 3: Aspose.Pdf-cloud.dll в обозревателе решений.

После установки вам необходимо войти в облачную панель управления, используя существующую учетную запись GitHub или Google, или нажать кнопку Создать новую учетную запись.

Конвертировать PDF в HTML - Результат в ответе

Пожалуйста, следуйте инструкциям ниже для выполнения операции преобразования PDF в HTML. Входной PDF загружается из облачного хранилища, а полученный HTML возвращается как контекст потока ответа, который можно сохранить на локальном диске или отобразить непосредственно в веб-браузере.

  • Первым шагом является создание строковой переменной, определяющей идентификатор клиента и секретный код клиента.
  • Во-вторых, создайте экземпляр PdfApi, передавая переменные Client ID и Client Secret в качестве аргументов.
  • В-третьих, прочитайте содержимое PDF-файла и загрузите его в экземпляр Stream.
  • Затем загрузите PDF-файл в облачное хранилище с помощью метода UploadFile(…) класса PdfApi.
  • Наконец, вызовите метод GetPdfInStorageToHtml(…) для выполнения преобразования.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// прочитать содержимое файла PDF в экземпляре Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);

// имя файла в облачном хранилище
String fileNameinStorage = "MyUploaded.pdf";

try
{
    // загрузить PDF в облачное хранилище
    pdfApi.UploadFile(fileNameinStorage, fs);
    
    // выполнить преобразование документа
    var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
    
    // записать результат в консоль
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}

PDF в HTML — результат в облачном хранилище

В этом разделе мы собираемся использовать подход для преобразования файлов PDF в HTML и сохранения вывода в облачном хранилище. Пожалуйста, следуйте шагам, указанным ниже, чтобы выполнить это требование:

  • Сначала создайте экземпляр класса PdfApi, передав в качестве аргументов данные Client ID и Client Secret.
  • Во-вторых, считайте входной PDF-файл в экземпляре Stream и укажите имя выходного файла с расширением .zip.
  • В-третьих, загрузите PDF-файл в облачное хранилище с помощью метода UploadFile(…).
  • Предпоследний вызовите метод PutPdfInStorageToHtml(…), который принимает в качестве аргументов входное имя PDF-файла и результирующее имя файла.
  • Наконец, выведите код ответа в консоль.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// прочитать содержимое файла PDF в экземпляре Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);

// имя файла в облачном хранилище
String fileNameinStorage = "MyUploaded.pdf";

// имя результирующего файла в облачном хранилище
string resFileName = "result.zip";

// загрузить файл в облачное хранилище            
try
{
    // загрузить файл в облачное хранилище
    pdfApi.UploadFile(fileNameinStorage, fs);
    
    // выполнить преобразование PDF в HTML и сохранить файл в облачном хранилище
    var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
    
    // вывести код ответа в консоль
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
 } 

Локальный диск PDF в HTML - Вывод в облачное хранилище

В этом разделе мы рассмотрим шаги по загрузке PDF-файла с локального диска, а затем конвертации PDF в HTML онлайн и сохранению вывода в облачном хранилище.

  • Первым шагом является создание экземпляра PdfApi с передачей Client ID и Client Secret в качестве аргументов.
  • Во-вторых, определите строковые переменные для входного PDF-файла и результирующего .zip-файла, который будет сохранен в облачном хранилище.
  • В-третьих, загрузите входной PDF-файл в потоковый экземпляр.
  • Наконец, вызовите метод PutPdfInRequestToHtml(…), который принимает результирующее имя файла и поток, содержащий PDF, в качестве аргументов. Вывод сохраняется в облачном хранилище.
// получить учетные данные клиента с https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// создать экземпляр PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// путь к входному PDF-файлу
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// имя файла в облачном хранилище
String resultantFile = "converted.zip";

try
{
    using (Stream stream = System.IO.File.OpenRead(inputFile))
    {
        // инициировать преобразование PDF в HTML
        var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
        
        // вывести код ответа (200 в случае успеха) в консоли
        Console.WriteLine(response);
    }   // stream ends here
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
} 

Заключение

В этой статье мы обсудили шаги по конвертации PDF в HTML различными способами. Нам удалось загрузить PDF-файл, уже сохраненный в облачном хранилище, а также загрузить файл с локального диска и преобразовать его в формат HTML. Обратите внимание, что Aspose.PDF Cloud SDK для .NET распространяется по лицензии MIT, и его полный исходный код доступен для загрузки через GitHub. Если у вас возникнут какие-либо проблемы при использовании API или у вас возникнут какие-либо вопросы, свяжитесь с нами через бесплатный форум поддержки продукта.

Ссылки по теме

Мы также рекомендуем посетить следующие ссылки, чтобы узнать больше о: