Конвертер PDF в HTML

Преобразование PDF в HTML с помощью Java

Одним из стандартов де-факто для обмена информацией и данными через Интернет является PDF. Причина его популярности заключается в том, что он сохраняет макет и точность документа при просмотре на любой платформе, включая рабочий стол или мобильный телефон. Однако для просмотра этих файлов вам необходимо использовать приложение для просмотра PDF. Однако есть простой обходной путь: преобразовать PDF в HTML и легко загрузить HTML в веб-браузере. Итак, в этой статье мы собираемся подробно обсудить, как разработать конвертер PDF в HTML с использованием REST API.

API преобразования SXC в Excel

Чтобы создавать файлы PDF, управлять ими и преобразовывать их в другие форматы, попробуйте использовать Aspose.PDF Cloud SDK для Java. Теперь, чтобы использовать SDK, добавьте следующую информацию в pom.xml проекта типа сборки maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Теперь, когда в ваш проект добавлен справочник Aspose.PDF Cloud SDK для Java, следующим шагом будет создание бесплатной учетной записи в Aspose Cloud. Войдите в систему, используя только что созданную учетную запись, и найдите/создайте идентификатор клиента и секрет клиента на Cloud Dashboard. Эти детали потребуются в последующих разделах.

Конвертер PDF в HTML на Java

Давайте подробно обсудим, как разработать конвертер PDF в HTML с помощью Java Cloud SDK. Обратите внимание, что в следующем фрагменте кода во время операции преобразования используются очень простые параметры, но мы настоятельно рекомендуем посетить раздел Справочник по API для получения списка всех поддерживаемых параметров, а также их соответствующего описания.

  • Сначала нам нужно создать объект PdfApi, указав ClientID и Client secret в качестве аргументов.
  • Во-вторых, загрузите входной файл PDF, используя экземпляр файла.
  • В-третьих, загрузите входной PDF-файл в облачное хранилище, используя метод uploadFile(…)
  • Поскольку нам нужно преобразовать только вторую страницу PDF, поэтому мы предоставляем значение второй страницы в объекте списка.
  • Теперь вызовите метод putPdfInStorageToHtml(…), требующий ввода PDF, имени результирующего HTML и различных других параметров преобразования.
try
    {
    // Получите ClientID и ClientSecret с https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // создать экземпляр PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // имя исходного PDF-документа 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // имя результирующего HTML-файла
    String resultantImage = "Resultant.html";
	  
    // прочитать содержимое входного файла PDF
    File file = new File("//Users//"+inputFile);
	    
    // загрузить PDF в облачное хранилище
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // список страниц PDF для преобразования
    List<Integer> list = new ArrayList<Integer>();
    //список.добавить(1);
    list.add(2);  // only convert second page of PDF
	    
    // вызвать API для преобразования PDF в HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // распечатать сообщение об успешном завершении
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Конвертер PDF в HTML

Image1: - Предварительный просмотр преобразования PDF в HTML

Образец PDF-файла, использованного в приведенном выше примере, можно загрузить с PdfWithScreenAnnotations.pdf.

Преобразование PDF в HTML с помощью команд cURL

Команды cURL также являются одним из удобных способов доступа к REST API через терминал командной строки. Теперь предварительным условием для этого подхода является создание маркера доступа JWT (на основе учетных данных клиента) при выполнении следующей команды.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Получив токен JWT, нам нужно выполнить следующую команду для преобразования PDF в HTML. Полученный HTML сохраняется в виде Zip-архива в облачном хранилище.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Заключение

Мы узнали, как разработать конвертер PDF в HTML с помощью Java Cloud SDK. Таким образом, либо мы можем использовать фрагмент кода Jave для преобразования PDF в HTML, либо мы можем использовать команды cULR для преобразования PDF в HTML5. Если вы хотите внести какие-либо изменения в исходный код Java Cloud SDK, полный исходный код можно загрузить с GitHub. Вы можете обратиться к нам для быстрого решения проблем через бесплатный форум поддержки продукта.

Статьи по Теме

Мы настоятельно рекомендуем посетить следующие ссылки, чтобы узнать больше о: