Конвертер PDF в HTML

Перетворення PDF на HTML за допомогою Java

Одним із фактичних стандартів обміну інформацією та даними через Інтернет є PDF. Причина його популярності полягає в тому, що він зберігає макет і точність документа під час перегляду на будь-якій платформі, включаючи робочий стіл або мобільний пристрій. Однак, щоб переглянути ці файли, вам потрібно використовувати програму перегляду PDF. Однак простий обхідний шлях полягає в тому, щоб перетворити PDF на HTML і легко завантажити HTML у веб-переглядачі. Тож у цій статті ми збираємося далі обговорити деталі того, як розробити конвертер PDF у HTML за допомогою REST API.

API перетворення SXC в Excel

Щоб створювати, маніпулювати та перетворювати PDF-файли в інші формати, спробуйте скористатися Aspose.PDF Cloud SDK для Java. Тепер, щоб використовувати SDK, додайте наступну інформацію в pom.xml проекту типу збірки maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Тепер, коли до вашого проекту додано Aspose.PDF Cloud SDK для Java, наступним кроком є створення безкоштовного облікового запису в Aspose Cloud. Увійдіть за допомогою щойно створеного облікового запису та знайдіть/створіть ідентифікатор клієнта та секрет клієнта на Cloud Dashboard. Ці деталі є обов’язковими в наступних розділах.

Конвертер PDF в HTML на Java

Давайте обговоримо деталі того, як розробити конвертер PDF у HTML за допомогою Java Cloud SDK. Будь ласка, зверніть увагу, що в наступному фрагменті коду під час операції перетворення використовуються дуже прості параметри, але ми настійно рекомендуємо відвідати розділ API Reference, щоб отримати список усіх підтримуваних параметрів, а також їхній відповідний опис.

  • Спочатку нам потрібно створити об’єкт PdfApi, надаючи ClientID і Client secret як аргументи
  • По-друге, завантажте вхідний файл PDF за допомогою екземпляра File
  • По-третє, завантажте вхідний PDF у хмарне сховище за допомогою методу uploadFile(…).
  • Оскільки нам потрібно лише конвертувати другу сторінку PDF-файлу, ми надаємо значення другої сторінки в об’єкті List
  • Тепер викличте метод putPdfInStorageToHtml(…), який потребує введення PDF, назви результуючого HTML та різноманітних інших параметрів перетворення
try
    {
    // Отримайте ClientID і ClientSecret з https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // створити екземпляр PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // назва вхідного документа PDF 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // ім'я отриманого файлу HTML
    String resultantImage = "Resultant.html";
	  
    // прочитати вміст вхідного файлу PDF
    File file = new File("//Users//"+inputFile);
	    
    // завантажити PDF в хмарне сховище
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // список PDF-сторінок, які потрібно конвертувати
    List<Integer> list = new ArrayList<Integer>();
    //list.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // викликати API для перетворення PDF у HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // повідомлення про успішний друк
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Конвертер PDF в HTML

Зображення 1: попередній перегляд перетворення PDF у HTML

Зразок PDF-файлу, використаний у прикладі вище, можна завантажити з PdfWithScreenAnnotations.pdf

Перетворіть PDF у HTML за допомогою команд cURL

Команди cURL також є одним із зручних способів доступу до REST API через термінал командного рядка. Тепер передумовою для цього підходу є генерація маркера доступу JWT (на основі облікових даних клієнта) під час виконання наступної команди.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Коли у нас є маркер JWT, нам потрібно виконати наступну команду, щоб перетворити PDF у HTML. Отриманий HTML зберігається як Zip-архів у хмарному сховищі.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Висновок

Ми дізналися, як розробити конвертер PDF у HTML за допомогою Java Cloud SDK. Отже, ми можемо використати фрагмент коду Jave для перетворення PDF у HTML або команди cULR для перетворення PDF у HTML5. Якщо ви хочете внести будь-які зміни у вихідний код Java Cloud SDK, повний вихідний код можна завантажити з GitHub. Ви можете звернутися до нас, щоб швидко вирішити проблеми через безкоштовний форум підтримки продукту.

Схожі статті

Ми наполегливо рекомендуємо відвідати такі посилання, щоб дізнатися більше про: