pdf в html

Дізнайтеся, як конвертувати PDF у HTML за допомогою Python

У сучасному швидкоплинному цифровому світі доступність документів є ключовим моментом як для компаній, так і для окремих осіб. Потреба у перетворенні PDF-документів у HTML ніколи не була такою гострою. Хоча PDF-файли чудово підходять для збереження форматування документа, але робота з ними в Інтернеті може стати громіздкою. Їм часто бракує інтерактивності та адаптивності, необхідних для сучасного онлайн-досвіду. Саме тут на допомогу входить Python REST API, щоб подолати розрив. У цій статті досліджується зростаючий попит на перетворення PDF у HTML і як Python REST API може змінити цей процес.

Python REST API для перетворення PDF у HTML

Перетворення PDF-документів у формат HTML є простим і ефективним завданням із Aspose.PDF Cloud SDK для Python. Цей потужний SDK надає низку можливостей для легкого вирішення проблем перетворення PDF у HTML. Незалежно від того, чи потрібно вам представити свої документи в Інтернеті, поділитися вмістом на різних платформах або покращити доступність документів, Aspose.PDF Cloud допоможе вам.

Python Cloud SDK повністю здатний створювати, редагувати або перетворювати файли PDF у різні формати, зокрема EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.

SDK доступний для завантаження через PIP і GitHub репозиторій. Тепер, будь ласка, виконайте наступну команду в терміналі/командному рядку, щоб інсталювати останню версію SDK у системі.

pip install asposepdfcloud

Якщо вам потрібно безпосередньо додати посилання у свій проект Python у Visual Studio IDE, виконайте пошук asposepdfcloud як пакет у вікні середовища Python. Будь ласка, виконайте кроки, пронумеровані на зображенні нижче, щоб завершити процес встановлення.

pdftohtml API

Зображення 1: API перетворення PDF у HTML.

Перетворення PDF на HTML за допомогою Python

Будь ласка, дотримуйтеся наведених нижче інструкцій, щоб конвертувати PDF у формат HTML.

  • Спочатку створіть екземпляр класу ApiClient, передаючи ClinetID і секретні дані клієнта як аргументи.
  • По-друге, створіть об’єкт PdfApi, де ми передаємо об’єкт ApiClient як аргумент.
  • По-третє, вкажіть назву вхідного PDF-файлу та результуючого результату.
  • Нарешті, викличте метод putpdfinstoragetohtml(…) класу PdfApi, щоб розпочати перетворення. Результати зберігаються в хмарному сховищі.
# для повних зразків коду відвідайте https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # створити екземпляр PdfApi, передаючи PdfApiClient як аргумент
        pdf_api = PdfApi(pdf_api_client)

        # Вихідний документ PDF
        input_file_name = 'completeWorkbook.pdf'

        # ім'я отриманого файлу
        resultant_file_name = 'CodeConversion.zip'
    
        # Виклик API для виконання перетворення
        # ми встановили вихідний формат як zip і тип документа як xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # друкувати повідомлення в консолі (необов'язково)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

PDF у HTML за допомогою команди cURL

Крім того, конвертацію PDF у HTML також можна оптимізувати за допомогою команд cURL у поєднанні з Aspose.PDF Cloud. Цей підхід забезпечує зручний спосіб використання можливостей Aspose.PDF Cloud для потреб конвертації PDF у HTML. Цей підхід найкраще відповідає вашим вимогам, коли ви шукаєте незалежний від платформи та мови підхід, щоб реалізувати плавний процес перетворення PDF у HTML.

Спочатку нам потрібно створити маркер доступу JWT на основі облікових даних клієнта. Виконайте таку команду, щоб створити маркер JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Отримавши маркер JWT, ми можемо виконати наведену нижче команду, щоб перетворити файл PDF, доступний у хмарному сховищі, у формат HTML, і в результаті вихідні дані повертаються як відповідь потоку.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

Якщо вам потрібно конвертувати PDF-файл у HTML, а також зберегти результат у хмарному сховищі, спробуйте використати таку команду.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
Попередній перегляд PDF у HTML

Зображення 2: попередній перегляд перетворення PDF у HTML.

Висновок

Підсумовуючи, шлях від PDF до HTML ніколи не був таким плавним. Ми дослідили потужність перетворення Python REST API та ефективність Aspose.PDF Cloud із командами cURL у перетворенні ваших PDF-документів у динамічний, готовий до Інтернету HTML. Ці методи не тільки забезпечують цілісність документа, але й підвищують доступність і можливість спільного використання. Отже, настав час зробити ваш вміст доступним для ширшої аудиторії та підняти свою присутність в Інтернеті.

Якщо у вас виникнуть проблеми під час використання API або у вас виникнуть додаткові запитання, зв’яжіться з нами через безкоштовний форум підтримки продуктів.

Схожі статті

Ми наполегливо рекомендуємо відвідати такі посилання, щоб дізнатися більше про: