
Дізнайтеся, як конвертувати PDF у HTML за допомогою Python
У сучасному швидкоплинному цифровому світі доступність документів є ключовим моментом як для компаній, так і для окремих осіб. Потреба у перетворенні PDF-документів у HTML ніколи не була такою гострою. Хоча PDF-файли чудово підходять для збереження форматування документа, але робота з ними в Інтернеті може стати громіздкою. Їм часто бракує інтерактивності та адаптивності, необхідних для сучасного онлайн-досвіду. Саме тут на допомогу входить Python REST API, щоб подолати розрив. У цій статті досліджується зростаючий попит на перетворення PDF у HTML і як Python REST API може змінити цей процес.
- Python REST API для перетворення PDF у HTML
- Перетворення PDF на HTML за допомогою Python
- PDF у HTML за допомогою команди cURL
Python REST API для перетворення PDF у HTML
Перетворення PDF-документів у формат HTML є простим і ефективним завданням із Aspose.PDF Cloud SDK для Python. Цей потужний SDK надає низку можливостей для легкого вирішення проблем перетворення PDF у HTML. Незалежно від того, чи потрібно вам представити свої документи в Інтернеті, поділитися вмістом на різних платформах або покращити доступність документів, Aspose.PDF Cloud допоможе вам.
Python Cloud SDK повністю здатний створювати, редагувати або перетворювати файли PDF у різні формати, зокрема EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.
SDK доступний для завантаження через PIP і GitHub репозиторій. Тепер, будь ласка, виконайте наступну команду в терміналі/командному рядку, щоб інсталювати останню версію SDK у системі.
pip install asposepdfcloud
Якщо вам потрібно безпосередньо додати посилання у свій проект Python у Visual Studio IDE, виконайте пошук asposepdfcloud як пакет у вікні середовища Python. Будь ласка, виконайте кроки, пронумеровані на зображенні нижче, щоб завершити процес встановлення.

Зображення 1: API перетворення PDF у HTML.
Перетворення PDF на HTML за допомогою Python
Будь ласка, дотримуйтеся наведених нижче інструкцій, щоб конвертувати PDF у формат HTML.
- Спочатку створіть екземпляр класу ApiClient, передаючи ClinetID і секретні дані клієнта як аргументи.
- По-друге, створіть об’єкт PdfApi, де ми передаємо об’єкт ApiClient як аргумент.
- По-третє, вкажіть назву вхідного PDF-файлу та результуючого результату.
- Нарешті, викличте метод putpdfinstoragetohtml(…) класу PdfApi, щоб розпочати перетворення. Результати зберігаються в хмарному сховищі.
# для повних зразків коду відвідайте https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi
def pdf2html():
try:
#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")
# створити екземпляр PdfApi, передаючи PdfApiClient як аргумент
pdf_api = PdfApi(pdf_api_client)
# Вихідний документ PDF
input_file_name = 'completeWorkbook.pdf'
# ім'я отриманого файлу
resultant_file_name = 'CodeConversion.zip'
# Виклик API для виконання перетворення
# ми встановили вихідний формат як zip і тип документа як xhtml
response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)
# друкувати повідомлення в консолі (необов'язково)
print('PDF successfully converted to HTML format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
PDF у HTML за допомогою команди cURL
Крім того, конвертацію PDF у HTML також можна оптимізувати за допомогою команд cURL у поєднанні з Aspose.PDF Cloud. Цей підхід забезпечує зручний спосіб використання можливостей Aspose.PDF Cloud для потреб конвертації PDF у HTML. Цей підхід найкраще відповідає вашим вимогам, коли ви шукаєте незалежний від платформи та мови підхід, щоб реалізувати плавний процес перетворення PDF у HTML.
Спочатку нам потрібно створити маркер доступу JWT на основі облікових даних клієнта. Виконайте таку команду, щоб створити маркер JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Отримавши маркер JWT, ми можемо виконати наведену нижче команду, щоб перетворити файл PDF, доступний у хмарному сховищі, у формат HTML, і в результаті вихідні дані повертаються як відповідь потоку.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip
Якщо вам потрібно конвертувати PDF-файл у HTML, а також зберегти результат у хмарному сховищі, спробуйте використати таку команду.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

Зображення 2: попередній перегляд перетворення PDF у HTML.
Висновок
Підсумовуючи, шлях від PDF до HTML ніколи не був таким плавним. Ми дослідили потужність перетворення Python REST API та ефективність Aspose.PDF Cloud із командами cURL у перетворенні ваших PDF-документів у динамічний, готовий до Інтернету HTML. Ці методи не тільки забезпечують цілісність документа, але й підвищують доступність і можливість спільного використання. Отже, настав час зробити ваш вміст доступним для ширшої аудиторії та підняти свою присутність в Інтернеті.
Якщо у вас виникнуть проблеми під час використання API або у вас виникнуть додаткові запитання, зв’яжіться з нами через безкоштовний форум підтримки продуктів.
Схожі статті
Ми наполегливо рекомендуємо відвідати такі посилання, щоб дізнатися більше про: