pdf в html

Узнайте, как конвертировать PDF в HTML с помощью Python

В современном быстро меняющемся цифровом мире доступность документов является ключевым фактором как для предприятий, так и для частных лиц. Необходимость преобразования документов PDF в HTML никогда не была столь выраженной. Хотя файлы PDF отлично подходят для сохранения форматирования документов, работать с ними в Интернете может быть неудобно. Им часто не хватает интерактивности и адаптивности, необходимых для современных онлайн-опытов. Вот где Python REST API вступает в игру, чтобы заполнить этот пробел. В этой статье рассматривается растущий спрос на преобразование PDF в HTML и то, как Python REST API может произвести революцию в этом процессе.

Python REST API для преобразования PDF в HTML

Преобразование PDF-документов в формат HTML — это простая и эффективная задача с Aspose.PDF Cloud SDK для Python. Этот мощный SDK предоставляет ряд возможностей для беспрепятственного решения задач преобразования PDF в HTML. Если вам нужно представить свои документы в Интернете, поделиться контентом на различных платформах или улучшить доступность документов, Aspose.PDF Cloud поможет вам.

Python Cloud SDK полностью способен создавать, редактировать или преобразовывать PDF-файлы в различные форматы, включая EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.

SDK доступен для загрузки через репозиторий PIP и GitHub. Теперь выполните следующую команду в терминале/командной строке, чтобы установить последнюю версию SDK в системе.

pip install asposepdfcloud

Если вам нужно напрямую добавить ссылку в ваш проект Python в Visual Studio IDE, найдите asposepdfcloud как пакет в окне среды Python. Пожалуйста, следуйте шагам, пронумерованным на изображении ниже, чтобы завершить процесс установки.

API pdftohtml

Изображение 1: API преобразования PDF в HTML.

Конвертировать PDF в HTML на Python

Чтобы преобразовать PDF-файл в формат HTML, следуйте приведенным ниже инструкциям.

  • Сначала создайте экземпляр класса ApiClient, передав в качестве аргументов ClinetID и секретные данные клиента.
  • Во-вторых, создаем объект PdfApi, куда передаем объект ApiClient в качестве аргумента.
  • В-третьих, укажите имя входного PDF-файла и результирующего выходного файла.
  • Наконец, вызовите метод putpdfinstoragetohtml(…) класса PdfApi, чтобы инициировать преобразование. Вывод сохраняется в облачном хранилище.
# Для получения полных примеров кода посетите https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
        pdf_api = PdfApi(pdf_api_client)

        # Исходный PDF-документ
        input_file_name = 'completeWorkbook.pdf'

        # имя результирующего файла
        resultant_file_name = 'CodeConversion.zip'
    
        # Вызовите API для выполнения преобразования.
        # мы установили выходной формат как zip и тип документа как xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # вывести сообщение в консоль (необязательно)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

PDF в HTML с помощью команды cURL

В качестве альтернативы преобразование PDF в HTML также можно оптимизировать с помощью команд cURL в сочетании с Aspose.PDF Cloud. Этот подход обеспечивает удобный способ использования возможностей Aspose.PDF Cloud для ваших потребностей преобразования PDF в HTML. Этот подход наилучшим образом соответствует вашим требованиям, когда вы ищете независимый от платформы и языка подход для реализации бесшовного процесса преобразования PDF в HTML.

Сначала нам нужно сгенерировать токен доступа JWT на основе учетных данных клиента. Выполните следующую команду, чтобы сгенерировать токен JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Получив токен JWT, мы можем выполнить следующую команду для преобразования PDF-файла, доступного в облачном хранилище, в формат HTML, и в результате вывод будет возвращен в виде потокового ответа.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

Если вам необходимо преобразовать PDF-файл в HTML и сохранить результат в облачном хранилище, попробуйте использовать следующую команду.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
Предварительный просмотр PDF в HTML

Изображение 2: Предварительный просмотр преобразования PDF в HTML.

Заключение

В заключение, переход от PDF к HTML никогда не был таким гладким. Мы изучили силу преобразования Python REST API и эффективность Aspose.PDF Cloud с командами cURL для преобразования ваших PDF-документов в динамический, готовый к веб-размещению HTML. Эти методы не только обеспечивают целостность документа, но и повышают доступность и возможность совместного использования. Итак, пришло время сделать ваш контент доступным для более широкой аудитории и повысить свое присутствие в сети.

Если у вас возникнут какие-либо проблемы при использовании API или у вас возникнут дополнительные вопросы, свяжитесь с нами через бесплатный форум поддержки продукта.

Похожие статьи

Мы настоятельно рекомендуем посетить следующие ссылки, чтобы узнать больше о: