
Узнайте, как конвертировать PDF в HTML с помощью Python
В современном быстро меняющемся цифровом мире доступность документов является ключевым фактором как для предприятий, так и для частных лиц. Необходимость преобразования документов PDF в HTML никогда не была столь выраженной. Хотя файлы PDF отлично подходят для сохранения форматирования документов, работать с ними в Интернете может быть неудобно. Им часто не хватает интерактивности и адаптивности, необходимых для современных онлайн-опытов. Вот где Python REST API вступает в игру, чтобы заполнить этот пробел. В этой статье рассматривается растущий спрос на преобразование PDF в HTML и то, как Python REST API может произвести революцию в этом процессе.
- Python REST API для преобразования PDF в HTML
- Конвертировать PDF в HTML на Python
- PDF в HTML с помощью команды cURL
Python REST API для преобразования PDF в HTML
Преобразование PDF-документов в формат HTML — это простая и эффективная задача с Aspose.PDF Cloud SDK для Python. Этот мощный SDK предоставляет ряд возможностей для беспрепятственного решения задач преобразования PDF в HTML. Если вам нужно представить свои документы в Интернете, поделиться контентом на различных платформах или улучшить доступность документов, Aspose.PDF Cloud поможет вам.
Python Cloud SDK полностью способен создавать, редактировать или преобразовывать PDF-файлы в различные форматы, включая EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.
SDK доступен для загрузки через репозиторий PIP и GitHub. Теперь выполните следующую команду в терминале/командной строке, чтобы установить последнюю версию SDK в системе.
pip install asposepdfcloud
Если вам нужно напрямую добавить ссылку в ваш проект Python в Visual Studio IDE, найдите asposepdfcloud как пакет в окне среды Python. Пожалуйста, следуйте шагам, пронумерованным на изображении ниже, чтобы завершить процесс установки.

Изображение 1: API преобразования PDF в HTML.
Конвертировать PDF в HTML на Python
Чтобы преобразовать PDF-файл в формат HTML, следуйте приведенным ниже инструкциям.
- Сначала создайте экземпляр класса ApiClient, передав в качестве аргументов ClinetID и секретные данные клиента.
- Во-вторых, создаем объект PdfApi, куда передаем объект ApiClient в качестве аргумента.
- В-третьих, укажите имя входного PDF-файла и результирующего выходного файла.
- Наконец, вызовите метод putpdfinstoragetohtml(…) класса PdfApi, чтобы инициировать преобразование. Вывод сохраняется в облачном хранилище.
# Для получения полных примеров кода посетите https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi
def pdf2html():
try:
#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")
# создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
pdf_api = PdfApi(pdf_api_client)
# Исходный PDF-документ
input_file_name = 'completeWorkbook.pdf'
# имя результирующего файла
resultant_file_name = 'CodeConversion.zip'
# Вызовите API для выполнения преобразования.
# мы установили выходной формат как zip и тип документа как xhtml
response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)
# вывести сообщение в консоль (необязательно)
print('PDF successfully converted to HTML format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
PDF в HTML с помощью команды cURL
В качестве альтернативы преобразование PDF в HTML также можно оптимизировать с помощью команд cURL в сочетании с Aspose.PDF Cloud. Этот подход обеспечивает удобный способ использования возможностей Aspose.PDF Cloud для ваших потребностей преобразования PDF в HTML. Этот подход наилучшим образом соответствует вашим требованиям, когда вы ищете независимый от платформы и языка подход для реализации бесшовного процесса преобразования PDF в HTML.
Сначала нам нужно сгенерировать токен доступа JWT на основе учетных данных клиента. Выполните следующую команду, чтобы сгенерировать токен JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Получив токен JWT, мы можем выполнить следующую команду для преобразования PDF-файла, доступного в облачном хранилище, в формат HTML, и в результате вывод будет возвращен в виде потокового ответа.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip
Если вам необходимо преобразовать PDF-файл в HTML и сохранить результат в облачном хранилище, попробуйте использовать следующую команду.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

Изображение 2: Предварительный просмотр преобразования PDF в HTML.
Заключение
В заключение, переход от PDF к HTML никогда не был таким гладким. Мы изучили силу преобразования Python REST API и эффективность Aspose.PDF Cloud с командами cURL для преобразования ваших PDF-документов в динамический, готовый к веб-размещению HTML. Эти методы не только обеспечивают целостность документа, но и повышают доступность и возможность совместного использования. Итак, пришло время сделать ваш контент доступным для более широкой аудитории и повысить свое присутствие в сети.
Если у вас возникнут какие-либо проблемы при использовании API или у вас возникнут дополнительные вопросы, свяжитесь с нами через бесплатный форум поддержки продукта.
Похожие статьи
Мы настоятельно рекомендуем посетить следующие ссылки, чтобы узнать больше о: