pdf를 html로

Python을 사용하여 PDF를 HTML로 변환하는 방법을 알아보세요

오늘날의 빠르게 움직이는 디지털 세계에서 문서 접근성은 기업과 개인 모두에게 중요한 고려 사항입니다. PDF 문서를 HTML로 변환해야 할 필요성은 그 어느 때보다 커졌습니다. PDF 파일은 문서 서식을 보존하는 데 매우 뛰어나지만 웹에서 작업하는 것은 번거로울 수 있습니다. 종종 현대 온라인 경험에 필요한 상호 작용성과 적응성이 부족합니다. 바로 여기서 Python REST API가 격차를 메우기 위해 나섭니다. 이 글에서는 PDF에서 HTML로 변환하는 데 대한 수요가 증가하고 있는 것과 Python REST API가 이 프로세스를 어떻게 혁신할 수 있는지 살펴봅니다.

PDF를 HTML로 변환하기 위한 Python REST API

PDF 문서를 HTML 형식으로 변환하는 작업은 Aspose.PDF Cloud SDK for Python으로 간단하고 효율적으로 수행할 수 있습니다. 이 강력한 SDK는 PDF에서 HTML로 변환하는 과제를 원활하게 해결할 수 있는 다양한 기능을 제공합니다. 웹에서 문서를 제시하거나, 다양한 플랫폼에서 콘텐츠를 공유하거나, 문서 접근성을 향상해야 하는 경우 Aspose.PDF Cloud가 해결해 드립니다.

Python Cloud SDK는 EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML을 포함한 다양한 형식으로 PDF 파일을 생성, 편집 또는 변환할 수 있는 완벽한 역량을 갖추고 있습니다.

SDK는 PIPGitHub 저장소에서 다운로드할 수 있습니다. 이제 터미널/명령 프롬프트에서 다음 명령을 실행하여 시스템에 최신 버전의 SDK를 설치하세요.

pip install asposepdfcloud

Visual Studio IDE 내에서 Python 프로젝트에 참조를 직접 추가해야 하는 경우 Python 환경 창에서 asposepdfcloud를 패키지로 검색하세요. 아래 이미지에 번호가 매겨진 단계를 따라 설치 프로세스를 완료하세요.

pdftohtml api

이미지 1: PDF를 HTML로 변환하는 API.

파이썬에서 PDF를 HTML로 변환

PDF를 HTML 형식으로 변환하려면 아래 지침을 따르세요.

  • 먼저, ClinetID와 클라이언트 비밀번호 정보를 인수로 전달하여 ApiClient 클래스의 인스턴스를 생성합니다.
  • 두 번째로, ApiClient 객체를 인수로 전달하는 PdfApi 객체를 생성합니다.
  • 셋째, 입력 PDF의 이름과 결과 출력을 지정합니다.
  • 마지막으로 PdfApi 클래스의 putpdfinstoragetohtml(…) 메서드를 호출하여 변환을 시작합니다. 출력은 클라우드 스토리지에 저장됩니다.
# 전체 코드 샘플은 https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python에서 확인하세요.

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # PdfApiClient를 인수로 전달하면서 PdfApi 인스턴스를 생성합니다.
        pdf_api = PdfApi(pdf_api_client)

        # 소스 PDF 문서
        input_file_name = 'completeWorkbook.pdf'

        # 결과 파일의 이름
        resultant_file_name = 'CodeConversion.zip'
    
        # 변환을 수행하기 위한 API 호출
        # 출력 형식을 zip으로, 문서 유형을 xhtml로 설정했습니다.
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # 콘솔에 메시지 출력 (선택 사항)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

cURL 명령을 사용하여 PDF를 HTML로 변환

또는 Aspose.PDF Cloud와 함께 cURL 명령을 사용하여 PDF를 HTML로 변환하는 것도 간소화할 수 있습니다. 이 접근 방식은 PDF에서 HTML로 변환하는 데 필요한 Aspose.PDF Cloud의 기능을 활용하는 편리한 방법을 제공합니다. 이 접근 방식은 원활한 PDF에서 HTML로 변환 프로세스를 구현하기 위해 플랫폼 및 언어에 독립적인 접근 방식을 찾고 있을 때 요구 사항에 가장 적합합니다.

먼저 클라이언트 자격 증명을 기반으로 JWT 액세스 토큰을 생성해야 합니다. 다음 명령을 실행하여 JWT 토큰을 생성하세요.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT 토큰을 얻으면 다음 명령을 실행하여 클라우드 저장소에 있는 PDF 파일을 HTML 형식으로 변환할 수 있으며, 그 결과 출력이 스트림 응답으로 반환됩니다.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

PDF 파일을 HTML로 변환하고, 출력 결과를 클라우드 저장소에 저장하려는 경우 다음 명령을 사용해 보세요.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
PDF에서 HTML로 미리보기

이미지 2: PDF에서 HTML로 변환 미리보기.

결론

결론적으로 PDF에서 HTML로의 여정은 그 어느 때보다 순조로웠습니다. Python REST API의 변환 능력과 Aspose.PDF Cloud의 효율성을 cURL 명령과 함께 살펴보며 PDF 문서를 동적이고 웹에 적합한 HTML로 변환했습니다. 이러한 방법은 문서 무결성을 보장할 뿐만 아니라 접근성과 공유성을 향상시킵니다. 따라서 더 광범위한 청중이 콘텐츠를 액세스할 수 있도록 만들고 온라인 존재감을 높일 때입니다.

API 사용 중 문제가 발생하거나 추가 문의 사항이 있는 경우 무료 제품 지원 포럼을 통해 언제든지 문의해 주시기 바랍니다.

관련기사

자세한 내용을 알아보려면 다음 링크를 방문해 보세요.