แปลงไฟล์ pdf เป็น html

เรียนรู้วิธีการแปลง PDF เป็น HTML โดยใช้ Python

ในโลกดิจิทัลที่เปลี่ยนแปลงอย่างรวดเร็วในปัจจุบัน การเข้าถึงเอกสารได้ถือเป็นปัจจัยสำคัญสำหรับทั้งธุรกิจและบุคคล ความจำเป็นในการแปลงเอกสาร PDF เป็น HTML นั้นไม่เคยเด่นชัดเท่านี้มาก่อน แม้ว่าไฟล์ PDF จะเหมาะอย่างยิ่งสำหรับการรักษารูปแบบเอกสาร แต่การใช้งานไฟล์ PDF บนเว็บอาจยุ่งยากได้ เนื่องจากไฟล์ PDF มักขาดการโต้ตอบและความสามารถในการปรับตัวที่จำเป็นสำหรับประสบการณ์ออนไลน์สมัยใหม่ นั่นคือจุดที่ Python REST API เข้ามาช่วยเชื่อมช่องว่างดังกล่าว บทความนี้จะสำรวจความต้องการที่เพิ่มขึ้นสำหรับการแปลง PDF เป็น HTML และวิธีที่ Python REST API สามารถปฏิวัติกระบวนการนี้ได้

Python REST API สำหรับการแปลง PDF เป็น HTML

การแปลงเอกสาร PDF เป็นรูปแบบ HTML เป็นงานที่ง่ายและมีประสิทธิภาพด้วย Aspose.PDF Cloud SDK สำหรับ Python SDK ที่ทรงพลังนี้มีความสามารถมากมายเพื่อรับมือกับความท้าทายในการแปลง PDF เป็น HTML ได้อย่างราบรื่น ไม่ว่าคุณจะต้องนำเสนอเอกสารบนเว็บ แชร์เนื้อหาบนแพลตฟอร์มต่างๆ หรือปรับปรุงการเข้าถึงเอกสาร Aspose.PDF Cloud ช่วยคุณได้

Python Cloud SDK มีความสามารถในการสร้าง แก้ไข หรือแปลงไฟล์ PDF เป็นรูปแบบต่างๆ รวมถึง EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML

SDK สามารถดาวน์โหลดได้จากที่เก็บ PIP และ GitHub จากนั้นให้รันคำสั่งต่อไปนี้บนเทอร์มินัล/พรอมต์คำสั่งเพื่อติดตั้ง SDK เวอร์ชันล่าสุดบนระบบ

pip install asposepdfcloud

ในกรณีที่คุณต้องการเพิ่มการอ้างอิงโดยตรงในโครงการ Python ของคุณภายใน Visual Studio IDE โปรดค้นหา asposepdfcloud เป็นแพ็คเกจภายใต้หน้าต่างสภาพแวดล้อม Python โปรดปฏิบัติตามขั้นตอนที่ระบุหมายเลขในรูปภาพด้านล่างเพื่อดำเนินการติดตั้งให้เสร็จสมบูรณ์

pdftohtml เอพีไอ

รูปภาพ 1:- API การแปลง PDF เป็น HTML

แปลง PDF เป็น HTML ใน Python

โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อแปลง PDF เป็นรูปแบบ HTML

  • ขั้นแรก ให้สร้างอินสแตนซ์ของคลาส ApiClient ขณะส่ง ClinetID และรายละเอียดความลับของ Client เป็นอาร์กิวเมนต์
  • ประการที่สอง สร้างอ็อบเจ็กต์ของ PdfApi โดยที่เราส่งอ็อบเจ็กต์ ApiClient เป็นอาร์กิวเมนต์
  • ประการที่สาม ระบุชื่อของไฟล์ PDF อินพุตและผลลัพธ์ผลลัพธ์
  • สุดท้าย ให้เรียกใช้เมธอด putpdfinstoragetohtml(…) ของคลาส PdfApi เพื่อเริ่มการแปลง ผลลัพธ์จะถูกเก็บไว้ในระบบคลาวด์สตอเรจ
# สำหรับตัวอย่างโค้ดแบบสมบูรณ์ โปรดไปที่ https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # สร้างอินสแตนซ์ PdfApi ขณะส่ง PdfApiClient เป็นอาร์กิวเมนต์
        pdf_api = PdfApi(pdf_api_client)

        # แหล่งที่มาเอกสาร PDF
        input_file_name = 'completeWorkbook.pdf'

        # ชื่อของไฟล์ผลลัพธ์
        resultant_file_name = 'CodeConversion.zip'
    
        # เรียก API เพื่อดำเนินการแปลง
        # เราได้กำหนดรูปแบบผลลัพธ์เป็น zip และประเภทเอกสารเป็น xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # พิมพ์ข้อความในคอนโซล (ทางเลือก)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

แปลง PDF เป็น HTML โดยใช้คำสั่ง cURL

นอกจากนี้ การแปลง PDF เป็น HTML ยังสามารถทำได้อย่างคล่องตัวโดยใช้คำสั่ง cURL ร่วมกับ Aspose.PDF Cloud วิธีนี้เป็นวิธีที่สะดวกในการใช้ประโยชน์จากความสามารถของ Aspose.PDF Cloud เพื่อตอบสนองความต้องการในการแปลง PDF เป็น HTML ของคุณ วิธีนี้เหมาะที่สุดสำหรับความต้องการของคุณเมื่อคุณกำลังมองหาแนวทางที่ไม่ขึ้นกับแพลตฟอร์มและภาษา เพื่อนำกระบวนการแปลง PDF เป็น HTML มาใช้อย่างราบรื่น

ขั้นแรก เราต้องสร้างโทเค็นการเข้าถึง JWT โดยอิงตามข้อมูลประจำตัวไคลเอนต์ โปรดดำเนินการคำสั่งต่อไปนี้เพื่อสร้างโทเค็น JWT

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

เมื่อเรามีโทเค็น JWT แล้ว เราสามารถดำเนินการคำสั่งต่อไปนี้เพื่อแปลงไฟล์ PDF ที่มีอยู่ในที่เก็บข้อมูลบนคลาวด์ไปเป็นรูปแบบ HTML และผลลัพธ์จะถูกส่งกลับเป็นการตอบสนองแบบสตรีม

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

ในกรณีที่คุณต้องการแปลงไฟล์ PDF เป็น HTML และต้องการบันทึกเอาต์พุตลงในที่เก็บข้อมูลบนคลาวด์ โปรดลองใช้คำสั่งต่อไปนี้

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
การดูตัวอย่าง PDF เป็น HTML

ภาพที่ 2:- ดูตัวอย่างการแปลง PDF เป็น HTML

บทสรุป

โดยสรุป การเดินทางจาก PDF ไปยัง HTML ไม่เคยราบรื่นเท่านี้มาก่อน เราได้สำรวจพลังการแปลงของ Python REST API และประสิทธิภาพของ Aspose.PDF Cloud พร้อมคำสั่ง cURL ในการแปลงเอกสาร PDF ของคุณเป็น HTML แบบไดนามิกที่พร้อมใช้งานบนเว็บ วิธีการเหล่านี้ไม่เพียงแต่รับประกันความสมบูรณ์ของเอกสารเท่านั้น แต่ยังเพิ่มการเข้าถึงและการแชร์อีกด้วย ดังนั้น ถึงเวลาแล้วที่จะทำให้เนื้อหาของคุณเข้าถึงได้สำหรับผู้ชมที่กว้างขึ้นและยกระดับการปรากฏตัวออนไลน์ของคุณ

ในกรณีที่คุณพบปัญหาใดๆ ในระหว่างการใช้งาน API หรือมีข้อสงสัยเพิ่มเติม โปรดติดต่อเราผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ฟรี

บทความที่เกี่ยวข้อง

เราขอแนะนำให้เยี่ยมชมลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: