โปรแกรมแปลงไฟล์ PDF เป็น HTML

แปลง PDF เป็น HTML โดยใช้ Java

หนึ่งในมาตรฐาน defacto สำหรับข้อมูลและการแบ่งปันข้อมูลทางอินเทอร์เน็ตคือ PDF สาเหตุของความนิยมคือการรักษารูปแบบและความเที่ยงตรงของเอกสารเมื่อดูบนแพลตฟอร์มใดๆ รวมถึงเดสก์ท็อปหรือมือถือ อย่างไรก็ตาม ในการดูไฟล์เหล่านี้ คุณต้องใช้โปรแกรมดู PDF อย่างไรก็ตาม วิธีแก้ปัญหาง่ายๆ คือการแปลง PDF เป็น HTML และโหลด HTML ในเว็บเบราว์เซอร์ได้ง่ายๆ ดังนั้นในบทความนี้ เราจะพูดถึงรายละเอียดเพิ่มเติมเกี่ยวกับวิธีพัฒนาตัวแปลง PDF เป็น HTML โดยใช้ REST API

API การแปลง SXC เป็น Excel

หากต้องการสร้าง จัดการ และแปลงไฟล์ PDF เป็นรูปแบบอื่น โปรดลองใช้ Aspose.PDF Cloud SDK for Java หากต้องการใช้ SDK โปรดเพิ่มข้อมูลต่อไปนี้ใน pom.xml ของโปรเจ็กต์ประเภท maven build

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

เมื่อเพิ่ม Aspose.PDF Cloud SDK สำหรับการอ้างอิง Java ในโครงการของคุณแล้ว ขั้นตอนต่อไปคือการสร้างบัญชีฟรีผ่าน Aspose Cloud เข้าสู่ระบบโดยใช้บัญชีที่สร้างขึ้นใหม่และค้นหา/สร้างรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ที่ Cloud Dashboard รายละเอียดเหล่านี้จำเป็นในส่วนถัดไป

ตัวแปลง PDF เป็น HTML ใน Java

เรามาพูดถึงรายละเอียดเกี่ยวกับวิธีพัฒนาตัวแปลง PDF เป็น HTML โดยใช้ Java Cloud SDK โปรดทราบว่าในข้อมูลโค้ดต่อไปนี้ พารามิเตอร์พื้นฐานมากจะใช้ระหว่างการดำเนินการแปลง แต่เราขอแนะนำให้ไปที่ส่วน การอ้างอิง API เพื่อดูรายการพารามิเตอร์ที่รองรับทั้งหมดรวมถึงคำอธิบายที่เกี่ยวข้อง

  • ก่อนอื่นเราต้องสร้างวัตถุ PdfApi ในขณะที่ระบุ ClientID และความลับของไคลเอ็นต์เป็นอาร์กิวเมนต์
  • ประการที่สอง โหลดไฟล์ PDF อินพุตโดยใช้อินสแตนซ์ของไฟล์
  • ประการที่สาม อัปโหลด PDF อินพุตไปยังที่เก็บข้อมูลบนคลาวด์โดยใช้เมธอด uploadFile(…)
  • เนื่องจากเราต้องการเพียงแปลงหน้าที่สองของ PDF ดังนั้นเราจึงให้ค่าหน้าที่ 2 ในวัตถุรายการ
  • ตอนนี้เรียกเมธอด putPdfInStorageToHtml(…) ที่ต้องป้อน PDF ชื่อของ HTML ที่เป็นผลลัพธ์และพารามิเตอร์การแปลงอื่น ๆ
try
    {
    // รับ ClientID และ ClientSecret จาก https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // สร้างอินสแตนซ์ของ PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // ชื่อของเอกสาร PDF ที่ป้อน 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // ชื่อของไฟล์ HTML ที่เป็นผลลัพธ์
    String resultantImage = "Resultant.html";
	  
    // อ่านเนื้อหาของไฟล์ PDF ที่ป้อน
    File file = new File("//Users//"+inputFile);
	    
    // อัปโหลด PDF ไปยังที่เก็บข้อมูลบนคลาวด์
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // รายการหน้า PDF ที่จะแปลง
    List<Integer> list = new ArrayList<Integer>();
    //list.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // เรียก API สำหรับการแปลง PDF เป็น HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // พิมพ์ข้อความแสดงความสำเร็จ
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
โปรแกรมแปลงไฟล์ PDF เป็น HTML

Image1:- ตัวอย่างการแปลง PDF เป็น HTML

ไฟล์ PDF ตัวอย่างที่ใช้ในตัวอย่างข้างต้นสามารถดาวน์โหลดได้จาก PdfWithScreenAnnotations.pdf

แปลง PDF เป็น HTML โดยใช้คำสั่ง cURL

คำสั่ง cURL เป็นหนึ่งในวิธีที่สะดวกสำหรับการเข้าถึง REST API ผ่านเทอร์มินัลบรรทัดคำสั่ง ตอนนี้ข้อกำหนดเบื้องต้นสำหรับแนวทางนี้คือการสร้างโทเค็นการเข้าถึง JWT (ตามข้อมูลประจำตัวไคลเอ็นต์) ในขณะที่ดำเนินการคำสั่งต่อไปนี้

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

เมื่อเรามีโทเค็น JWT แล้ว เราต้องใช้คำสั่งต่อไปนี้เพื่อแปลง PDF เป็น HTML HTML ผลลัพธ์จะถูกบันทึกเป็นไฟล์ Zip บนที่เก็บข้อมูลบนคลาวด์

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

บทสรุป

เราได้เรียนรู้ขั้นตอนในการพัฒนาตัวแปลง PDF เป็น HTML โดยใช้ Java Cloud SDK ดังนั้นเราสามารถใช้ Jave code snippet เพื่อแปลง PDF เป็น HTML หรือเราสามารถใช้คำสั่ง cULR เพื่อแปลง PDF เป็น HTML5 ในกรณีที่คุณต้องการเปลี่ยนแปลงซอร์สโค้ดของ Java Cloud SDK คุณสามารถดาวน์โหลดซอร์สโค้ดทั้งหมดได้จาก GitHub คุณอาจลองติดต่อเราเพื่อแก้ไขปัญหาอย่างรวดเร็วผ่าน [ฟอรัมสนับสนุนผลิตภัณฑ์] ฟรี 9

บทความที่เกี่ยวข้อง

เราขอแนะนำให้ไปที่ลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: