PDF เป็น HTML

พัฒนาโปรแกรมแปลง PDF เป็น HTML โดยใช้ C# .NET

คนส่วนใหญ่มักใช้ Portable Document Format (PDF) เนื่องจากการจัดรูปแบบเอกสารจะคงอยู่เมื่อเปิดดูไฟล์เหล่านี้บนแพลตฟอร์มใดก็ตาม ความถูกต้องของเอกสารจะไม่ลดลงเมื่อเปิดดูบนเดสก์ท็อปหรือแพลตฟอร์มมือถือ แต่หากต้องการดูไฟล์ PDF คุณต้องใช้แอปพลิเคชันสำหรับดูไฟล์โดยเฉพาะ ดังนั้น เพื่อแก้ไขข้อบกพร่องดังกล่าว รูปแบบ HTML จึงถือเป็นวิธีแก้ปัญหาที่เหมาะสมได้ ในบทความนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการแปลง PDF เป็น HTML โดยใช้ C# .NET

ในบทความนี้เราจะพูดถึงหัวข้อต่อไปนี้โดยละเอียด

API การแปลง PDF เป็น HTML

Aspose.PDF Cloud ใช้สถาปัตยกรรม REST และมีความสามารถในการสร้าง แก้ไข และแปลง PDF เป็น Supported Document Formats รวมถึง HTML, JPEG, DOCX, PPTX, XLSX, SVG เป็นต้น ในบทความนี้ เราจะเน้นที่ขั้นตอนการแปลง PDF เป็น HTML โดยใช้ C# .NET โดยสามารถดำเนินการนี้ได้โดยใช้ Aspose.PDF Cloud SDK for .NET ซึ่งเป็นโปรแกรมห่อหุ้ม Aspose.PDF Cloud เพื่อให้คุณได้รับฟีเจอร์ทั้งหมดของ REST API ในแอปพลิเคชัน .NET ของคุณ

สามารถดาวน์โหลดไฟล์ SDK ได้ที่ NuGet และ GitHub และเพื่อที่จะติดตั้งจากไลบรารี NuGet โปรดดำเนินการคำสั่งต่อไปนี้ในตัวจัดการแพ็กเกจ NuGet:

Install-Package Aspose.Pdf-Cloud

หรือคุณอาจลองติดตั้ง SDK โดยตรงภายในโครงการ Visual Studio เป็นแพ็คเกจ NuGet สิ่งที่คุณต้องทำคือขยายโครงสร้างโครงการใน Solution Explorer คลิกขวาที่โฟลเดอร์ Packages แล้วเลือกตัวเลือก Manage NuGet Packages… จากเมนูบริบท

จัดการแพ็กเกจ NuGet

รูปภาพ 1:- จัดการแพ็กเกจ NuGet

ตอนนี้ค้นหา Aspose.PDF Cloud ในช่องค้นหา เปิดใช้งานช่องกาเครื่องหมายข้างชื่อแพ็คเกจ และคลิกปุ่ม เพิ่มแพ็คเกจ

Aspose.PDF คลาวด์ SDK

รูปภาพ 2:- Aspose.PDF Cloud SDK ในแพ็คเกจ NuGet

สังเกตว่า Aspose.Pdf-Cloud.dll ปรากฏอยู่ภายใต้โฟลเดอร์ Packages

Aspose.Pdf-cloud.dll

รูปภาพ 3:- Aspose.Pdf-cloud.dll ภายใต้ Solution Explorer

หลังจากการติดตั้ง คุณต้องลงชื่อเข้าใช้บนแดชบอร์ดคลาวด์โดยใช้บัญชี GitHub หรือ Google ที่มีอยู่ของคุณ หรือคลิกที่ปุ่ม สร้างบัญชีใหม่

แปลง PDF เป็น HTML - ผลลัพธ์ในการตอบสนอง

โปรดปฏิบัติตามขั้นตอนด้านล่างเพื่อดำเนินการแปลง PDF เป็น HTML อินพุต PDF จะถูกโหลดจากที่เก็บข้อมูลบนคลาวด์ และ HTML ที่ได้จะถูกส่งกลับเป็นบริบทสตรีมการตอบสนองที่สามารถบันทึกลงในไดรฟ์ภายในหรือแสดงโดยตรงในเว็บเบราว์เซอร์

  • ขั้นตอนแรกคือการสร้างตัวแปร String ที่กำหนดรายละเอียด ID ไคลเอนต์และความลับไคลเอนต์
  • ประการที่สอง ให้สร้างอินสแตนซ์ของ PdfApi ในขณะที่ส่งตัวแปร Client ID และ Client Secret เป็นอาร์กิวเมนต์
  • ประการที่สาม อ่านเนื้อหาของไฟล์ PDF และโหลดลงในอินสแตนซ์ Stream
  • จากนั้นอัปโหลดไฟล์ PDF ไปที่การจัดเก็บข้อมูลบนคลาวด์โดยใช้วิธี UploadFile(…) ของคลาส PdfApi
  • ในที่สุด เรียกใช้เมธอด GetPdfInStorageToHtml(…) เพื่อดำเนินการแปลง
// รับข้อมูลประจำตัวลูกค้าจาก https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// สร้างอินสแตนซ์ของ PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// เส้นทางของไฟล์ PDF อินพุต
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// อ่านเนื้อหาไฟล์ PDF ลงในอินสแตนซ์ Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);

// ชื่อไฟล์ในระบบจัดเก็บข้อมูลบนคลาวด์
String fileNameinStorage = "MyUploaded.pdf";

try
{
    // อัพโหลด PDF ไปยังที่เก็บข้อมูลบนคลาวด์
    pdfApi.UploadFile(fileNameinStorage, fs);
    
    // ดำเนินการแปลงเอกสาร
    var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
    
    // เขียนผลลัพธ์ในคอนโซล
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}

PDF เป็น HTML - ผลลัพธ์ในการจัดเก็บข้อมูลบนคลาวด์

ในส่วนนี้ เราจะใช้วิธีการแปลงไฟล์ PDF เป็น HTML และบันทึกผลลัพธ์ลงในระบบคลาวด์สตอเรจ โปรดปฏิบัติตามขั้นตอนด้านล่างเพื่อให้บรรลุข้อกำหนดนี้:

  • ขั้นแรก ให้สร้างอินสแตนซ์ของคลาส PdfApi โดยส่งรายละเอียด Client ID และ Client Secret เป็นอาร์กิวเมนต์
  • ประการที่สอง อ่านไฟล์ PDF อินพุตไปยังอินสแตนซ์ Stream และระบุชื่อไฟล์เอาต์พุตพร้อมนามสกุล .zip
  • ประการที่สาม อัปโหลดไฟล์ PDF ไปยังพื้นที่เก็บข้อมูลบนคลาวด์โดยใช้เมธอด UploadFile(…)
  • ก่อนสุดท้าย เรียกใช้เมธอด PutPdfInStorageToHtml(…) ซึ่งรับชื่อไฟล์ PDF อินพุตและชื่อไฟล์ผลลัพธ์เป็นอาร์กิวเมนต์
  • สุดท้ายให้พิมพ์รหัสการตอบสนองในคอนโซล
// รับข้อมูลประจำตัวลูกค้าจาก https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// สร้างอินสแตนซ์ของ PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// เส้นทางของไฟล์ PDF อินพุต
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// อ่านเนื้อหาไฟล์ PDF ลงในอินสแตนซ์ Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);

// ชื่อไฟล์ในระบบจัดเก็บข้อมูลบนคลาวด์
String fileNameinStorage = "MyUploaded.pdf";

// ชื่อของไฟล์ผลลัพธ์ในระบบจัดเก็บข้อมูลบนคลาวด์
string resFileName = "result.zip";

// อัพโหลดไฟล์ไปยัง Cloud Storage            
try
{
    // อัพโหลดไฟล์ไปยังที่เก็บข้อมูลบนคลาวด์
    pdfApi.UploadFile(fileNameinStorage, fs);
    
    // ดำเนินการแปลง PDF เป็น HTML และบันทึกไฟล์ในที่เก็บข้อมูลบนคลาวด์
    var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
    
    // พิมพ์รหัสการตอบสนองในคอนโซล
    Console.WriteLine(response);
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
 } 

ส่งออก PDF เป็น HTML ในไดรฟ์ภายในเครื่องไปยังระบบจัดเก็บข้อมูลบนคลาวด์

ในส่วนนี้เราจะพูดถึงขั้นตอนในการโหลด PDF จากไดรฟ์ในเครื่อง แปลง PDF เป็น HTML ออนไลน์ และบันทึกเอาต์พุตในที่เก็บข้อมูลบนคลาวด์

  • ขั้นตอนแรกคือการสร้างอินสแตนซ์ของ PdfApi ขณะส่ง Client ID และ Client Secret เป็นอาร์กิวเมนต์
  • ประการที่สอง กำหนดตัวแปรสตริงสำหรับไฟล์ PDF อินพุตและไฟล์ .zip ผลลัพธ์ที่จะจัดเก็บในที่เก็บข้อมูลบนคลาวด์
  • ประการที่สาม โหลด PDF อินพุตลงในอินสแตนซ์สตรีม
  • สุดท้าย ให้เรียกใช้เมธอด PutPdfInRequestToHtml(…) ซึ่งรับชื่อไฟล์ผลลัพธ์และสตรีมที่เก็บ PDF เป็นอาร์กิวเมนต์ ผลลัพธ์จะถูกบันทึกไว้ในที่เก็บข้อมูลบนคลาวด์
// รับข้อมูลประจำตัวลูกค้าจาก https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";

// สร้างอินสแตนซ์ของ PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// เส้นทางของไฟล์ PDF อินพุต
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";

// ชื่อไฟล์ในระบบจัดเก็บข้อมูลบนคลาวด์
String resultantFile = "converted.zip";

try
{
    using (Stream stream = System.IO.File.OpenRead(inputFile))
    {
        // เริ่มต้นการแปลง PDF เป็น HTML
        var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
        
        // พิมพ์รหัสการตอบสนอง (สำเร็จ 200) ในคอนโซล
        Console.WriteLine(response);
    }   // stream ends here
}
catch (Exception ex)
{
    System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
} 

บทสรุป

ในบทความนี้ เราได้กล่าวถึงขั้นตอนในการแปลง PDF เป็น HTML ในวิธีต่างๆ เราสามารถโหลดไฟล์ PDF ที่จัดเก็บไว้แล้วในที่จัดเก็บข้อมูลบนคลาวด์ได้ รวมถึงโหลดไฟล์จากไดรฟ์ภายในเครื่องและแปลงเป็นรูปแบบ HTML โปรดทราบว่า Aspose.PDF Cloud SDK สำหรับ .NET เผยแพร่ภายใต้ใบอนุญาต MIT และสามารถดาวน์โหลดซอร์สโค้ดฉบับสมบูรณ์ได้ที่ GitHub หากคุณพบปัญหาใดๆ ในขณะใช้ API หรือมีคำถามที่เกี่ยวข้อง โปรดติดต่อเราผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ฟรี

ลิงก์ที่เกี่ยวข้อง

เราขอแนะนำให้เยี่ยมชมลิงค์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: