
Phát triển Trình chuyển đổi PDF sang HTML bằng C# .NET
Hầu hết mọi người sử dụng Portable Document Format (PDF) vì định dạng tài liệu được bảo toàn khi xem các tệp này trên bất kỳ nền tảng nào. Độ trung thực của tài liệu không bị ảnh hưởng khi xem trên nền tảng Máy tính để bàn hoặc thiết bị di động. Tuy nhiên, để xem tệp PDF, bạn cần sử dụng một ứng dụng xem cụ thể. Vì vậy, để khắc phục những nhược điểm như vậy, định dạng HTML có thể là một trong những giải pháp khả thi. Trong bài viết này, chúng ta sẽ thảo luận chi tiết về cách chuyển đổi PDF sang HTML bằng C# .NET.
Trong bài viết này, chúng ta sẽ thảo luận chi tiết về các chủ đề sau
- API chuyển đổi PDF sang HTML
- Chuyển đổi PDF sang HTML - Kết quả trong Phản hồi
- PDF sang HTML - Kết quả trong Lưu trữ đám mây
- Local Drive PDF to HTML - Đầu ra trong lưu trữ đám mây
API chuyển đổi PDF sang HTML
Aspose.PDF Cloud dựa trên kiến trúc REST và cung cấp khả năng tạo, chỉnh sửa cũng như chuyển đổi PDF sang Định dạng tài liệu được hỗ trợ bao gồm HTML, JPEG, DOCX, PPTX, XLSX, SVG, v.v. Trong bài viết này, chúng tôi tập trung vào các bước chuyển đổi PDF sang HTML bằng C# .NET. Nhiệm vụ này có thể được thực hiện bằng cách sử dụng Aspose.PDF Cloud SDK cho .NET, đây là trình bao bọc xung quanh Aspose.PDF Cloud để bạn có được tất cả các tính năng của REST API trong ứng dụng .NET của mình.
SDK có sẵn để tải xuống trên NuGet và GitHub và để cài đặt nó từ thư viện NuGet, vui lòng thực hiện lệnh sau trong trình quản lý gói NuGet:
Install-Package Aspose.Pdf-Cloud
Hoặc, bạn cũng có thể cân nhắc cài đặt SDK trực tiếp trong dự án Visual Studio dưới dạng gói NuGet. Tất cả những gì bạn cần làm là mở rộng cây dự án trong Solution Explorer, nhấp chuột phải vào thư mục Packages và chọn tùy chọn Manage NuGet Packages… từ menu ngữ cảnh.

Hình ảnh 1:- Quản lý các gói NuGet.
Bây giờ hãy tìm Aspose.PDF Cloud trong trường tìm kiếm, kích hoạt hộp kiểm bên cạnh tên gói và nhấp vào nút Thêm gói.

Hình ảnh 2:- Aspose.PDF Cloud SDK trong các gói NuGet.
Lưu ý rằng Aspose.Pdf-Cloud.dll xuất hiện trong thư mục Packages.

Hình ảnh 3:- Aspose.Pdf-cloud.dll trong trình khám phá giải pháp.
Sau khi cài đặt, bạn cần Đăng nhập vào bảng điều khiển đám mây bằng tài khoản GitHub hoặc Google hiện có hoặc nhấp vào nút Tạo tài khoản mới.
Chuyển đổi PDF sang HTML - Kết quả trong Phản hồi
Vui lòng làm theo các bước dưới đây để thực hiện thao tác chuyển đổi PDF sang HTML. PDF đầu vào được tải từ bộ nhớ đám mây và HTML kết quả được trả về dưới dạng ngữ cảnh luồng phản hồi có thể được lưu trong ổ đĩa cục bộ hoặc hiển thị trực tiếp trong trình duyệt web.
- Bước đầu tiên là tạo một biến String xác định thông tin chi tiết về Client ID và Client Secret.
- Thứ hai, tạo một phiên bản của PdfApi trong khi truyền các biến Client ID và Client Secret làm đối số.
- Thứ ba, đọc nội dung của tệp PDF và tải nó vào phiên bản Stream.
- Sau đó tải tệp PDF lên bộ nhớ đám mây bằng phương thức UploadFile(…) của lớp PdfApi.
- Cuối cùng, gọi phương thức GetPdfInStorageToHtml(…) để thực hiện chuyển đổi.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// đường dẫn của tệp PDF đầu vào
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// đọc nội dung tệp PDF vào phiên bản Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// tên của tập tin trong lưu trữ đám mây
String fileNameinStorage = "MyUploaded.pdf";
try
{
// tải PDF lên lưu trữ đám mây
pdfApi.UploadFile(fileNameinStorage, fs);
// thực hiện chuyển đổi tài liệu
var response = pdfApi.GetPdfInStorageToHtml(fileNameinStorage, folder: null);
// viết kết quả vào consoile
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
PDF sang HTML - Kết quả trong Lưu trữ đám mây
Trong phần này, chúng ta sẽ sử dụng một phương pháp để chuyển đổi tệp PDF sang HTML và lưu đầu ra trong bộ nhớ đám mây. Vui lòng làm theo các bước dưới đây để thực hiện yêu cầu này:
- Đầu tiên, tạo một thể hiện của lớp PdfApi bằng cách truyền thông tin chi tiết về Client ID và Client Secret làm đối số.
- Thứ hai, đọc tệp PDF đầu vào vào phiên bản Stream và chỉ định tên tệp đầu ra với phần mở rộng .zip.
- Thứ ba, tải tệp PDF lên bộ nhớ đám mây bằng phương thức UploadFile(…).
- Cuối cùng, gọi phương thức PutPdfInStorageToHtml(…) lấy tên tệp PDF đầu vào và tên tệp kết quả làm đối số.
- Cuối cùng, in mã phản hồi vào bảng điều khiển.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// đường dẫn của tệp PDF đầu vào
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// đọc nội dung tệp PDF vào phiên bản Stream
using var fs = new FileStream(inputFile, FileMode.Open, FileAccess.Read);
// tên của tập tin trong lưu trữ đám mây
String fileNameinStorage = "MyUploaded.pdf";
// tên của tập tin kết quả trong lưu trữ đám mây
string resFileName = "result.zip";
// tải tập tin lên Cloud Storage
try
{
// tải tập tin lên bộ nhớ đám mây
pdfApi.UploadFile(fileNameinStorage, fs);
// thực hiện chuyển đổi PDF sang HTML và lưu tệp trong bộ nhớ đám mây
var response = pdfApi.PutPdfInStorageToHtml(fileNameinStorage,resFileName, folder: null);
// in mã phản hồi trong bảng điều khiển
Console.WriteLine(response);
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
Local Drive PDF to HTML - Đầu ra trong lưu trữ đám mây
Trong phần này, chúng ta sẽ thảo luận về các bước tải PDF từ ổ đĩa cục bộ, sau đó chuyển đổi PDF sang HTML trực tuyến và lưu đầu ra trên bộ nhớ đám mây.
- Bước đầu tiên là tạo một phiên bản của PdfApi trong khi truyền Client ID và Client Secret làm đối số.
- Thứ hai, xác định các biến chuỗi cho tệp PDF đầu vào và tệp .zip kết quả sẽ được lưu trữ trên bộ nhớ đám mây.
- Thứ ba, tải tệp PDF đầu vào vào phiên bản luồng.
- Cuối cùng, gọi phương thức PutPdfInRequestToHtml(…) lấy tên tệp kết quả và luồng giữ PDF làm đối số. Đầu ra được lưu trong bộ nhớ đám mây.
// lấy thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "343ebf767f3f53537a45ced31d6be34f";
string clientID = "b1a1b925-cbd0-40c3-b7d5-075c93601243";
// tạo một phiên bản của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);
// đường dẫn của tệp PDF đầu vào
String inputFile = "/Users/nayyershahbaz/Downloads/Pak 1Q 2021.pdf";
// tên của tập tin trong lưu trữ đám mây
String resultantFile = "converted.zip";
try
{
using (Stream stream = System.IO.File.OpenRead(inputFile))
{
// khởi tạo chuyển đổi PDF sang HTML
var response = pdfApi.PutPdfInRequestToHtml(resultantFile, file: stream);
// in mã phản hồi (thành công 200) trong bảng điều khiển
Console.WriteLine(response);
} // stream ends here
}
catch (Exception ex)
{
System.Diagnostics.Debug.WriteLine("error:" + ex.Message + "\n" + ex.StackTrace);
}
Phần kết luận
Trong bài viết này, chúng tôi đã thảo luận về các bước chuyển đổi PDF sang HTML theo nhiều cách tiếp cận khác nhau. Chúng tôi đã tải được tệp PDF đã lưu trữ trong bộ nhớ đám mây cũng như tải tệp từ ổ đĩa cục bộ và chuyển đổi tệp đó sang định dạng HTML. Xin lưu ý rằng Aspose.PDF Cloud SDK cho .NET được phân phối theo giấy phép MIT và mã nguồn đầy đủ của nó có sẵn để tải xuống qua GitHub. Trong trường hợp bạn gặp bất kỳ sự cố nào khi sử dụng API hoặc có bất kỳ thắc mắc liên quan nào, vui lòng liên hệ với chúng tôi qua Diễn đàn hỗ trợ sản phẩm miễn phí.
Liên kết liên quan
Chúng tôi cũng khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: