PDF to HTML

Chuyển đổi PDF sang HTML bằng .NET REST API.

Các tài liệu PDF là lựa chọn phổ biến để chia sẻ thông tin do định dạng nhất quán trên các thiết bị và nền tảng khác nhau. Nhưng khi nói đến việc hiển thị nội dung trên một trang web, PDF có thể không phải luôn là lựa chọn thân thiện nhất với người dùng. Tuy nhiên, việc chuyển đổi tệp PDF sang định dạng HTML mở ra một thế giới cơ hội cho các nhà phát triển web và người tạo nội dung. Một lý do khác cho việc chuyển đổi này là việc trình bày nội dung và khả năng truy cập là những yếu tố quan trọng cho thành công trực tuyến khi nó trở nên có thể được lập chỉ mục bởi các công cụ tìm kiếm.

Trong bài viết này, chúng ta sẽ đi sâu vào chi tiết về cách chuyển đổi PDF sang HTML bằng cách sử dụng .NET REST API.

REST API cho việc chuyển đổi PDF sang HTML

Việc chuyển đổi PDF sang HTML trở nên dễ dàng với khả năng mạnh mẽ của Aspose.PDF Cloud SDK for .NET.API này cho phép bạn tích hợp chức năng chuyển đổi PDF một cách liền mạch vào các ứng dụng và quy trình làm việc .NET của bạn. Chỉ cần vài dòng mã, bạn có thể dễ dàng chuyển đổi tài liệu PDF sang định dạng HTML, làm cho chúng phù hợp cho việc hiển thị và tương tác trên web. REST API cung cấp một loạt các tính năng để kiểm soát quá trình chuyển đổi. Bạn cũng có thể tùy chỉnh HTML đầu ra bằng cách chỉ định tên phông chữ mặc định, loại tài liệu, bố cục, độ phân giải hình ảnh và nhiều cấu hình khác.

Để bắt đầu với quá trình chuyển đổi này, trước tiên chúng ta cần thêm tham chiếu SDK vào dự án của mình và vì mục đích đó, vui lòng tìm kiếm Aspose.PDF-Cloud trong trình quản lý gói NuGet bên trong IDE Visual Studio và nhấp vào nút Add Package. Bạn cũng cần lấy thông tin đăng nhập của mình từ cloud dashboard.Trong trường hợp bạn chưa có tài khoản hiện có, chỉ cần tạo một tài khoản miễn phí bằng cách làm theo hướng dẫn được chỉ ra ở quick start.

Chuyển đổi PDF sang HTML bằng C# .NET

Bây giờ chúng ta cần thực hiện đoạn mã sau để thực hiện chuyển đổi nhằm hiển thị PDF trên website.

// For more examples, https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-dotnet/tree/master/Examples

// Nhận thông tin xác thực của khách hàng từ https://dashboard.aspose.cloud/
string clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
string clientID = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";

// tạo một thể hiện của PdfApi
PdfApi pdfApi = new PdfApi(clientSecret, clientID);

// Input PDF file name
String inputFile = "Binder1-1.pdf";
// read the content of input PDF file
var pdfFile = System.IO.File.OpenRead(inputFile);

// Gọi API để chuyển đổi tệp PDF thành HTML và lưu đầu ra vào lưu trữ đám mây.
// Chúng tôi đã chỉ định định dạng HTML đầu ra là `HTML5` 
// Cờ để lưu mỗi trang PDF dưới dạng tệp HTML riêng biệt đã được bật
// Đầu ra sẽ được tạo dưới dạng tệp .ZIP
pdfApi.PutPdfInRequestToHtml("converted.zip",documentType: "Html5", 
    splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", 
    outputFormat: "Zip" , file: pdfFile);
PDF to HTML

Xem trước chuyển đổi PDF sang HTML.

Dưới đây là một số chi tiết nhanh về đoạn mã đã nêu ở trên.

PdfApi pdfApi = new PdfApi(clientSecret, clientID);

Đầu tiên, tạo một đối tượng của lớp PdfApi trong khi truyền thông tin đăng nhập của khách hàng làm đối số đầu vào.

var pdfFile = System.IO.File.OpenRead(inputFile);

Đọc nội dung của tệp PDF từ ổ đĩa cục bộ.

pdfApi.PutPdfInRequestToHtml("converted.html",documentType: "Html5", splitIntoPages: true, rasterImagesSavingMode: "AsPngImagesEmbeddedIntoSvg", outputFormat: "Zip" , file: pdfFile);

Gọi API để chuyển đổi PDF từ luồng đầu vào sang định dạng HTML. Trong quá trình chuyển đổi, chúng tôi đã chỉ định giá trị để lưu mỗi trang PDF thành một tệp HTML riêng biệt.

Vui lòng truy cập PutPdfInRequestToHtml để có danh sách đầy đủ các đối số được hỗ trợ bởi cuộc gọi API này và các chi tiết liên quan.

Tài liệu PDF đầu vào được sử dụng trong ví dụ trên có thể được tải xuống từ Binder1.pdf.

PDF to HTML Online using cURL Commands

Chuyển đổi PDF sang HTML bằng cách sử dụng lệnh cURL kết hợp với Aspose.PDF Cloud cũng là một phương pháp linh hoạt và hiệu quả. Bằng cách tận dụng sức mạnh của các lệnh cURL, bạn có thể dễ dàng tích hợp API Aspose.PDF Cloud vào các ứng dụng của mình và tự động hóa quá trình chuyển đổi PDF sang HTML. Hơn nữa, việc sử dụng các lệnh cURL cho phép tương tác dễ dàng với các điểm cuối RESTful, tạo điều kiện cho việc giao tiếp và trao đổi dữ liệu liền mạch. Vậy để hiển thị PDF trong trình duyệt HTML, chúng ta chỉ cần chuyển đổi các tệp PDF sang HTML bằng cách gọi một vài lệnh cURL, và điều này giúp giảm đáng kể thời gian và nỗ lực phát triển.

Bước đầu tiên trong cách tiếp cận này là tạo một token truy cập JWT. Vì vậy, xin hãy thực hiện lệnh sau:

curl -v "https://api.aspose.cloud/connect/token" \
 -X POST \
 -d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
 -H "Content-Type: application/x-www-form-urlencoded" \
 -H "Accept: application/json"

Bây giờ chúng ta cần thực thi lệnh cURL sau, lệnh này tải tệp PDF từ lưu trữ đám mây, chuyển đổi toàn bộ tài liệu sang định dạng HTML và lưu đầu ra dưới dạng tệp .ZIP trên ổ đĩa cục bộ (tên được chỉ định với tham số -o).

curl -v "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/convert/html?compressSvgGraphicsIfAny=false&documentType=Html5&fixedLayout=true&splitIntoPages=false&rasterImagesSavingMode=AsPngImagesEmbeddedIntoSvg&removeEmptyAreasOnTopAndBottom=true&flowLayoutParagraphFullWidth=true" \
-X GET \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer {accessToken}" \
-o "Converted.zip"

Thay thế inputPDF bằng tên của tài liệu PDF đầu vào có sẵn trong lưu trữ đám mây, và accessToken bằng mã thông báo JWT được tạo ở trên.

Kết luận

Kết luận, việc chuyển đổi PDF sang HTML với Aspose.PDF Cloud API cung cấp một giải pháp toàn diện và linh hoạt. Dù sử dụng .NET REST API để tích hợp mượt mà hay lệnh cURL để chuyển đổi hiệu quả, Aspose.PDF Cloud SDK cung cấp nhiều tính năng và tùy chọn tùy chỉnh rộng rãi. Những phương pháp này đảm bảo việc hiển thị chính xác nội dung PDF vào HTML phản hồi, bảo tồn bố cục và định dạng để mang lại trải nghiệm người dùng tối ưu. Ngoài ra, khả năng nhúng nội dung PDF vào các trang HTML cho phép các ứng dụng web linh hoạt và tương tác, nâng cao khả năng tiếp cận và sự tham gia của người dùng.

Liên kết hữu ích

Bài viết liên quan

Chúng tôi khuyến nghị nên ghé thăm các blog sau: