Trình chuyển đổi PDF sang HTML

Chuyển đổi PDF sang HTML bằng Java

Một trong những tiêu chuẩn chính thức về chia sẻ thông tin và dữ liệu qua internet là PDF. Lý do cho sự phổ biến của nó là nó duy trì bố cục và độ trung thực của tài liệu khi được xem trên bất kỳ nền tảng nào bao gồm Máy tính để bàn hoặc thiết bị di động. Tuy nhiên, để xem được các tập tin này, bạn cần sử dụng ứng dụng xem PDF. Tuy nhiên, một cách giải quyết đơn giản là chuyển đổi PDF thành HTML và dễ dàng tải HTML trong trình duyệt web. Vì vậy, trong bài viết này, chúng ta sẽ thảo luận chi tiết hơn về cách phát triển trình chuyển đổi PDF sang HTML bằng API REST.

API chuyển đổi SXC sang Excel

Để tạo, thao tác và chuyển đổi tệp PDF sang các định dạng khác, vui lòng thử sử dụng Aspose.PDF Cloud SDK for Java. Bây giờ để sử dụng SDK, vui lòng thêm thông tin sau vào tệp pom.xml của dự án kiểu xây dựng maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Giờ đây, tham chiếu Aspose.PDF Cloud SDK dành cho Java đã được thêm vào dự án của bạn, bước tiếp theo là tạo một tài khoản miễn phí trên Aspose Cloud. Đăng nhập bằng tài khoản mới tạo và tra cứu/tạo Client ID và Client Secret tại Cloud Dashboard. Những chi tiết này được yêu cầu trong các phần tiếp theo.

Trình chuyển đổi PDF sang HTML trong Java

Hãy thảo luận chi tiết về cách phát triển trình chuyển đổi PDF sang HTML bằng Java Cloud SDK. Xin lưu ý rằng trong đoạn mã sau, các tham số rất cơ bản được sử dụng trong quá trình chuyển đổi nhưng chúng tôi khuyên bạn nên truy cập phần Tham chiếu API để biết danh sách tất cả các tham số được hỗ trợ cũng như mô tả liên quan của chúng.

  • Trước tiên, chúng ta cần tạo một đối tượng PdfApi trong khi cung cấp ClientID và Client secret làm đối số
  • Thứ hai, tải tệp PDF đầu vào bằng cách sử dụng Phiên bản tệp
  • Thứ ba, tải tệp PDF đầu vào lên bộ nhớ đám mây bằng phương thức uploadFile(…)
  • Vì chúng tôi chỉ cần chuyển đổi trang thứ hai của PDF, nên chúng tôi đang cung cấp giá trị trang thứ hai trong đối tượng Danh sách
  • Bây giờ, hãy gọi phương thức putPdfInStorageToHtml(…) yêu cầu đầu vào là PDF, tên của HTML kết quả và nhiều tham số chuyển đổi khác
try
    {
    // Nhận ClientID và ClientSecret từ https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // tạo một phiên bản của PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // tên của tài liệu PDF đầu vào 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // tên của tệp HTML kết quả
    String resultantImage = "Resultant.html";
	  
    // đọc nội dung của tệp PDF đầu vào
    File file = new File("//Users//"+inputFile);
	    
    // tải PDF lên bộ nhớ đám mây
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // danh sách các trang PDF sẽ được chuyển đổi
    List<Integer> list = new ArrayList<Integer>();
    //danh sách.add(1);
    list.add(2);  // only convert second page of PDF
	    
    // gọi API để chuyển đổi PDF sang HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // in thông báo thành công
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
Trình chuyển đổi PDF sang HTML

Hình ảnh1:- Xem trước chuyển đổi PDF sang HTML

Có thể tải xuống tệp PDF mẫu được sử dụng trong ví dụ trên từ PdfWithScreenAnnotations.pdf

Chuyển đổi PDF sang HTML bằng lệnh cURL

Các lệnh cURL cũng là một trong những cách thuận tiện để truy cập API REST thông qua thiết bị đầu cuối dòng lệnh. Bây giờ, điều kiện tiên quyết cho phương pháp này là tạo mã thông báo truy cập JWT (dựa trên thông tin đăng nhập của khách hàng) trong khi thực hiện lệnh sau.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Khi chúng tôi có mã thông báo JWT, chúng tôi cần thực hiện lệnh sau để chuyển đổi PDF sang HTML. HTML kết quả được lưu dưới dạng lưu trữ Zip trên bộ lưu trữ Đám mây.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Phần kết luận

Chúng tôi đã tìm hiểu các bước để phát triển trình chuyển đổi PDF sang HTML bằng Java Cloud SDK. Vì vậy, chúng ta có thể sử dụng đoạn mã Jave để chuyển đổi PDF sang HTML hoặc chúng ta có thể sử dụng các lệnh cULR để chuyển đổi PDF sang HTML5. Trong trường hợp bạn muốn thực hiện bất kỳ thay đổi nào đối với mã nguồn của Java Cloud SDK, bạn có thể tải xuống toàn bộ mã nguồn từ GitHub. Bạn có thể cân nhắc việc liên hệ với chúng tôi để được giải quyết vấn đề nhanh chóng thông qua diễn đàn hỗ trợ sản phẩm miễn phí.

Những bài viết liên quan

Chúng tôi thực sự khuyên bạn nên truy cập các liên kết sau để tìm hiểu thêm về: