
Tìm hiểu cách chuyển đổi PDF sang HTML bằng Python
Trong thế giới kỹ thuật số phát triển nhanh như hiện nay, khả năng truy cập tài liệu là một cân nhắc quan trọng đối với cả doanh nghiệp và cá nhân. Nhu cầu chuyển đổi tài liệu PDF sang HTML chưa bao giờ rõ ràng hơn thế. Mặc dù các tệp PDF rất tuyệt vời để bảo toàn định dạng tài liệu, nhưng có thể trở nên cồng kềnh khi làm việc với chúng trên web. Chúng thường thiếu khả năng tương tác và khả năng thích ứng cần thiết cho các trải nghiệm trực tuyến hiện đại. Đó là lúc Python REST API xuất hiện để thu hẹp khoảng cách. Bài viết này khám phá nhu cầu ngày càng tăng đối với việc chuyển đổi PDF sang HTML và cách Python REST API có thể cách mạng hóa quy trình này.
- Python REST API để chuyển đổi PDF sang HTML
- Chuyển đổi PDF sang HTML trong Python
- PDF sang HTML sử dụng lệnh cURL
Python REST API để chuyển đổi PDF sang HTML
Chuyển đổi tài liệu PDF sang định dạng HTML là một nhiệm vụ được thực hiện đơn giản và hiệu quả với Aspose.PDF Cloud SDK for Python. SDK mạnh mẽ này cung cấp một loạt các khả năng để giải quyết các thách thức của việc chuyển đổi PDF sang HTML một cách liền mạch. Cho dù bạn cần trình bày tài liệu của mình trên web, chia sẻ nội dung trên nhiều nền tảng khác nhau hay tăng cường khả năng truy cập tài liệu, Aspose.PDF Cloud đều có thể đáp ứng nhu cầu của bạn.
Python Cloud SDK có đầy đủ khả năng tạo, chỉnh sửa hoặc chuyển đổi các tệp PDF sang nhiều định dạng khác nhau bao gồm EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.
SDK có sẵn để tải xuống qua kho lưu trữ PIP và GitHub. Bây giờ, vui lòng thực hiện lệnh sau trên terminal/dấu nhắc lệnh để cài đặt phiên bản SDK mới nhất trên hệ thống.
pip install asposepdfcloud
Trong trường hợp bạn cần trực tiếp thêm tham chiếu vào dự án Python của mình trong Visual Studio IDE, vui lòng tìm kiếm asposepdfcloud dưới dạng gói trong cửa sổ môi trường Python. Vui lòng làm theo các bước được đánh số trong hình ảnh bên dưới để hoàn tất quá trình cài đặt.

Hình ảnh 1:- API chuyển đổi PDF sang HTML.
Chuyển đổi PDF sang HTML trong Python
Vui lòng làm theo hướng dẫn dưới đây để chuyển đổi định dạng PDF sang HTML.
- Đầu tiên, tạo một thể hiện của lớp ApiClient trong khi truyền thông tin bí mật ClinetID và Client làm đối số.
- Thứ hai, tạo một đối tượng PdfApi trong đó chúng ta truyền đối tượng ApiClient làm đối số.
- Thứ ba, chỉ định tên của tệp PDF đầu vào và kết quả đầu ra.
- Cuối cùng, gọi phương thức putpdfinstoragetohtml(…) của lớp PdfApi để bắt đầu chuyển đổi. Đầu ra được lưu trữ trong bộ nhớ đám mây.
# để xem mẫu mã đầy đủ, vui lòng truy cập https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi
def pdf2html():
try:
#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
# Nguồn tài liệu PDF
input_file_name = 'completeWorkbook.pdf'
# tên của tập tin kết quả
resultant_file_name = 'CodeConversion.zip'
# Gọi API để thực hiện chuyển đổi
# chúng tôi đã thiết lập định dạng đầu ra là zip và loại tài liệu là xhtml
response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('PDF successfully converted to HTML format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
PDF sang HTML sử dụng lệnh cURL
Ngoài ra, việc chuyển đổi PDF sang HTML cũng có thể được sắp xếp hợp lý bằng cách sử dụng lệnh cURL kết hợp với Aspose.PDF Cloud. Phương pháp này cung cấp một cách thuận tiện để khai thác các khả năng của Aspose.PDF Cloud cho nhu cầu chuyển đổi PDF sang HTML của bạn. Phương pháp này phù hợp nhất với yêu cầu của bạn, khi bạn đang tìm kiếm phương pháp tiếp cận độc lập với nền tảng và ngôn ngữ, để triển khai quy trình chuyển đổi PDF sang HTML liền mạch.
Đầu tiên chúng ta cần tạo mã thông báo truy cập JWT dựa trên thông tin xác thực của khách hàng. Vui lòng thực hiện lệnh sau để tạo mã thông báo JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Khi đã có mã thông báo JWT, chúng ta có thể thực hiện lệnh sau để chuyển đổi tệp PDF có trong bộ nhớ đám mây sang định dạng HTML và kết quả là đầu ra được trả về dưới dạng phản hồi luồng.
curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H "accept: multipart/form-data" \
-H "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip
Trong trường hợp bạn cần chuyển đổi tệp PDF sang HTML và muốn lưu đầu ra trên bộ nhớ đám mây, vui lòng thử sử dụng lệnh sau.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

Hình ảnh 2:- Xem trước chuyển đổi PDF sang HTML.
Phần kết luận
Tóm lại, hành trình từ PDF sang HTML chưa bao giờ dễ dàng hơn thế. Chúng tôi đã khám phá sức mạnh chuyển đổi của Python REST API và hiệu quả của Aspose.PDF Cloud với các lệnh cURL trong việc chuyển đổi tài liệu PDF của bạn thành HTML động, sẵn sàng cho web. Các phương pháp này không chỉ đảm bảo tính toàn vẹn của tài liệu mà còn tăng cường khả năng truy cập và chia sẻ. Vì vậy, đã đến lúc làm cho nội dung của bạn có thể tiếp cận được với nhiều đối tượng hơn và nâng cao sự hiện diện trực tuyến của bạn.
Trong trường hợp bạn gặp bất kỳ vấn đề nào khi sử dụng API hoặc có bất kỳ thắc mắc nào khác, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ sản phẩm miễn phí.
Bài viết liên quan
Chúng tôi thực sự khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: