Phát triển trình chuyển đổi PDF sang Excel bằng Python Cloud SDK.

Cách chuyển đổi PDF sang Excel | Xuất PDF sang Excel bằng Python SDK
Các tệp PDF rất tuyệt vời để bảo toàn định dạng tài liệu nhưng việc trích xuất và sử dụng dữ liệu từ chúng có thể phức tạp. Đây là lúc nhu cầu chuyển đổi PDF sang Excel trở nên rõ ràng. Sổ làm việc Excel, với định dạng bảng tính, cung cấp một cách có cấu trúc để sắp xếp và xử lý dữ liệu. Hãy tưởng tượng việc trích xuất các bảng, số liệu và văn bản một cách liền mạch từ PDF và sắp xếp chúng gọn gàng trong các ô Excel, sẵn sàng để phân tích. Việc chuyển đổi này không chỉ đơn giản hóa việc xử lý dữ liệu mà còn nâng cao hiệu quả và năng suất.
Hơn nữa, excel chủ yếu được sử dụng để lưu trữ và sắp xếp dữ liệu như doanh thu, bảng lương và thông tin kế toán. Chúng cho phép người dùng thực hiện các phép tính với dữ liệu này và tạo biểu đồ và đồ thị. Bây giờ trong bài viết này, chúng ta sẽ thảo luận chi tiết về cách chuyển đổi PDF sang định dạng Excel.
- Python Cloud SDK để xử lý PDF
- Chuyển đổi PDF sang Excel trong Python
- Chuyển đổi PDF sang XLS bằng lệnh cURL
Python Cloud SDK để xử lý PDF
Aspose.PDF Cloud SDK for Python nổi lên như một công cụ mạnh mẽ để hợp lý hóa quy trình chuyển đổi PDF sang XLS. Nó không chỉ tạo điều kiện thuận lợi cho việc chuyển đổi ‘pdf sang excel’ liền mạch mà còn cung cấp vô số khả năng khác. Hãy tưởng tượng việc khai thác khả năng thao tác PDF, trích xuất dữ liệu cụ thể và tạo các tệp sẵn sàng cho Excel một cách dễ dàng.
Bước đầu tiên là cài đặt Python Cloud SDK có thể tải xuống qua kho lưu trữ PIP và GitHub. Vì vậy, vui lòng thực hiện lệnh sau trên terminal/dấu nhắc lệnh để cài đặt phiên bản mới nhất của Cloud SDK.
pip install asposepdfcloud
MS Visual Studio
Trong trường hợp bạn cần trực tiếp thêm tham chiếu vào dự án Python của mình trong Visual Studio IDE, vui lòng tìm kiếm asposepdfcloud dưới dạng gói trong cửa sổ môi trường Python. Vui lòng làm theo các bước được đánh số trong hình ảnh bên dưới để hoàn tất quá trình cài đặt.

Hình ảnh 1:- Gói Aspose.PDF Cloud SDK cho Python.
PyCharm
PyCharm là một IDE phổ biến để phát triển Python. Trong phần này, chúng ta sẽ thảo luận về cài đặt PyCharm trên nền tảng Windows.
- Nhấp vào menu File và chọn mục menu Settings…

Hình ảnh 2:- Mục menu Cài đặt PyCharm.
- Mở rộng cây Dự án từ bên trái và chọn tùy chọn Python Interpreter.
- Nhấp vào dấu + (dấu cộng) ở phần bên phải và nhập asposepdfcloud vào trường tìm kiếm trên hộp thoại các gói có sẵn.
- Bây giờ hãy nhấp vào nút Cài đặt gói.

Hình ảnh 3: - Gói Aspose.PDF Cloud cho Python.
Sau khi cài đặt SDK, thông báo thành công sẽ hiển thị.

Hình ảnh 4: - Thông báo thành công khi Aspose.PDF Cloud for Python đã được cài đặt.
- Trong trường hợp bạn không có tài khoản hiện tại trên cloud dashboard, bạn có thể tạo một tài khoản miễn phí bằng thông tin đăng nhập GitHub hoặc Google. Bây giờ hãy đăng nhập vào bảng điều khiển và lấy thông tin đăng nhập khách hàng được cá nhân hóa của bạn.

Hình ảnh 5: - Thông tin đăng nhập của khách hàng trên bảng điều khiển Aspose.Cloud.
Chuyển đổi PDF sang Excel trong Python
Vui lòng làm theo hướng dẫn bên dưới để chuyển đổi PDF sang sổ làm việc Excel (XLSX) bằng đoạn mã Python. Xin lưu ý rằng đoạn mã sau đây yêu cầu PDF đầu vào có sẵn trong bộ nhớ đám mây.
- Đầu tiên, tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
- Thứ hai, tạo một thể hiện của lớp PdfApi lấy đối tượng ApiClient làm đối số.
- Bây giờ hãy chỉ định tên tệp PDF đầu vào và tên tệp XLSX kết quả.
- Cuối cùng, gọi phương thức putpdfinstoragetoxlsx(..) để lấy tệp PDF đầu vào, tên tệp XLSX kết quả và một tham số tùy chọn để tạo các bảng tính thống nhất.
# Để biết thêm các mẫu mã, vui lòng truy cập https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Để biết thông tin xác thực của Khách hàng, vui lòng truy cập https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# tên của bảng tính excel kết quả
resultant_file_name = 'Resultant.xlsx'
# Gọi API để chuyển đổi định dạng PDF sang Excel
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

Hình ảnh 6:- Xem trước quá trình chuyển đổi PDF sang Excel.
Các tệp mẫu được sử dụng trong ví dụ trên có thể được tải xuống từ awesomeTable.pdf và Resultant.xlsx.
Chuyển đổi PDF sang XLS bằng lệnh cURL
Việc chuyển đổi PDF sang XLS có thể dễ dàng thực hiện bằng Aspose.PDF Cloud cùng với các lệnh cURL, vì nó đại diện cho một phương pháp tiếp cận hợp lý và tự động. Bằng cách sử dụng các lệnh cURL kết hợp với Aspose.PDF Cloud, chúng tôi không chỉ đơn giản hóa quá trình chuyển đổi mà còn cho phép tích hợp liền mạch vào nhiều quy trình công việc khác nhau.
Đầu tiên trong cách tiếp cận này là tạo JSON Web Token (JWT) dựa trên thông tin xác thực của khách hàng. Vì vậy, hãy thực hiện lệnh sau để tạo JWT token.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Sau khi có mã thông báo JWT, vui lòng thực hiện lệnh sau để chuyển đổi định dạng PDF sang XLS.
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Phần kết luận
Tóm lại, dù lựa chọn Aspose.PDF Cloud SDK mạnh mẽ cho Python hay sử dụng lệnh cURL song song với Aspose.PDF Cloud, chúng ta có thể dễ dàng hoàn thành mục tiêu chuyển đổi PDF sang định dạng Excel. Aspose.PDF Cloud SDK cho Python cung cấp giải pháp toàn diện và thân thiện với nhà phát triển, trao quyền cho bạn với một loạt các chức năng ngoài việc chuyển đổi. Mặt khác, tận dụng lệnh cURL cung cấp một phương pháp tiếp cận linh hoạt và có thể lập trình được. Bất kể phương pháp nào được chọn, cả hai phương pháp đều là những công cụ mạnh mẽ, cách mạng hóa cách chúng ta cấu trúc và trích xuất dữ liệu từ PDF.
- Trong trường hợp bạn gặp bất kỳ vấn đề nào khi sử dụng Python Cloud SDK, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ khách hàng miễn phí.
Bài viết liên quan
Chúng tôi khuyên bạn nên truy cập các bài viết sau để tìm hiểu về: