Phát triển trình chuyển đổi PDF sang Excel bằng Python Cloud SDK.

Chuyển đổi PDF sang Excel

Cách chuyển đổi PDF sang Excel | Xuất PDF sang Excel bằng Python SDK

Các tệp PDF rất tuyệt vời để bảo toàn định dạng tài liệu nhưng việc trích xuất và sử dụng dữ liệu từ chúng có thể phức tạp. Đây là lúc nhu cầu chuyển đổi PDF sang Excel trở nên rõ ràng. Sổ làm việc Excel, với định dạng bảng tính, cung cấp một cách có cấu trúc để sắp xếp và xử lý dữ liệu. Hãy tưởng tượng việc trích xuất các bảng, số liệu và văn bản một cách liền mạch từ PDF và sắp xếp chúng gọn gàng trong các ô Excel, sẵn sàng để phân tích. Việc chuyển đổi này không chỉ đơn giản hóa việc xử lý dữ liệu mà còn nâng cao hiệu quả và năng suất.

Hơn nữa, excel chủ yếu được sử dụng để lưu trữ và sắp xếp dữ liệu như doanh thu, bảng lương và thông tin kế toán. Chúng cho phép người dùng thực hiện các phép tính với dữ liệu này và tạo biểu đồ và đồ thị. Bây giờ trong bài viết này, chúng ta sẽ thảo luận chi tiết về cách chuyển đổi PDF sang định dạng Excel.

Python Cloud SDK để xử lý PDF

Aspose.PDF Cloud SDK for Python nổi lên như một công cụ mạnh mẽ để hợp lý hóa quy trình chuyển đổi PDF sang XLS. Nó không chỉ tạo điều kiện thuận lợi cho việc chuyển đổi ‘pdf sang excel’ liền mạch mà còn cung cấp vô số khả năng khác. Hãy tưởng tượng việc khai thác khả năng thao tác PDF, trích xuất dữ liệu cụ thể và tạo các tệp sẵn sàng cho Excel một cách dễ dàng.

Bước đầu tiên là cài đặt Python Cloud SDK có thể tải xuống qua kho lưu trữ PIPGitHub. Vì vậy, vui lòng thực hiện lệnh sau trên terminal/dấu nhắc lệnh để cài đặt phiên bản mới nhất của Cloud SDK.

pip install asposepdfcloud

MS Visual Studio

Trong trường hợp bạn cần trực tiếp thêm tham chiếu vào dự án Python của mình trong Visual Studio IDE, vui lòng tìm kiếm asposepdfcloud dưới dạng gói trong cửa sổ môi trường Python. Vui lòng làm theo các bước được đánh số trong hình ảnh bên dưới để hoàn tất quá trình cài đặt.

Lưu PDF vào Excel

Hình ảnh 1:- Gói Aspose.PDF Cloud SDK cho Python.

PyCharm

PyCharm là một IDE phổ biến để phát triển Python. Trong phần này, chúng ta sẽ thảo luận về cài đặt PyCharm trên nền tảng Windows.

  • Nhấp vào menu File và chọn mục menu Settings…
Cài đặt PyCharm

Hình ảnh 2:- Mục menu Cài đặt PyCharm.

  • Mở rộng cây Dự án từ bên trái và chọn tùy chọn Python Interpreter.
  • Nhấp vào dấu + (dấu cộng) ở phần bên phải và nhập asposepdfcloud vào trường tìm kiếm trên hộp thoại các gói có sẵn.
  • Bây giờ hãy nhấp vào nút Cài đặt gói.
Chuyển đổi PDF sang Excel SDK

Hình ảnh 3: - Gói Aspose.PDF Cloud cho Python.

Sau khi cài đặt SDK, thông báo thành công sẽ hiển thị.

SDK PDF sang Excel

Hình ảnh 4: - Thông báo thành công khi Aspose.PDF Cloud for Python đã được cài đặt.

  • Trong trường hợp bạn không có tài khoản hiện tại trên cloud dashboard, bạn có thể tạo một tài khoản miễn phí bằng thông tin đăng nhập GitHub hoặc Google. Bây giờ hãy đăng nhập vào bảng điều khiển và lấy thông tin đăng nhập khách hàng được cá nhân hóa của bạn.
Chứng chỉ khách hàng

Hình ảnh 5: - Thông tin đăng nhập của khách hàng trên bảng điều khiển Aspose.Cloud.

Chuyển đổi PDF sang Excel trong Python

Vui lòng làm theo hướng dẫn bên dưới để chuyển đổi PDF sang sổ làm việc Excel (XLSX) bằng đoạn mã Python. Xin lưu ý rằng đoạn mã sau đây yêu cầu PDF đầu vào có sẵn trong bộ nhớ đám mây.

  • Đầu tiên, tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
  • Thứ hai, tạo một thể hiện của lớp PdfApi lấy đối tượng ApiClient làm đối số.
  • Bây giờ hãy chỉ định tên tệp PDF đầu vào và tên tệp XLSX kết quả.
  • Cuối cùng, gọi phương thức putpdfinstoragetoxlsx(..) để lấy tệp PDF đầu vào, tên tệp XLSX kết quả và một tham số tùy chọn để tạo các bảng tính thống nhất.
# Để biết thêm các mẫu mã, vui lòng truy cập https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Để biết thông tin xác thực của Khách hàng, vui lòng truy cập https://dashboard.aspose.cloud/

def pdf2xlsx():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'awesomeTable.pdf'

        # tên của bảng tính excel kết quả
        resultant_file_name = 'Resultant.xlsx'
    
        # Gọi API để chuyển đổi định dạng PDF sang Excel
        response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')

        # in tin nhắn trong bảng điều khiển (tùy chọn)
        print('PDF successfully converted to Excel format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
Xem trước PDF sang XLSX

Hình ảnh 6:- Xem trước quá trình chuyển đổi PDF sang Excel.

Các tệp mẫu được sử dụng trong ví dụ trên có thể được tải xuống từ awesomeTable.pdfResultant.xlsx.

Chuyển đổi PDF sang XLS bằng lệnh cURL

Việc chuyển đổi PDF sang XLS có thể dễ dàng thực hiện bằng Aspose.PDF Cloud cùng với các lệnh cURL, vì nó đại diện cho một phương pháp tiếp cận hợp lý và tự động. Bằng cách sử dụng các lệnh cURL kết hợp với Aspose.PDF Cloud, chúng tôi không chỉ đơn giản hóa quá trình chuyển đổi mà còn cho phép tích hợp liền mạch vào nhiều quy trình công việc khác nhau.

Đầu tiên trong cách tiếp cận này là tạo JSON Web Token (JWT) dựa trên thông tin xác thực của khách hàng. Vì vậy, hãy thực hiện lệnh sau để tạo JWT token.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Sau khi có mã thông báo JWT, vui lòng thực hiện lệnh sau để chuyển đổi định dạng PDF sang XLS.

curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Phần kết luận

Tóm lại, dù lựa chọn Aspose.PDF Cloud SDK mạnh mẽ cho Python hay sử dụng lệnh cURL song song với Aspose.PDF Cloud, chúng ta có thể dễ dàng hoàn thành mục tiêu chuyển đổi PDF sang định dạng Excel. Aspose.PDF Cloud SDK cho Python cung cấp giải pháp toàn diện và thân thiện với nhà phát triển, trao quyền cho bạn với một loạt các chức năng ngoài việc chuyển đổi. Mặt khác, tận dụng lệnh cURL cung cấp một phương pháp tiếp cận linh hoạt và có thể lập trình được. Bất kể phương pháp nào được chọn, cả hai phương pháp đều là những công cụ mạnh mẽ, cách mạng hóa cách chúng ta cấu trúc và trích xuất dữ liệu từ PDF.

Bài viết liên quan

Chúng tôi khuyên bạn nên truy cập các bài viết sau để tìm hiểu về: