
Chuyển đổi PDF sang Word | API chuyển đổi PDF sang DOC
PDF là một trong những định dạng tệp được sử dụng rộng rãi để chia sẻ thông tin. Định dạng này phổ biến vì nó giữ nguyên độ trung thực của tài liệu trên mọi nền tảng và mọi thiết bị (máy tính để bàn, thiết bị di động, v.v.).Tuy nhiên, nếu chúng ta cần thực hiện bất kỳ thay đổi nào đối với tệp PDF, chúng ta cần sử dụng các ứng dụng cụ thể để mở và chỉnh sửa tài liệu PDF. Nhưng đối với số lượng lớn các bản cập nhật, việc chuyển đổi tệp PDF sang tài liệu Word là một giải pháp khả thi. Ngoài ra, đối với việc chuyển đổi hàng loạt, SDK lập trình là một giải pháp hiệu quả. Trong bài viết này, chúng ta sẽ thảo luận chi tiết về cách chuyển đổi PDF sang Word bằng Python SDK.
API xử lý văn bản
Aspose.Words Cloud là API dựa trên REST từng đoạt giải thưởng của chúng tôi cung cấp khả năng tạo, chỉnh sửa và chuyển đổi các tệp Word HTML, JPEG, PNG và các định dạng tệp được hỗ trợ khác. Đồng thời, nó cũng hỗ trợ khả năng tải các tài liệu PDF và hiển thị chúng thành MS Word (DOCX, DOC, DOT, RTF, DOCM) hoặc OpenDocument (ODT, OTT).Để thực hiện chuyển đổi này, không cần tải xuống hoặc cài đặt phần mềm của bên thứ ba và thực hiện tất cả các chuyển đổi bằng công cụ xử lý tài liệu của chúng tôi trong Cloud. Bây giờ, để triển khai hoạt động chuyển đổi tài liệu trong ứng dụng Python, bạn cần thử sử dụng Aspose.Words Cloud SDK cho Python, đây là một trình bao bọc xung quanh Cloud API.
Cài đặt
SDK có sẵn để tải xuống tại PIP và GitHub. Thực hiện lệnh sau trên thiết bị đầu cuối dòng lệnh để cài đặt SDK
pip install aspose-words-cloud
IDE PyCharm
Nếu bạn đang sử dụng PyCharm IDE, bạn có thể trực tiếp thêm SDK dưới dạng phần phụ thuộc vào dự án của mình.
Tệp ->Cài đặt ->Dự án ->Trình thông dịch Python ->asposewordscloud

Hình ảnh 1:- Tùy chọn cài đặt PyCharm.

Hình ảnh 2:- Gói Python Aspose.Words.
Chuyển đổi PDF sang Word bằng Python
Vui lòng làm theo hướng dẫn bên dưới để thực hiện chuyển đổi tệp PDF sang định dạng Word.
- Đầu tiên chúng ta cần tạo đối tượng ApiClient trong khi truyền thông tin chi tiết ClientID và ClientSecret làm đối số.
- Thứ hai, tạo một thể hiện của WordsApi trong khi truyền thể hiện ApiClient làm đối số.
- Thứ ba, tải tệp PDF lên bộ nhớ đám mây bằng phương thức UploadFileRequest(..).
- Bây giờ hãy tạo một đối tượng SaveOptionsData trong đó chúng ta định nghĩa docx là định dạng xuất.
- Bước tiếp theo là tạo một phiên bản của SaveAsRequest lấy tên tệp PDF và đối tượng SaveOptionsData làm đối số.
- Cuối cùng, gọi saveas(..) của lớp WordsApi để thực hiện thao tác chuyển đổi.
# Để biết thêm các mẫu, vui lòng truy cập https://github.com/aspose-words-cloud/aspose-words-cloud-python
# Khởi tạo đối tượng Python Aspose.Words
words_api = WordsApi("6185429e-17ce-468d-bb81-a51ac9d96c16","73a07e2fb010f559e482d854fe5a8f49")
# Nhập tài liệu PDF
inputFileName = 'awesome_table_in_pdf.pdf'
# Tên của tài liệu Word kết quả
resultantFile = 'Converted.docx'
# Tải tài liệu PDF lên Cloud Storage
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open(inputFileName, 'rb'), "", None))
# Tùy chọn xuất tài liệu
request_save_options_data = asposewordscloud.SaveOptionsData(save_format='docx', file_name=resultantFile)
# Tạo yêu cầu SaveAs của Tài liệu trong khi truyền tên PDF đầu vào và các tùy chọn xuất từ
request = asposewordscloud.models.requests.SaveAsRequest(name=inputFileName,
save_options_data=request_save_options_data,
folder=None)
# bắt đầu hoạt động chuyển đổi
result = words_api.words_api.save_as(request)
# In kết quả trong bảng điều khiển
print("Result {}".format(result))
Các tệp mẫu được sử dụng trong đoạn mã trên có thể được tải xuống từ awesometableinpdf.pdf và Converted.docx.
PDF sang DOC sử dụng lệnh cURL
Giống như các REST API khác, Aspose.Words Cloud cũng có thể được truy cập thông qua lệnh cURL. Nhưng trước khi tiến hành truy cập API, chúng ta cần tạo mã thông báo truy cập JWT dựa trên Thông tin xác thực của khách hàng được chỉ định qua Bảng điều khiển Aspose.Cloud. Vui lòng thực hiện lệnh cURL sau để tạo mã thông báo truy cập JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Bây giờ chúng ta có thể sử dụng lệnh sau để chuyển đổi các tệp PDF có sẵn trong Cloud storage sang định dạng Word. Trong lệnh sau, chúng ta đã sử dụng tham số -o để lưu đầu ra trên ổ đĩa cục bộ.
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o Converted.docx
Vui lòng sử dụng lệnh sau nếu bạn cần lưu trực tiếp tài liệu word đầu ra trong bộ nhớ đám mây. Vui lòng lưu ý tham số yêu cầu outPath trong lệnh sau.
curl -X GET "https://api.aspose.cloud/v4.0/words/awesome_table_in_pdf.pdf?format=docx&outPath=newResultant.docx" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Phần kết luận
Trong bài viết này, chúng tôi đã khám phá những khả năng tuyệt vời của Aspose.Words Cloud về cách chuyển đổi PDF sang Word bằng Python API. Tương tự như vậy, chúng tôi cũng đã khám phá chi tiết về cách chúng tôi có thể xuất PDF sang DOC hoặc các định dạng được hỗ trợ khác bằng lệnh cURL. Hơn nữa, bạn cũng có thể thử truy cập API trong trình duyệt web bằng giao diện Swagger. Hơn nữa, Cloud SDK được phát triển theo giấy phép MIT, vì vậy mã nguồn đầy đủ của nó có sẵn trên kho lưu trữ GitHub.
Trong trường hợp bạn gặp bất kỳ vấn đề nào khi sử dụng API hoặc có bất kỳ thắc mắc liên quan nào, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ sản phẩm miễn phí.
Bài viết liên quan
Chúng tôi khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: