
PDF biểu mẫu là một trong những loại tệp nổi tiếng mà bạn có thể nhập thông tin, chọn mục từ hộp thả xuống và cũng kiểm tra các trường khi cần. PDF hiện hỗ trợ hai phương pháp khác nhau để tích hợp dữ liệu và biểu mẫu PDF, tức là AcroForms (còn được gọi là biểu mẫu Acrobat) và biểu mẫu XML Forms Architecture (XFA).Để điền vào biểu mẫu, bạn có thể hoàn thành biểu mẫu trực tuyến hoặc lưu một bản sao của biểu mẫu trên máy tính của mình và sử dụng Adobe Acrobat Reader để điền vào biểu mẫu. Sau khi biểu mẫu đã được điền, bạn sẽ quan tâm đến việc sử dụng dữ liệu đã điền bên trong tài liệu và vì mục đích này, bạn có thể cần xuất biểu mẫu sang các định dạng XML, FDF và XFDF. Trong bài viết này, chúng ta sẽ thảo luận về chi tiết về cách chúng ta có thể lập trình xuất PDF sang XML bằng Python cũng như các định dạng được hỗ trợ khác.
- API xử lý PDF
- Xuất PDF sang XML bằng Python
- Xuất PDF sang FDF bằng Python
- Xuất PDF sang XFDF bằng Python
- PDF sang XML sử dụng lệnh cURL
API xử lý PDF
Aspose.PDF Cloud là một REST API từng đoạt giải thưởng cung cấp khả năng tạo, chỉnh sửa và chuyển đổi nhiều định dạng tệp khác nhau sang định dạng PDF. Đồng thời, nó cũng hỗ trợ tính năng xuất tệp PDF sang XLSX, PPTX, DOCX, EPUB, HTML, v.v. và nhiều định dạng hỗ trợ khác.
Nó cũng cho phép bạn làm việc với các biểu mẫu PDF, nơi bạn có thể:
Vì API dựa trên REST nên có thể truy cập trên mọi nền tảng và trong mọi ứng dụng, tức là Máy tính để bàn, Di động, Web, Kết hợp, v.v. Hiện nay, để tạo điều kiện thuận lợi hơn cho người dùng, chúng tôi đã tạo ra SDK dành riêng cho ngôn ngữ lập trình để bạn có được mọi khả năng xử lý PDF trong ngôn ngữ bạn chọn.
Bây giờ để triển khai khả năng xử lý PDF trong ứng dụng Python, chúng tôi đã tạo Aspose.PDF Cloud SDK cho Python là một trình bao bọc xung quanh Aspose.PDF Cloud. Do đó, khi sử dụng SDK này, bạn sẽ có được tất cả các khả năng xử lý PDF trong ứng dụng Python của mình. Bây giờ để bắt đầu với SDK này, bước đầu tiên là cài đặt nó. SDK có sẵn để tải xuống miễn phí qua kho lưu trữ PIP và GitHub. Chỉ cần thực hiện lệnh sau trên thiết bị đầu cuối/dấu nhắc lệnh để cài đặt phiên bản SDK mới nhất trên hệ thống.
pip install asposepdfcloud
Tài khoản Cloud Dashboard miễn phí
Bước quan trọng tiếp theo là đăng ký miễn phí dịch vụ đám mây của chúng tôi thông qua bảng điều khiển Aspose.Cloud. Mục đích của đăng ký này là chỉ cho phép những người được ủy quyền truy cập vào dịch vụ xử lý tệp của chúng tôi. Nếu bạn có tài khoản GitHub hoặc Google, chỉ cần Đăng ký hoặc nhấp vào nút Tạo tài khoản mới và cung cấp thông tin bắt buộc. Bây giờ hãy đăng nhập vào bảng điều khiển bằng thông tin xác thực và mở rộng phần Ứng dụng từ bảng điều khiển và cuộn xuống phần Thông tin xác thực của khách hàng để xem thông tin chi tiết về ID khách hàng và Bí mật khách hàng.

Hình ảnh 1: - Thông tin xác thực của khách hàng trên Bảng điều khiển Aspose.Cloud.
Xuất PDF sang XML bằng Python
Vui lòng làm theo hướng dẫn được chỉ định bên dưới để xuất PDF sang XML bằng Python. Chúng tôi đã cung cấp hai API để thực hiện yêu cầu này
| API | Loại | URL | Mô tả |
| ——————- | —– | —– | ———— |
| /pdf/{name}/export/xml | GET | GetExportFieldsFromPdfToXmlInStorage | Xuất các trường từ PDF trong bộ lưu trữ sang tệp XML. |
| /pdf/{name}/export/xml | PUT | PutExportFieldsFromPdfToXmlInStorage | Xuất các trường từ PDF trong bộ nhớ sang tệp XML trong bộ nhớ. |
- Đầu tiên, tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
- Thứ hai, tạo một thể hiện của lớp PdfApi lấy đối tượng ApiClient làm đối số đầu vào.
- Bây giờ hãy gọi phương thức putexportfieldsfrompdftoxmlinstorage(..) để xuất dữ liệu biểu mẫu PDF sang XML và lưu tệp kết quả vào bộ nhớ đám mây.
def exportPDFtoXML():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
# tệp PDF nguồn
input_file = 'FormData-Filled.pdf'
# tên XML kết quả
outputXML = 'exportedData.xml'
# Xuất dữ liệu biểu mẫu PDF sang XML và lưu đầu ra trong bộ nhớ đám mây
response = pdf_api.put_export_fields_from_pdf_to_xml_in_storage(name = input_file, xml_output_file_path=outputXML)
# in phản hồi trên bảng điều khiển
print(response)
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('PDF Form data successfully exported to XML !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)

Hình ảnh 2:- Dữ liệu PDF được xuất dưới dạng XML.
Xuất PDF sang FDF bằng Python
Vui lòng làm theo hướng dẫn bên dưới để xuất dữ liệu biểu mẫu PDF sang định dạng FDF và lưu đầu ra vào bộ nhớ đám mây.
- Tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
- Bây giờ hãy tạo một thể hiện của lớp PdfApi sử dụng đối tượng ApiClient làm đối số đầu vào.
- Cuối cùng, gọi phương thức putexportfieldsfrompdftofdfinstorage(..) để xuất dữ liệu biểu mẫu PDF sang FDF và lưu tệp kết quả vào bộ nhớ đám mây.
def exportPDFtoFDF():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
# tệp PDF nguồn
input_file = 'FormData-Filled.pdf'
# tên FDF kết quả
outputFDF = 'exportedData.fdf'
# Xuất dữ liệu biểu mẫu PDF sang FDF và lưu đầu ra trong bộ nhớ đám mây
response = pdf_api.put_export_fields_from_pdf_to_fdf_in_storage(name = input_file, fdf_output_file_path=outputFDF)
# in phản hồi trên bảng điều khiển
print(response)
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('PDF Form data successfully exported to FDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Vui lòng truy cập các liên kết sau để tải xuống nguồn FormData-Filled.pdf và xuất exportedData.fdf.
Xuất PDF sang XFDF bằng Python
Tệp XFDF là tệp Tài liệu Acrobat Forms lưu trữ thông tin có thể sử dụng được bởi tệp PDF, do đó tệp XFDF chèn dữ liệu đó trực tiếp vào PDF. Do đó, chúng ta có thể có yêu cầu xuất dữ liệu từ một biểu mẫu PDF và điền vào các biểu mẫu PDF khác. Vì vậy, trong phần này, chúng ta sẽ thảo luận về các bước về cách xuất dữ liệu biểu mẫu PDF sang định dạng XFDF.
- Tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
- Bây giờ hãy tạo một thể hiện của lớp PdfApi sử dụng đối tượng ApiClient làm đối số đầu vào.
- Cuối cùng, gọi phương thức putexportfieldsfrompdftoxfdfinstorage(..) để xuất dữ liệu biểu mẫu PDF sang XFDF và lưu tệp kết quả vào bộ nhớ đám mây.
def exportPDFtoXFDF():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
# tệp PDF nguồn
input_file = 'FormData-Filled.pdf'
# tên XFDF kết quả
outputXFDF = 'exportedData.xfdf'
# Xuất dữ liệu biểu mẫu PDF sang XFDF và lưu đầu ra trong bộ nhớ đám mây
response = pdf_api.put_export_fields_from_pdf_to_xfdf_in_storage(name = input_file, xml_output_file_path=outputXFDF)
# in phản hồi trên bảng điều khiển
print(response)
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('PDF Form data successfully exported to XFDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
Mẫu đầu ra được tạo ra trong đoạn mã trên có thể được tải xuống từ exportedData.xfdf.

Hình ảnh 3:- Dữ liệu PDF được xuất sang XFDF
PDF sang XML sử dụng lệnh cURL
REST API cũng có thể được truy cập thông qua lệnh cURL và có thể được truy cập bằng ứng dụng đầu cuối trên bất kỳ nền tảng nào. Vì Aspose.PDF Cloud được phát triển theo kiến trúc REST, nên nó cũng có thể được truy cập thông qua lệnh cURL. Tuy nhiên, trước khi thực hiện bất kỳ thao tác nào, chúng ta cần tạo JSON Web Token (JWT) dựa trên thông tin xác thực của từng khách hàng được chỉ định trên bảng điều khiển Aspose.Cloud. Điều này là bắt buộc vì API của chúng tôi chỉ có thể truy cập được đối với người dùng đã đăng ký. Vui lòng thực hiện lệnh sau để tạo mã thông báo JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Sau khi mã thông báo JWT được tạo, vui lòng thực hiện lệnh sau để xuất dữ liệu biểu mẫu PDF sang định dạng XML.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/FormData-Filled.pdf/export/xml?xmlOutputFilePath=FormDataExported.xml" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
Phần kết luận
Trong bài viết này, chúng tôi đã khám phá các chi tiết và các bước về cách xuất dữ liệu biểu mẫu PDF sang các định dạng XML, FDF và XFDF. Những yêu cầu này có thể được thực hiện bằng cách sử dụng các đoạn mã Python cũng như sử dụng các lệnh cURL. Chúng tôi cũng khuyên bạn nên khám phá Hướng dẫn dành cho nhà phát triển để tìm hiểu về các tính năng thú vị khác do API cung cấp. Hơn nữa, mã nguồn đầy đủ của Aspose.PDF Cloud SDK dành cho Python đã có sẵn để tải xuống qua GitHub. Trong trường hợp bạn gặp bất kỳ sự cố nào khi sử dụng API hoặc có bất kỳ thắc mắc nào khác, vui lòng liên hệ với chúng tôi qua Diễn đàn hỗ trợ sản phẩm miễn phí.
Bài viết liên quan
Chúng tôi cũng khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: