
Không cần tải xuống và cài đặt Adobe Acrobat hoặc phần mềm nào khác và thực hiện toàn bộ quá trình xử lý PDF trên Cloud.
- SDK đám mây thao tác PDF
- Tìm kiếm và thay thế văn bản bằng Python
- Tìm kiếm và thay thế văn bản bằng lệnh cURL
SDK đám mây thao tác PDF
Aspose.PDF Cloud là một SDK mạnh mẽ cung cấp nhiều tính năng để xử lý hiệu quả các tệp PDF và hợp lý hóa các tác vụ xử lý tài liệu của bạn. Một trong những khả năng nổi bật của SDK này là khả năng tìm kiếm và thay thế văn bản trong các tài liệu PDF. Hãy cùng khám phá và khai thác toàn bộ tiềm năng của Aspose.PDF Cloud SDK cho Python để cách mạng hóa quy trình chỉnh sửa PDF của bạn.
Vì vậy, bước đầu tiên trong việc sử dụng API là cài đặt Cloud SDK, có thể tải xuống miễn phí qua kho lưu trữ PIP và GitHub. Chỉ cần thực hiện lệnh sau trên terminal/dấu nhắc lệnh để cài đặt phiên bản SDK mới nhất trên hệ thống.
pip install asposepdfcloud
MS Visual Studio
Khi sử dụng Visual Studio, bạn cũng có thể thêm tham chiếu vào dự án Python của mình trong dự án Visual Studio. Vui lòng tìm kiếm asposepdfcloud dưới dạng gói trong cửa sổ môi trường Python. Vui lòng làm theo các bước được đánh số trong hình ảnh bên dưới để hoàn tất quá trình cài đặt.

Hình ảnh 1:- Gói Aspose.PDF Cloud SDK cho Python.
Chúng tôi cũng cần thông tin xác thực của khách hàng để truy cập vào Cloud API có thể lấy từ bảng điều khiển đám mây. Chỉ cần Đăng ký hoặc nhấp vào nút Tạo tài khoản mới và cung cấp thông tin bắt buộc.

Hình ảnh 2: - Thông tin đăng nhập của khách hàng trên bảng điều khiển Aspose.Cloud.
Tìm kiếm và thay thế văn bản bằng Python
Vui lòng làm theo hướng dẫn bên dưới để tìm kiếm một chuỗi ký tự cụ thể và thay thế tất cả các lần xuất hiện của chuỗi đó trong tài liệu PDF.
- Đầu tiên, tạo một thể hiện của lớp ApiClient trong khi cung cấp Client ID và Client Secret làm đối số.
- Thứ hai, tạo một thể hiện của lớp PdfApi lấy đối tượng ApiClient làm đối số đầu vào.
- Tạo các biến xác định tài liệu PDF đầu vào.
- Bây giờ hãy tạo một đối tượng TextReplaceListRequest để xác định thuộc tính thay thế văn bản.
- Cuối cùng, gọi phương thức postdocumenttextreplace(..) để bắt đầu hoạt động tìm kiếm và thay thế và lưu kết quả vào bộ nhớ đám mây.
def findAndReplaceText():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'URL2PDF.pdf'
# Thuộc tính văn bản thay thế
text_Replace_Request = asposepdfcloud.TextReplaceListRequest
{
"TextReplaces": [
{
"OldValue": "Productivity",
"NewValue": "Increased Productivity",
# "Regex": Đúng,
"TextState": {
"FontSize": 0,
"Font": "Arial",
"ForegroundColor": {
"A": 0,
"R": 252,
"G": 240,
"B": 3
},
"BackgroundColor": {
"A": 0,
"R": 252,
"G": 3,
"B": 248
},
"FontStyle": "Regular"
},
"Rect": {
"LLX": 0,
"LLY": 0,
"URX": 0,
"URY": 0
}
}
],
"DefaultFont": "Arial",
"StartIndex": 0,
"CountReplace": 0
}
# gọi API để thay thế văn bản trong tài liệu PDF
response = pdf_api.post_document_text_replace(name = input_file, text_replace = text_Replace_Request)
print(response)
# in tin nhắn trong bảng điều khiển (tùy chọn)
print('Text successfully Replaced in PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)

Hình ảnh 3:- Xem trước kết quả thay thế văn bản.
Trong đoạn mã trên, vui lòng đặc biệt chú ý hai tham số, tức là StartIndex và CountReplace. StartIndex định nghĩa sự xuất hiện cụ thể của văn bản mà từ đó hoạt động thay thế văn bản sẽ được khởi tạo và CountReplace định nghĩa các sự xuất hiện của văn bản cần được thay thế. Trong hình ảnh bên dưới, hãy lưu ý chỉ có hai sự xuất hiện của chuỗi Product Family được cập nhật bắt đầu từ chỉ mục 2.

Hình ảnh 4:- Hai chuỗi ký tự được thay thế.
Để bạn tham khảo, đầu vào URL2PDF.pdf và kết quả Text-Replace-Output.pdf đã được đính kèm.
Tìm kiếm và thay thế văn bản bằng lệnh cURL
Ngoài việc sử dụng Aspose.PDF Cloud SDK cho Python, bạn cũng có thể tận dụng tính linh hoạt của các lệnh cURL để thực hiện thay thế văn bản trong tài liệu PDF. cURL là một công cụ dòng lệnh cho phép bạn tạo các yêu cầu HTTP và tương tác với các dịch vụ web, khiến nó trở thành một tùy chọn linh hoạt để tích hợp với Aspose.PDF Cloud API. Với các lệnh cURL, bạn có thể dễ dàng gửi các yêu cầu đến các điểm cuối API và sử dụng tính năng “Thay thế văn bản” để tìm kiếm các mẫu văn bản cụ thể và thay thế chúng bằng nội dung mới.
Bây giờ, vui lòng thực hiện lệnh sau để tạo mã thông báo JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Bây giờ chúng ta đã tạo được mã thông báo JWT được cá nhân hóa, chúng ta cần thực hiện lệnh cURL sau để thay thế chuỗi Năng suất trong tài liệu PDF và lưu tài liệu đã cập nhật trong cùng bộ nhớ đám mây.
curl -X POST "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/text/replace" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-H "Content-Type: application/json" \
-d "{ \"TextReplaces\": [ { \"OldValue\": \"Product Family\", \"NewValue\": \"Product Families\", \"Regex\": true, \"TextState\": { \"FontSize\": 0, \"Font\": \"Arial\", \"ForegroundColor\": { \"A\": 0, \"R\": 252, \"G\": 240, \"B\": 3 }, \"BackgroundColor\": { \"A\": 0, \"R\": 252, \"G\": 3, \"B\": 248 }, \"FontStyle\": \"Regular\" }, \"Rect\": { \"LLX\": 0, \"LLY\": 0, \"URX\": 0, \"URY\": 0 } } ], \"DefaultFont\": \"Arial\", \"StartIndex\": 2, \"CountReplace\": 2}"
Phần kết luận
Tóm lại, khả năng tìm kiếm và thay thế văn bản trong tài liệu PDF là một tính năng có giá trị có thể cải thiện đáng kể quy trình xử lý tài liệu của bạn. Với sức mạnh của Aspose.PDF Cloud SDK cho Python và sự tiện lợi của các lệnh cURL, bạn có các công cụ cần thiết để thực hiện liền mạch các tác vụ thay thế văn bản trong các tệp PDF của mình. Cho dù bạn cần cập nhật các từ khóa cụ thể, sửa đổi chỗ giữ chỗ hay thực hiện các thay đổi hàng loạt trên nhiều tài liệu, các giải pháp này đều mang lại sự linh hoạt, hiệu quả và dễ dàng tích hợp. Bằng cách tận dụng các khả năng của Aspose.PDF Cloud SDK cho Python hoặc sử dụng các lệnh cURL, bạn có thể tự động hóa các hoạt động thay thế văn bản, cải thiện năng suất và đạt được kết quả chính xác và nhất quán. Hãy bắt đầu tận dụng các công cụ mạnh mẽ này ngay hôm nay và mở khóa tiềm năng xử lý tài liệu PDF của bạn.
Liên kết hữu ích
Bài viết liên quan
Chúng tôi cũng khuyên bạn nên truy cập vào các liên kết sau để tìm hiểu thêm về: