Biên tập các tập tin PDF
PDF Các tệp thường được sử dụng để chia sẻ tài liệu, chẳng hạn như hợp đồng pháp lý, báo cáo tài chính hoặc hồ sơ y tế, do định dạng an toàn và đáng tin cậy của chúng. Tuy nhiên, các tệp này cũng có thể chứa thông tin nhạy cảm cần được giữ bí mật. Nếu bạn cần chia sẻ tệp PDF có chứa dữ liệu nhạy cảm, thì biên tập là cách tốt nhất để bảo vệ tệp đó. Biên tập là quá trình xóa hoặc bôi đen thông tin nhạy cảm khỏi tài liệu trong khi vẫn giữ nguyên phần nội dung còn lại. Trong bài đăng trên blog này, chúng tôi sẽ chỉ cho bạn cách biên tập tệp PDF bằng Python.

API xử lý PDF

Aspose.PDF Cloud SDK for Python là một công cụ tuyệt vời để biên tập các tệp PDF trực tuyến. Đây là một REST API dựa trên đám mây cung cấp nhiều tính năng khác nhau để làm việc với các tài liệu PDF, chẳng hạn như tạo, chuyển đổi và thao tác các tệp PDF. Sử dụng SDK này, bạn có thể dễ dàng biên tập thông tin nhạy cảm từ các tệp PDF trực tuyến mà không cần phải cài đặt bất kỳ phần mềm bổ sung nào trên máy tính của mình.

Nó cung cấp một số lợi ích so với các phương pháp biên tập truyền thống. Ví dụ, tính năng biên tập của API nhanh hơn và chính xác hơn so với biên tập thủ công. Nó cũng đảm bảo rằng thông tin nhạy cảm được xóa vĩnh viễn khỏi tài liệu, ngăn chặn truy cập trái phép vào thông tin.

Bây giờ bước đầu tiên là cài đặt SDK, có thể tải xuống qua kho lưu trữ PIPGitHub. Vui lòng thực hiện lệnh sau trong terminal để hoàn tất cài đặt.

pip install asposepdfcloud

IDE PyCharm

Nếu bạn đang sử dụng PyCharm IDE, bạn có thể trực tiếp thêm SDK dưới dạng phần phụ thuộc vào dự án của mình.

Tệp ->Cài đặt ->Dự án ->Trình thông dịch Python ->asposepdfcloud

chú thích

Image 1:- PyCharm settings option.

Gói Python Aspose.PDF

Hình ảnh 2: - Gói Python đám mây Aspose.Pdf.

Sau khi cài đặt, bước quan trọng tiếp theo là lấy thông tin đăng nhập của khách hàng từ Bảng điều khiển. Trong trường hợp bạn không có tài khoản, chỉ cần Đăng ký bằng tùy chọn tạo tài khoản mới.

Biên tập PDF bằng Python

Vui lòng làm theo hướng dẫn bên dưới để biên tập nội dung PDF bằng đoạn mã Python:

  • Tạo một phiên bản của ApiClient bằng cách truyền thông tin xác thực của khách hàng làm đối số.
  • Bây giờ hãy khởi tạo PdfApi trong khi truyền đối tượng ApiClient làm đối số.
  • Tạo một đối tượng RedactionAnnotation và gọi phương thức postpageredactionannotations(..) của PdfApi để thực hiện các yêu cầu của chúng tôi.
def redactPDF():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # tạo phiên bản PdfApi trong khi truyền PdfApiClient làm đối số
        pdf_api = PdfApi(pdf_api_client)

        # nhập tệp PDF
        input_file = 'marketing.pdf'

        # tạo một thể hiện của lớp RedactAnnotation
        redactAnnotation = asposepdfcloud.models.RedactionAnnotation() 
        redactAnnotation.contents = 'Confidential'

        # thiết lập chi tiết màu sắc cho đối tượng Chú thích
        redactAnnotation.color = asposepdfcloud.Color(a = 0, r = 66, g = 111, b = 245)

        # đặt ngày sửa đổi cho Chú thích
        redactAnnotation.modified = '01/01/2018 12:00:00.000 AM'
        redactAnnotation.id = 1

        # đặt cờ chú thích làm mặc định
        redactAnnotation.flags = [asposepdfcloud.models.AnnotationFlags.DEFAULT]
        redactAnnotation.name = 'redactName'

        # chỉ định vùng hình chữ nhật cho Chú thích trên trang
        redactAnnotation.rect = asposepdfcloud.models.Rectangle(llx = 20, lly = 700, urx = 220, ury = 650 )
        redactAnnotation.page_index = 1

        # Yếu tố ZIndex cho chú thích
        redactAnnotation.z_index = 1

        # đặt căn chỉnh theo chiều dọc và chiều ngang là Trung tâm
        redactAnnotation.horizontal_alignment = asposepdfcloud.models.HorizontalAlignment.CENTER
        redactAnnotation.vertical_alignment = asposepdfcloud.models.HorizontalAlignment.CENTER
        
        # chi tiết điểm cho chú thích biên tập
        redactAnnotation.quad_point =  [
            asposepdfcloud.models.Point(5, 40),
            asposepdfcloud.models.Point(10, 60)
            ]

        # Chi tiết màu tô chú thích
        redactAnnotation.fill_color = asposepdfcloud.Color(a = 10, r = 50, g = 168, b = 182)

        # Văn bản chồng lên nhau sẽ được in trên chú thích biên tập
        redactAnnotation.overlay_text = 'Confidential Data'

        # lặp lại sự xuất hiện của chú thích
        redactAnnotation.repeat = True

        # đặt thông tin căn chỉnh văn bản là Căn trái
        redactAnnotation.text_alignment = asposepdfcloud.models.HorizontalAlignment.LEFT 

        # gọi API để thêm chú thích biên tập vào trang đầu tiên của tài liệu
        response = pdf_api.post_page_redaction_annotations(name = input_file, page_number= 1, annotations= [redactAnnotation])
        
        # in mã phản hồi trong bảng điều khiển
        print(response)

        # in tin nhắn trong bảng điều khiển (tùy chọn)
        print('Redaction Annotation successfully added to PDF document !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

Tắt nội dung PDF bằng lệnh cURL

Với lệnh cURL và Aspose.PDF Cloud, việc biên tập các tệp PDF trở nên dễ dàng hơn bao giờ hết. Aspose.PDF Cloud là một API RESTful có thể sử dụng với nhiều ngôn ngữ lập trình, bao gồm lệnh cURL. Bạn có thể dễ dàng biên tập thông tin nhạy cảm từ các tệp PDF bằng cách bôi đen văn bản hoặc xóa hoàn toàn. API này an toàn, đáng tin cậy và có thể mở rộng, khiến nó trở thành lựa chọn lý tưởng cho các doanh nghiệp ở mọi quy mô.

Bây giờ bước đầu tiên là thực hiện lệnh sau để tạo accessToken.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Sau khi có accessToken, vui lòng thực hiện lệnh sau để biên tập thông tin trong tài liệu PDF tại vùng hình chữ nhật đã chỉ định (“LLX”: 20, “LLY”: 700, “URX”: 220, “URY”: 650).Sau khi thực hiện thành công, tệp kết quả sẽ được lưu vào bộ nhớ đám mây.

curl -v -X POST "https://api.aspose.cloud/v3.0/pdf/{inputPDF}/pages/1/annotations/redaction?apply=true" \
-H  "accept: application/json" \
-H  "authorization: Bearer {accessToken}" \
-H  "Content-Type: application/json" \
-d "[  {    \"Color\": {      \"A\": 0,      \"R\": 158,      \"G\": 50,      \"B\": 168    },    \"Contents\": \"Confidential\",    \"Modified\": \"01/18/2022 12:00:00.000 AM\",    \"Id\": \"1\",    \"Flags\": [      \"Default\"    ],    \"Name\": \"Name\",    \"Rect\": {      \"LLX\": 20,      \"LLY\": 700,      \"URX\": 220,      \"URY\": 650    },    \"PageIndex\": 1,    \"ZIndex\": 1,    \"HorizontalAlignment\": \"CENTER\",    \"VerticalAlignment\": \"CENTER\",    \"QuadPoint\": [      {        \"X\": 5,        \"Y\": 10      }    ],    \"FillColor\": {      \"A\": 10,      \"R\": 50,      \"G\": 168,      \"B\": 182    },    \"BorderColor\": {      \"A\": 10,      \"R\": 168,      \"G\": 50,      \"B\": 141    },    \"OverlayText\": \"Sensitive data\",    \"Repeat\": true,    \"TextAlignment\": \"Left\"  }]"

Thay thế {inputPDF} bằng tên tệp PDF có trong bộ nhớ đám mây và {accessToken} bằng mã truy cập được tạo ở trên.

Phần kết luận

Tóm lại, việc biên tập các tệp PDF là một nhiệm vụ quan trọng để bảo vệ thông tin nhạy cảm không bị tiết lộ. Cho dù bạn chọn sử dụng Python hay lệnh cURL với Aspose.PDF Cloud, quy trình đã trở nên đơn giản và hiệu quả hơn với tính khả dụng. Vì vậy, cho dù bạn là chuyên gia pháp lý, bác sĩ hay nhà phân tích tài chính, việc học cách biên tập các tệp PDF bằng Python có thể giúp bạn bảo vệ thông tin bí mật của mình và tuân thủ các quy định về bảo vệ dữ liệu.

Liên kết hữu ích

Bài viết được đề xuất

Chúng tôi thực sự khuyên bạn nên truy cập các bài viết sau để tìm hiểu về: