Найти и заменить текст
Раскройте потенциал своих возможностей редактирования PDF с помощью замечательной функции поиска и замены текста. Независимо от того, являетесь ли вы профессионалом в бизнесе, студентом или отдельным лицом, работающим с PDF-документами, возможность быстрого поиска и замены определенного текста бесценна. С постоянно растущей потребностью в эффективной обработке документов крайне важно иметь в своем распоряжении мощные инструменты. В этой статье мы рассмотрим процесс поиска и замены текста в файлах PDF с помощью Aspose.PDF Cloud SDK для Python.

Не требуется загрузка и установка Adobe Acrobat или другого программного обеспечения, вся обработка PDF-файлов выполняется в облаке.

Облачный SDK для обработки PDF-файлов

Aspose.PDF Cloud — это надежный SDK, предоставляющий широкий спектр функций для эффективной обработки PDF-файлов и оптимизации задач по обработке документов. Одной из выдающихся возможностей этого SDK является возможность поиска и замены текста в PDF-документах. Давайте погрузимся и задействуем весь потенциал Aspose.PDF Cloud SDK для Python, чтобы произвести революцию в вашем рабочем процессе редактирования PDF.

Итак, первым шагом в использовании API является установка Cloud SDK, который свободно доступен для загрузки через репозиторий PIP и GitHub. Просто выполните следующую команду в терминале/командной строке, чтобы установить последнюю версию SDK в системе.

pip install asposepdfcloud

MS Visual Studio

При использовании Visual Studio вы также можете добавить ссылку в свой проект Python в проекте Visual Studio. Найдите asposepdfcloud как пакет в окне среды Python. Для завершения процесса установки выполните шаги, пронумерованные на изображении ниже.

Aspose.PDF Облачный Python

Изображение 1:- Пакет Aspose.PDF Cloud SDK для Python.

Нам также нужны учетные данные клиента для доступа к API облака, которые можно получить из облачной панели управления. Просто зарегистрируйтесь или нажмите кнопку Создать новую учетную запись и предоставьте необходимую информацию.

Учетные данные клиента

Изображение 2: Учетные данные клиента на панели управления Aspose.Cloud.

Поиск и замена текста с использованием Python

Пожалуйста, следуйте приведенным ниже инструкциям, чтобы найти определенную строку и заменить все ее вхождения в документе PDF.

  • Во-первых, создайте экземпляр класса ApiClient, указав в качестве аргументов Client ID и Client Secret.
  • Во-вторых, создайте экземпляр класса PdfApi, который принимает объект ApiClient в качестве входного аргумента.
  • Создайте переменные, определяющие входной PDF-документ.
  • Теперь создайте объект TextReplaceListRequest, определяющий свойства замены текста.
  • Наконец, вызовите метод postdocumenttextreplace(..), чтобы инициировать операцию поиска и замены и сохранить результат в облачном хранилище.
def findAndReplaceText():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # создать экземпляр PdfApi, передав PdfApiClient в качестве аргумента
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'
        
        # Свойства заменяющего текста
        text_Replace_Request = asposepdfcloud.TextReplaceListRequest 
        {
          "TextReplaces": [
            {
              "OldValue": "Productivity",
              "NewValue": "Increased Productivity",
             # «Регулярное выражение»: Верно,
              "TextState": {
                "FontSize": 0,
                "Font": "Arial",
                "ForegroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 240,
                  "B": 3
                },
                "BackgroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 3,
                  "B": 248
                },
                "FontStyle": "Regular"
              },
              "Rect": {
                "LLX": 0,
                "LLY": 0,
                "URX": 0,
                "URY": 0
              }
            }
          ],
          "DefaultFont": "Arial",
          "StartIndex": 0,
          "CountReplace": 0
        }

        # вызов API для замены текста в PDF-документе
        response = pdf_api.post_document_text_replace(name = input_file, text_replace = text_Replace_Request)
        print(response)
        # вывести сообщение в консоль (необязательно)
        print('Text successfully Replaced in PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
Предварительный просмотр вывода замены текста

Изображение 3:- Предварительный просмотр результата замены текста.

В приведенном выше фрагменте кода, пожалуйста, обратите особое внимание на два параметра, а именно StartIndex и CountReplace. StartIndex определяет конкретное вхождение текста, с которого будет инициирована операция замены текста, а CountReplace определяет вхождения текста, которые необходимо заменить. На изображении ниже обратите внимание, что только два вхождения строки Product Family обновляются, начиная с индекса 2.

Два вхождения строки заменить

Изображение 4:- Заменены два вхождения строки.

Для справки прилагаются входные данные URL2PDF.pdf и результирующий файл Text-Replace-Output.pdf.

Поиск и замена текста с помощью команды cURL

Помимо использования Aspose.PDF Cloud SDK для Python, вы также можете использовать гибкость команд cURL для выполнения замены текста в документах PDF. cURL — это инструмент командной строки, который позволяет вам делать HTTP-запросы и взаимодействовать с веб-сервисами, что делает его универсальным вариантом для интеграции с API Aspose.PDF Cloud. С помощью команд cURL вы можете легко отправлять запросы в конечные точки API и использовать функцию «Заменить текст» для поиска определенных текстовых шаблонов и замены их новым содержимым.

Теперь выполните следующую команду для генерации токена JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Теперь, когда мы сгенерировали наш персонализированный токен JWT, нам нужно выполнить следующую команду cURL, чтобы заменить строку Productivity в документе PDF и сохранить обновленный документ в том же облачном хранилище.

curl -X POST "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/text/replace" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-H  "Content-Type: application/json" \
-d "{  \"TextReplaces\": [    {      \"OldValue\": \"Product Family\",      \"NewValue\": \"Product Families\",      \"Regex\": true,      \"TextState\": {        \"FontSize\": 0,        \"Font\": \"Arial\",        \"ForegroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 240,          \"B\": 3        },        \"BackgroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 3,          \"B\": 248        },        \"FontStyle\": \"Regular\"      },      \"Rect\": {        \"LLX\": 0,        \"LLY\": 0,        \"URX\": 0,        \"URY\": 0      }    }  ],  \"DefaultFont\": \"Arial\",  \"StartIndex\": 2,  \"CountReplace\": 2}"

Заключение

В заключение, возможность поиска и замены текста в документах PDF является ценной функцией, которая может значительно улучшить ваши рабочие процессы обработки документов. Благодаря мощности Aspose.PDF Cloud SDK для Python и удобству команд cURL у вас есть необходимые инструменты для беспрепятственного выполнения задач по замене текста в ваших файлах PDF. Независимо от того, нужно ли вам обновить определенные ключевые слова, изменить заполнители или внести массовые изменения в несколько документов, эти решения предлагают гибкость, эффективность и простоту интеграции. Используя возможности Aspose.PDF Cloud SDK для Python или команды cURL, вы можете автоматизировать операции по замене текста, повысить производительность и добиться точных и последовательных результатов. Начните использовать эти мощные инструменты сегодня и раскройте потенциал обработки ваших документов PDF.

Полезные ссылки

Похожие статьи

Мы также рекомендуем посетить следующие ссылки, чтобы узнать больше о: