Localizar e substituir texto
Desbloqueie o potencial de suas capacidades de edição PDF com o recurso notável de pesquisar e substituir texto. Seja você um profissional de negócios, um estudante ou um indivíduo lidando com documentos PDF, a capacidade de encontrar e substituir rapidamente texto específico é inestimável. Com a necessidade cada vez maior de processamento eficiente de documentos, é essencial ter ferramentas poderosas à sua disposição. Neste artigo, exploraremos o processo de pesquisar e substituir texto em arquivos PDF usando o Aspose.PDF Cloud SDK para Python.

Não é necessário baixar ou instalar o Adobe Acrobat ou outro software e todo o processamento de PDF é realizado na nuvem.

SDK de nuvem de manipulação de PDF

Aspose.PDF Cloud é um SDK robusto que fornece uma ampla gama de recursos para lidar com eficiência com arquivos PDF e agilizar suas tarefas de processamento de documentos. Um dos recursos de destaque deste SDK é a capacidade de pesquisar e substituir texto em documentos PDF. Vamos mergulhar e aproveitar todo o potencial do Aspose.PDF Cloud SDK para Python para revolucionar seu fluxo de trabalho de edição de PDF.

Então, o primeiro passo para usar a API é a instalação do Cloud SDK que está disponível gratuitamente para download no repositório PIP e GitHub. Basta executar o seguinte comando no terminal/prompt de comando para instalar a versão mais recente do SDK no sistema.

pip install asposepdfcloud

Estúdio Visual MS

Ao usar o Visual Studio, você também pode adicionar a referência no seu projeto Python dentro do projeto do Visual Studio. Pesquise asposepdfcloud como um pacote na janela do ambiente Python. Siga as etapas numeradas na imagem abaixo para concluir o processo de instalação.

Aspose.PDF Cloud Python

Imagem 1:- Pacote Aspose.PDF Cloud SDK para Python.

Também precisamos de credenciais de cliente para acessar as APIs de nuvem que podem ser obtidas em painel de nuvem. Basta se inscrever ou clicar no botão Criar uma nova conta e fornecer as informações necessárias.

Credenciais do cliente

Imagem 2:- Credenciais do cliente no painel do Aspose.Cloud.

Pesquisar e substituir texto usando Python

Siga as instruções fornecidas abaixo para pesquisar uma sequência específica e substituir todas as suas ocorrências no documento PDF.

  • Primeiro, crie uma instância da classe ApiClient e forneça o ID do cliente e o segredo do cliente como argumentos.
  • Em segundo lugar, crie uma instância da classe PdfApi que recebe o objeto ApiClient como argumento de entrada.
  • Crie variáveis especificando o documento PDF de entrada.
  • Agora crie um objeto de TextReplaceListRequest definindo propriedades de substituição de texto.
  • Por fim, chame o método postdocumenttextreplace(..) para iniciar a operação de busca e substituição e salvar o resultado no armazenamento em nuvem.
def findAndReplaceText():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # crie uma instância PdfApi enquanto passa PdfApiClient como argumento
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'
        
        # Propriedades de texto de substituição
        text_Replace_Request = asposepdfcloud.TextReplaceListRequest 
        {
          "TextReplaces": [
            {
              "OldValue": "Productivity",
              "NewValue": "Increased Productivity",
             # "Regex": Verdadeiro,
              "TextState": {
                "FontSize": 0,
                "Font": "Arial",
                "ForegroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 240,
                  "B": 3
                },
                "BackgroundColor": {
                  "A": 0,
                  "R": 252,
                  "G": 3,
                  "B": 248
                },
                "FontStyle": "Regular"
              },
              "Rect": {
                "LLX": 0,
                "LLY": 0,
                "URX": 0,
                "URY": 0
              }
            }
          ],
          "DefaultFont": "Arial",
          "StartIndex": 0,
          "CountReplace": 0
        }

        # chame a API para substituir texto em documento PDF
        response = pdf_api.post_document_text_replace(name = input_file, text_replace = text_Replace_Request)
        print(response)
        # imprimir mensagem no console (opcional)
        print('Text successfully Replaced in PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
Pré-visualização da saída de substituição de texto

Imagem 3:- Visualização da saída de substituição de texto.

No trecho de código acima, observe especificamente dois parâmetros, ou seja, StartIndex e CountReplace. O StartIndex define a ocorrência específica de texto a partir da qual a operação de substituição de texto será iniciada e CountReplace define as ocorrências de texto que precisam ser substituídas. Na imagem abaixo, observe que apenas duas ocorrências da string Product Family são atualizadas começando com o índice 2.

Duas ocorrências de String replace

Imagem 4:- Duas ocorrências de string são substituídas.

Para sua referência, a entrada URL2PDF.pdf e o resultante Text-Replace-Output.pdf foram anexados.

Pesquisar e substituir texto usando o comando cURL

Além de usar o Aspose.PDF Cloud SDK para Python, você também pode aproveitar a flexibilidade dos comandos cURL para executar a substituição de texto em documentos PDF. cURL é uma ferramenta de linha de comando que permite fazer solicitações HTTP e interagir com serviços da web, tornando-a uma opção versátil para integração com a API Aspose.PDF Cloud. Com os comandos cURL, você pode facilmente enviar solicitações para os endpoints da API e utilizar o recurso “Substituir texto” para pesquisar padrões de texto específicos e substituí-los por novo conteúdo.

Agora, execute o seguinte comando para gerar o token JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Agora que geramos nosso token JWT personalizado, precisamos executar o seguinte comando cURL para substituir a string de produtividade no documento PDF e salvar o documento atualizado no mesmo armazenamento em nuvem.

curl -X POST "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/text/replace" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-H  "Content-Type: application/json" \
-d "{  \"TextReplaces\": [    {      \"OldValue\": \"Product Family\",      \"NewValue\": \"Product Families\",      \"Regex\": true,      \"TextState\": {        \"FontSize\": 0,        \"Font\": \"Arial\",        \"ForegroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 240,          \"B\": 3        },        \"BackgroundColor\": {          \"A\": 0,          \"R\": 252,          \"G\": 3,          \"B\": 248        },        \"FontStyle\": \"Regular\"      },      \"Rect\": {        \"LLX\": 0,        \"LLY\": 0,        \"URX\": 0,        \"URY\": 0      }    }  ],  \"DefaultFont\": \"Arial\",  \"StartIndex\": 2,  \"CountReplace\": 2}"

Conclusão

Concluindo, a capacidade de pesquisar e substituir texto em documentos PDF é um recurso valioso que pode melhorar muito seus fluxos de trabalho de processamento de documentos. Com o poder do Aspose.PDF Cloud SDK para Python e a conveniência dos comandos cURL, você tem as ferramentas necessárias para executar perfeitamente tarefas de substituição de texto em seus arquivos PDF. Se você precisa atualizar palavras-chave específicas, modificar espaços reservados ou fazer alterações em massa em vários documentos, essas soluções oferecem flexibilidade, eficiência e facilidade de integração. Ao aproveitar os recursos do Aspose.PDF Cloud SDK para Python ou utilizar comandos cURL, você pode automatizar operações de substituição de texto, melhorar a produtividade e obter resultados precisos e consistentes. Comece a aproveitar essas ferramentas poderosas hoje mesmo e desbloqueie o potencial do processamento de seus documentos PDF.

Artigos relacionados

Recomendamos também que você visite os seguintes links para saber mais sobre: