Mesclar PDF em Python

As operações de divisão e mesclagem PDF geralmente são oferecidas em softwares pagos e a maioria dos visualizadores PDF gratuitos não fornecem esses recursos. Além disso, caso você precise mesclar determinados documentos PDF, primeiro você precisa instalar, configurar e comprar a assinatura de licença completa. Você pode ter apenas a necessidade de mesclar os arquivos PDF, mas terá que pagar o preço total da licença. Além disso, você pode se deparar com um cenário em que precisa combinar os arquivos PDF, mas o software não está disponível em uma plataforma específica. Portanto, para mitigar todos esses cenários, recomendamos usar a API Aspose.PDF Cloud para mesclar arquivos PDF online. Nenhum download ou instalação de software é necessário e todas as operações são realizadas na nuvem.

API de processamento de PDF em Python

Aspose.PDF Cloud SDK para Python é um wrapper em torno do Aspose.PDF Cloud API que oferece todos os poderes e capacidades do processamento de arquivos PDF para desenvolvedores Python. Da mesma forma, o SDK também fornece o recurso de mesclar/combinar vários arquivos PDF em um único documento de saída e tudo isso pode ser feito com poucas linhas de código.

Instalação

Antes de prosseguirmos, o primeiro passo é instalar o SDK do repositório PIP ou GitHub. Neste artigo, discutiremos as etapas de instalação do PIP. Basta executar o seguinte comando no terminal/prompt de comando para instalar a versão mais recente do SDK no sistema.

pip install asposepdfcloud

Instalação no Pycharm

PyCharm é um IDE popular para desenvolvimento Python. Então, para usar o SDK diretamente no Python IDE, siga os passos abaixo.

Clique no item de menu Preferências no menu PyCharm.

Item do menu Preferências

Na árvore da esquerda, selecione Python Interpreter na seção Projeto.

Opção de interpretador Python

Agora clique no sinal + (mais) na seção direita e digite asposepdfcloud no campo de pesquisa sobre a caixa de diálogo de pacotes disponíveis.

Caixa de diálogo de pacotes disponíveis

Agora clique no botão Install Package. Assim que o SDK for instalado, a mensagem de sucesso será exibida.

Mesclar arquivos PDF em Python

O Aspose.PDF Cloud usa serviços de armazenamento baseados em nuvem para armazenamento de documentos. Portanto, para garantir a integridade e privacidade dos dados, apenas pessoas autorizadas são elegíveis para acessar as APIs. Portanto, o primeiro passo é criar uma conta visitando Aspose.Cloud dashboard. Se você tiver uma conta GitHub ou Google, basta se inscrever. Caso contrário, clique no botão Create a new Account e forneça as informações necessárias. Agora, faça login no painel usando credenciais e expanda a seção Applications do painel e role para baixo em direção à seção Client Credentials para ver os detalhes do Client ID e do Client Secret.

Abaixo estão as etapas para mesclar os documentos PDF.

  • Primeiro, crie um objeto de ApiClient passando ClientSecret e ClientID como argumentos.
  • Em segundo lugar, crie uma instância PdfApi enquanto passa o objeto ApiClient como argumento.
  • Em seguida, crie um objeto Opts onde definimos o PDF de destino a ser anexado, a página inicial e final do arquivo PDF.
  • Por fim, chame o método postappenddocument(…) para executar operações de mesclagem de PDF.
# Obtenha seu ClientId e ClientSecret em https://dashboard.aspose.cloud (é necessário registro gratuito).

#initialize PdfApi client instance using ClientID and ClientSecret
pdf_api_client = asposepdfcloud.api_client.ApiClient("d87269aade6a46cdc295b711e26809af", "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4")

# crie uma instância PdfApi enquanto passa PdfApiClient como argumento
pdf_api = PdfApi(pdf_api_client)

# Documento PDF de origem
file_name = 'PdfWithAnnotations.pdf'

# Arquivo PDF cujas páginas precisam ser anexadas
append_file_name = 'PdfWithTable.pdf'

# criar instância de opções definindo concatenação PDF
# página inicial e final do arquivo de concatenação
opts = {
    "append_file": append_file_name,
    "start_page": 1,
    "end_page": 2
}

# Chamar API para mesclar as páginas
response = pdf_api.post_append_document(file_name, **opts)

# renderizar código de resposta no console
print(response)

Mesclar arquivos PDF usando o comando cURL

Os comandos cURL são uma das maneiras convenientes de acessar APIs REST por meio do terminal de linha de comando de qualquer plataforma. Você nem precisa instalar o SDK, mas simplesmente executar o comando no aplicativo de terminal e atender aos seus requisitos. Então, para usar os comandos cURL, o primeiro passo é gerar JSON Web Token (JWT) para que as APIs sejam acessíveis por meio do prompt de comando. O mesmo token JWT é usado para acessar APIs por meio de comandos cURL.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Use o comando a seguir e o PDF de destino será mesclado aos arquivos PDF de origem/entrada usando a API PostAppendDocument. A saída resultante será salva no armazenamento em nuvem.

curl -X POST "https://api.aspose.cloud/v3.0/pdf/PdfWithAnnotations.pdf/appendDocument?appendFile=PdfWithTable.pdf&startPage=2&endPage=3" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"

Conclusão

Neste artigo, discutimos as etapas para executar operações de mesclagem de PDF usando a API REST do Python. Devido ao tipo de código aberto, o código-fonte completo do SDK pode ser baixado do repositório GitHub.

Para mais detalhes sobre os recursos do SDK, visite o seguinte tópico de documentação Aspose.PDF Cloud Features. No entanto, se você encontrar algum problema ao usar a API, sinta-se à vontade para entrar em contato conosco por meio de um fórum de suporte técnico gratuito.

Artigos relacionados

Também recomendamos a leitura dos seguintes artigos que explicam: