
PDFs são amplamente usados para armazenar e compartilhar vários tipos de documentos, incluindo relatórios, apresentações e folhetos. No entanto, quando se trata de extrair imagens desses arquivos, o processo pode ser demorado e trabalhoso. Se você precisa extrair imagens para edição posterior, análise ou inclusão em seus próprios projetos, ter uma abordagem confiável e eficiente é crucial. Portanto, aproveitar os recursos de um SDK de programação pode agilizar o processo de extração de imagens, economizando tempo e esforço valiosos. Agora, neste artigo, exploraremos os detalhes sobre como extrair imagens de arquivos PDF usando o Python Cloud SDK e desbloquear um nível totalmente novo de produtividade e conveniência.
- SDK de processamento de PDF na nuvem
- Extrair imagens de PDF em Python
- Baixe imagens em PDF usando o comando cURL
SDK de processamento de PDF na nuvem
Quando se trata de extrair imagens de arquivos PDF usando Python, o Aspose.PDF Cloud API é uma ferramenta poderosa e versátil. Com o Aspose.PDF Cloud SDK para Python, você não só pode extrair imagens de PDFs, mas também executar várias outras tarefas, como converter PDFs para diferentes formatos, adicionar anotações, mesclar ou dividir documentos PDF e muito mais. Além disso, o SDK oferece um conjunto abrangente de APIs que permitem que você manipule arquivos PDF programaticamente, economizando tempo e esforço.
Agora, para instalar o SDK, faça o download do repositório PIP ou GitHub. Então, execute o seguinte comando no terminal/prompt de comando para instalar a versão mais recente do SDK no sistema.
pip install asposepdfcloud
IDE PyCharm
Se estiver usando o PyCharm IDE, você pode adicionar o SDK diretamente como uma dependência no seu projeto.
Arquivo ->Configurações ->Projeto ->Interpretador Python ->asposepdfcloud

Imagem 1:- Opção de configurações do PyCharm.

Imagem 2:- Pacote Python Aspose.PDF Cloud.
Outro passo importante é criar uma conta gratuita no cloud dashboard usando o GitHub ou a conta do Google. Ou clique no botão create a new account e forneça as informações necessárias e obtenha suas credenciais de cliente personalizadas.

Imagem 3:- Credenciais do cliente no painel da nuvem.
Extrair imagens de PDF em Python
Siga os passos abaixo para extrair imagens de documentos PDF no formato JPEG e salvá-las na pasta de armazenamento em nuvem.
- Primeiro, crie uma instância da classe ApiClient e forneça o ID do cliente e o segredo do cliente como argumentos.
- Em segundo lugar, crie uma instância da classe PdfApi que receba o objeto ApiClient como argumento.
- Agora, chame o método putimagesextractasjpeg(…) que recebe o nome do PDF de entrada, o número da página do PDF respectivo e um parâmetro opcional especificando a pasta de destino para salvar as imagens extraídas.
def extractImages():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# crie uma instância PdfApi enquanto passa PdfApiClient como argumento
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'URL2PDF.pdf'
# Chame a API para extrair imagens como JPEG e salvá-las na pasta ExtractedImages no armazenamento em nuvem
response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
print(response)
# imprimir mensagem no console (opcional)
print('Images successfully extracted from PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
A API também suporta dois parâmetros opcionais para especificar a largura e a altura das imagens extraídas.

Image 4:- Preview of extracted images.
Caso precise extrair imagens em outros formatos, você pode considerar usar as seguintes APIs:
- PutImagesExtractAsTiff - Extrair imagens de documentos em formato TIFF
- PutImagesExtractAsGif - Extrair imagens de documentos em formato GIF
- PutImagesExtractAsPng - Extrair imagens de documentos em formato PNG
Baixe imagens em PDF usando o comando cURL
A extração de imagens de arquivos PDF também pode ser obtida usando o Aspose.PDF Cloud API com comandos cURL. Ao utilizar comandos cURL, você pode fazer solicitações HTTP para os endpoints da API e extrair imagens de PDFs com facilidade. Essa abordagem fornece flexibilidade e conveniência, pois você pode integrar a funcionalidade de extração de imagem diretamente em seus scripts ou aplicativos. Além disso, você também obtém os recursos para acessar as APIs REST via terminal de linha de comando em qualquer plataforma, ou seja, Windows, Linux, macOS ou outros sistemas operacionais.
Nesta seção, usaremos os comandos cURL para extração de imagens no formato PNG e salvaremos a saída no armazenamento em nuvem. Então, o primeiro passo é gerar um JSON Web Token (JWT) executando o seguinte comando.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Agora, execute o seguinte comando para extrair as imagens somente da 3ª página do documento PDF. As imagens são extraídas no formato PNG.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H "Accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
O arquivo PDF de amostra usado no exemplo acima pode ser baixado de URL2PDF.pdf.
Conclusão
Concluindo, extrair imagens de arquivos PDF é um recurso valioso que pode ser obtido usando o Aspose.PDF Cloud SDK para Python e comandos cURL. Quer você prefira a conveniência e a simplicidade da programação Python ou a versatilidade dos comandos cURL, o Aspose.PDF Cloud fornece uma API robusta para realizar essa tarefa. Ao aproveitar o poder da nuvem, você pode extrair imagens de documentos PDF com facilidade, aprimorando seu fluxo de trabalho. No entanto, com o Aspose.PDF Cloud, você tem a flexibilidade de escolher a abordagem que melhor se adapta às suas necessidades e integrar perfeitamente a funcionalidade de extração de imagens em seus projetos.
Recursos Úteis
Artigos relacionados
Recomendamos também que você visite os seguintes links para saber mais sobre: