Estrarre immagini da PDF

I PDF sono ampiamente utilizzati per archiviare e condividere vari tipi di documenti, tra cui report, presentazioni e brochure. Tuttavia, quando si tratta di estrarre immagini da questi file, il processo può richiedere molto tempo ed essere macchinoso. Sia che tu abbia bisogno di estrarre immagini per ulteriori modifiche, analisi o inclusione nei tuoi progetti, avere un approccio affidabile ed efficiente è fondamentale. Pertanto, sfruttare le capacità di un SDK di programmazione può semplificare il processo di estrazione delle immagini, risparmiando tempo e fatica preziosi. Ora in questo articolo, esploreremo i dettagli su come estrarre immagini da file PDF utilizzando Python Cloud SDK e sbloccare un livello completamente nuovo di produttività e praticità.

SDK cloud per l’elaborazione PDF

Quando si tratta di estrarre immagini da file PDF usando Python, Aspose.PDF Cloud API è uno strumento potente e versatile. Con Aspose.PDF Cloud SDK per Python, puoi non solo estrarre immagini da PDF, ma anche eseguire altre attività come convertire PDF in formati diversi, aggiungere annotazioni, unire o dividere documenti PDF e molto altro. Inoltre, l’SDK offre un set completo di API che ti consentono di manipolare i file PDF a livello di programmazione, risparmiandoti tempo e fatica.

Ora, per installare l’SDK, scaricalo dal repository PIP o GitHub. Quindi, esegui il seguente comando sul terminale/prompt dei comandi per installare l’ultima versione dell’SDK sul sistema.

 pip install asposepdfcloud

IDE PyCharm

Se utilizzi PyCharm IDE, puoi aggiungere direttamente l’SDK come dipendenza nel tuo progetto.

File ->Impostazioni ->Progetto ->Interprete Python ->asposepdfcloud

Impostazioni PyCharm

Immagine 1:- Opzione impostazioni PyCharm.

Pacchetto Python Aspose.PDF

Immagine 2: Pacchetto Python Cloud Aspose.PDF.

Un altro passaggio importante è creare un account gratuito su cloud dashboard utilizzando GitHub o un account Google. Oppure, fai clic sul pulsante crea un nuovo account e fornisci le informazioni richieste per ottenere le tue credenziali cliente personalizzate.

Credenziali del cliente

Immagine 3:- Credenziali del cliente sulla dashboard Cloud.

Estrarre immagini da PDF in Python

Per estrarre le immagini dai documenti PDF in formato JPEG e salvarle nella cartella di archiviazione Cloud, seguire i passaggi indicati di seguito.

  • Per prima cosa, crea un’istanza della classe ApiClient fornendo Client ID e Client Secret come argomenti.
  • In secondo luogo, creare un’istanza della classe PdfApi che accetta l’oggetto ApiClient come argomento.
  • Ora, chiama il metodo putimagesextractasjpeg(…) che accetta in input il nome del PDF, il rispettivo numero di pagina del PDF e un parametro facoltativo che specifica la cartella di destinazione in cui salvare le immagini estratte.
def extractImages():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # crea un'istanza di PdfApi passando PdfApiClient come argomento
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'

        # Chiama l'API per estrarre le immagini come JPEG e salvarle nella cartella ExtractedImages nell'archiviazione Cloud
        response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
        
        print(response)
        # stampa messaggio nella console (facoltativo)
        print('Images successfully extracted from PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

L’API supporta anche due parametri facoltativi per specificare la larghezza e l’altezza delle immagini estratte.

didascalia

Image 4:- Preview of extracted images.

Nel caso in cui sia necessario estrarre immagini in altri formati, è possibile prendere in considerazione l’utilizzo delle seguenti API:

Scarica immagini PDF usando il comando cURL

L’estrazione di immagini da file PDF può essere ottenuta anche utilizzando Aspose.PDF Cloud API con comandi cURL. Utilizzando i comandi cURL, puoi effettuare richieste HTTP agli endpoint API ed estrarre immagini da PDF con facilità. Questo approccio fornisce flessibilità e praticità, poiché puoi integrare la funzionalità di estrazione delle immagini direttamente nei tuoi script o applicazioni. Inoltre, ottieni anche le capacità di accedere alle API REST tramite terminale a riga di comando su qualsiasi piattaforma, ovvero Windows, Linux, macOS o altri sistemi operativi.

In questa sezione, utilizzeremo i comandi cURL per l’estrazione delle immagini in formato PNG e salveremo l’output su Cloud storage. Quindi, il primo passo è generare un JSON Web Token (JWT) eseguendo il seguente comando.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Ora, esegui il seguente comando per estrarre le immagini solo dalla terza pagina del documento PDF. Le immagini vengono estratte in formato PNG.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H  "Accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-d{}

Il file PDF di esempio utilizzato nell’esempio sopra può essere scaricato da URL2PDF.pdf.

Conclusione

In conclusione, l’estrazione di immagini da file PDF è una capacità preziosa che può essere ottenuta utilizzando sia Aspose.PDF Cloud SDK per Python che i comandi cURL. Sia che tu preferisca la praticità e la semplicità della programmazione Python o la versatilità dei comandi cURL, Aspose.PDF Cloud fornisce una solida API per realizzare questa attività. Sfruttando la potenza del cloud, puoi estrarre immagini da documenti PDF con facilità, migliorando il tuo flusso di lavoro. Tuttavia, con Aspose.PDF Cloud, hai la flessibilità di scegliere l’approccio più adatto alle tue esigenze e integrare senza problemi la funzionalità di estrazione delle immagini nei tuoi progetti.

Risorse utili

Articoli correlati

Ti consigliamo inoltre di visitare i seguenti link per saperne di più: