Sviluppa un convertitore da PDF a Excel utilizzando Python Cloud SDK.

Come convertire PDF in Excel | Esportare PDF in Excel utilizzando Python SDK
I file PDF sono eccellenti per preservare la formattazione dei documenti, ma estrarre e utilizzare i dati da essi può essere complesso. È qui che diventa evidente la necessità di convertire PDF in Excel. La cartella di lavoro Excel, con il suo formato di foglio di calcolo, offre un modo strutturato per organizzare ed elaborare i dati. Immagina di estrarre senza problemi tabelle, figure e testo da un PDF e di averli ordinatamente disposti in celle Excel, pronti per l’analisi. Questa conversione non solo semplifica la gestione dei dati, ma migliora anche l’efficienza e la produttività.
Inoltre, Excel è utilizzato prevalentemente per archiviare e organizzare dati quali ricavi, buste paga e informazioni contabili. Consentono all’utente di effettuare calcoli con questi dati e produrre grafici e diagrammi. Ora in questo articolo, discuteremo i dettagli su come trasformare un PDF in formato Excel.
- Python Cloud SDK per l’elaborazione PDF
- Convertire PDF in Excel in Python
- Conversione da PDF a XLS tramite comando cURL
Python Cloud SDK per l’elaborazione PDF
Aspose.PDF Cloud SDK per Python emerge come un potente strumento per semplificare il processo di conversione da PDF a XLS. Non solo facilita la conversione “da PDF a Excel” senza soluzione di continuità, ma offre anche una miriade di altre capacità. Immagina di sfruttare la capacità di manipolare PDF, estrarre dati specifici e generare file pronti per Excel senza sforzo.
Il primo passo è installare Python Cloud SDK, disponibile per il download tramite il repository PIP e GitHub. Quindi, esegui il seguente comando sul terminale/prompt dei comandi per installare l’ultima versione di Cloud SDK.
pip install asposepdfcloud
Studio Visuale MS
Nel caso in cui tu abbia bisogno di aggiungere direttamente il riferimento nel tuo progetto Python all’interno di Visual Studio IDE, cerca asposepdfcloud come pacchetto nella finestra dell’ambiente Python. Segui i passaggi numerati nell’immagine sottostante per completare il processo di installazione.

Immagine 1:- Pacchetto Aspose.PDF Cloud SDK per Python.
PiCharm
PyCharm è un IDE popolare per lo sviluppo Python. In questa sezione, discuteremo le impostazioni di PyCharm sulla piattaforma Windows.
- Fare clic sul menu File e selezionare la voce di menu Impostazioni…

Immagine 2:- Voce di menu Impostazioni PyCharm.
- Espandere l’albero del progetto da sinistra e selezionare l’opzione Interprete Python.
- Fare clic sul segno + (più) nella sezione a destra e immettere asposepdfcloud nel campo di ricerca sopra la finestra di dialogo dei pacchetti disponibili.
- Ora fai clic sul pulsante Installa pacchetto.

Immagine 3: Pacchetto Aspose.PDF Cloud per Python.
Una volta installato l’SDK, viene visualizzato un messaggio di conferma dell’operazione.

Immagine 4:- Messaggio di successo una volta installato Aspose.PDF Cloud per Python.
- Nel caso in cui non avessi un account esistente su cloud dashboard, puoi creare un account gratuito utilizzando le credenziali GitHub o Google. Ora accedi alla dashboard e ottieni le tue credenziali cliente personalizzate.

Immagine 5: Credenziali del cliente nella dashboard di Aspose.Cloud.
Convertire PDF in Excel in Python
Seguire le istruzioni sottostanti per trasformare un PDF in una cartella di lavoro Excel (XLSX) utilizzando un frammento di codice Python. Si noti che i frammenti di codice seguenti prevedono che il PDF di input sia disponibile nell’archiviazione cloud.
- Per prima cosa, crea un’istanza della classe ApiClient fornendo Client ID e Client Secret come argomenti.
- In secondo luogo, creare un’istanza della classe PdfApi che accetta l’oggetto ApiClient come argomento.
- Specificare ora il nome del PDF di input e il nome del file XLSX risultante.
- Infine, chiama il metodo putpdfinstoragetoxlsx(..) che accetta il file PDF di input, il nome del file XLSX risultante e un parametro facoltativo per generare fogli di lavoro uniformi.
# Per altri esempi di codice, visita https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python
# Per le credenziali del cliente, visitare https://dashboard.aspose.cloud/
def pdf2xlsx():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# crea un'istanza di PdfApi passando PdfApiClient come argomento
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'awesomeTable.pdf'
# nome della cartella di lavoro Excel risultante
resultant_file_name = 'Resultant.xlsx'
# Chiama API per convertire PDF in formato Excel
response = pdf_api.put_pdf_in_storage_to_xlsx(name=input_file, out_path=resultant_file_name, uniform_worksheets='true')
# stampa messaggio nella console (facoltativo)
print('PDF successfully converted to Excel format !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))

Immagine 6: - Anteprima della conversione da PDF a Excel.
I file di esempio utilizzati nell’esempio sopra possono essere scaricati da awesomeTable.pdf e Resultant.xlsx.
Conversione da PDF a XLS tramite comando cURL
La trasformazione di PDF in XLS può essere facilmente realizzata utilizzando Aspose.PDF Cloud insieme ai comandi cURL, poiché rappresenta un approccio semplificato e automatizzato. Utilizzando i comandi cURL insieme ad Aspose.PDF Cloud, non solo semplifichiamo il processo di conversione, ma abilitiamo anche un’integrazione senza soluzione di continuità in vari flussi di lavoro.
Il primo passo di questo approccio è generare un JSON Web Token (JWT) basato sulle credenziali del client. Quindi, esegui il seguente comando per generare il token JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Una volta ottenuto il token JWT, eseguiamo il seguente comando per convertire il formato PDF in XLS.
curl -v "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/xlsx?outPath=Converted.xlsx&uniformWorksheets=true" \
-X PUT \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Conclusione
In conclusione, sia che si opti per il robusto Aspose.PDF Cloud SDK per Python o che si utilizzino i comandi cURL insieme ad Aspose.PDF Cloud, possiamo facilmente raggiungere il nostro obiettivo di trasformare il PDF in formato Excel. Aspose.PDF Cloud SDK per Python offre una soluzione completa e adatta agli sviluppatori, che ti fornisce una serie di funzionalità oltre alla conversione. D’altro canto, sfruttare i comandi cURL fornisce un approccio versatile e programmabile. Indipendentemente dal metodo scelto, entrambi gli approcci si presentano come strumenti potenti, che rivoluzionano il modo in cui strutturiamo ed estraiamo i dati dai PDF.
- In caso di problemi durante l’utilizzo di Python Cloud SDK, non esitate a contattarci tramite il forum di assistenza clienti gratuito.
Articoli correlati
Ti consigliamo di leggere i seguenti articoli per saperne di più: