pdf in html

Scopri come convertire PDF in HTML usando Python

Nel frenetico mondo digitale di oggi, l’accessibilità dei documenti è una considerazione fondamentale per le aziende e per i privati. La necessità di convertire i documenti PDF in HTML non è mai stata così evidente. Sebbene i file PDF siano eccellenti per preservare la formattazione dei documenti, potrebbe risultare scomodo lavorarci sul Web. Spesso non hanno l’interattività e l’adattabilità richieste per le moderne esperienze online. È qui che entra in gioco la Python REST API per colmare il divario. Questo articolo esplora la crescente domanda di conversione da PDF a HTML e come la Python REST API può rivoluzionare questo processo.

API REST Python per la conversione da PDF a HTML

Convertire documenti PDF in formato HTML è un compito reso semplice ed efficiente con Aspose.PDF Cloud SDK per Python. Questo potente SDK fornisce una serie di funzionalità per affrontare le sfide della conversione da PDF a HTML senza problemi. Sia che tu debba presentare i tuoi documenti sul web, condividere contenuti su diverse piattaforme o migliorare l’accessibilità dei documenti, Aspose.PDF Cloud ha tutto ciò che ti serve.

Python Cloud SDK è in grado di creare, modificare o trasformare file PDF in vari formati, tra cui EPUB, PS, SVG, XLSX, PPTX, DOCX, HTML.

L’SDK è disponibile per il download tramite il repository PIP e GitHub. Ora esegui il seguente comando sul terminale/prompt dei comandi per installare l’ultima versione dell’SDK sul sistema.

pip install asposepdfcloud

Nel caso in cui tu abbia bisogno di aggiungere direttamente il riferimento nel tuo progetto Python all’interno di Visual Studio IDE, cerca asposepdfcloud come pacchetto nella finestra dell’ambiente Python. Segui i passaggi numerati nell’immagine sottostante per completare il processo di installazione.

API pdftohtml

Immagine 1: API di conversione da PDF a HTML.

Convertire PDF in HTML in Python

Per convertire un PDF in formato HTML, seguire le istruzioni riportate di seguito.

  • Per prima cosa, crea un’istanza della classe ApiClient passando ClinetID e i dettagli segreti del client come argomenti.
  • In secondo luogo, creiamo un oggetto PdfApi a cui passiamo l’oggetto ApiClient come argomento.
  • In terzo luogo, specificare il nome del PDF di input e l’output risultante.
  • Infine, chiama il metodo putpdfinstoragetohtml(…) della classe PdfApi, per avviare la conversione. L’output viene archiviato nel cloud storage.
# per esempi di codice completi, visita https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-python

import asposepdfcloud
import asposepdfcloud.models
import asposepdfcloud.api_client
from asposepdfcloud import PdfApi

def pdf2html():
    try:
        #initialize PdfApi client instance using ClientID and ClientSecret
        pdf_api_client = asposepdfcloud.api_client.ApiClient("406b404b2df649611e508bbcfcd2a77f", "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5")

        # crea un'istanza di PdfApi passando PdfApiClient come argomento
        pdf_api = PdfApi(pdf_api_client)

        # Documento PDF di origine
        input_file_name = 'completeWorkbook.pdf'

        # nome del file risultante
        resultant_file_name = 'CodeConversion.zip'
    
        # Chiama l'API per eseguire la conversione
        # abbiamo impostato il formato di output come zip e il tipo di documento come xhtml
        response = pdf_api.put_pdf_in_storage_to_html(input_file_name,fixed_layout='true', split_into_pages='false', document_type='Xhtml', output_format='zip',out_path=resultant_file_name)

        # stampa messaggio nella console (facoltativo)
        print('PDF successfully converted to HTML format !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))

PDF in HTML tramite comando cURL

In alternativa, la conversione da PDF a HTML può essere semplificata anche utilizzando i comandi cURL in combinazione con Aspose.PDF Cloud. Questo approccio fornisce un modo conveniente per sfruttare le capacità di Aspose.PDF Cloud per le tue esigenze di conversione da PDF a HTML. Questo approccio si adatta meglio alle tue esigenze, quando cerchi un approccio indipendente dalla piattaforma e dal linguaggio, per implementare un processo di conversione da PDF a HTML senza soluzione di continuità.

Per prima cosa dobbiamo generare un token di accesso JWT basato sulle credenziali del client. Esegui il seguente comando per generare il token JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Una volta ottenuto il token JWT, possiamo eseguire il seguente comando per convertire un file PDF disponibile nell’archiviazione Cloud in formato HTML e, di conseguenza, l’output viene restituito come risposta in streaming.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/awesomeTable.pdf/convert/html?documentType=Xhtml&fixedLayout=true&splitCssIntoPages=false&splitIntoPages=false&fontSavingMode=AlwaysSaveAsTTF" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o .\Documents\PDFConversion.zip

Se hai bisogno di convertire il file PDF in HTML e vuoi anche salvare l’output nel cloud, prova a usare il seguente comando.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/completeWorkbook.pdf/convert/html?outPath=converted.html&fixedLayout=true&splitIntoPages=false&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"
Anteprima da PDF a HTML

Immagine 2: - Anteprima della conversione da PDF a HTML.

Conclusione

In conclusione, il passaggio da PDF a HTML non è mai stato così fluido. Abbiamo esplorato la potenza di trasformazione delle API REST Python e l’efficienza di Aspose.PDF Cloud con i comandi cURL nella conversione dei tuoi documenti PDF in HTML dinamico e pronto per il web. Questi metodi non solo garantiscono l’integrità del documento, ma migliorano anche l’accessibilità e la condivisibilità. Quindi, è il momento di rendere i tuoi contenuti accessibili a un pubblico più ampio e di elevare la tua presenza online.

In caso di problemi durante l’utilizzo dell’API o per ulteriori domande, non esitate a contattarci tramite il forum di supporto prodotto gratuito.

Articoli correlati

Consigliamo vivamente di visitare i seguenti link per saperne di più: