PDF naar HTML-converter

Converteer PDF naar HTML met behulp van Java

Een van de defacto standaarden voor het delen van informatie en gegevens via internet is PDF. De reden voor zijn populariteit is dat het de lay-out en getrouwheid van het document behoudt wanneer het op elk platform wordt bekeken, inclusief desktop of mobiel. Om deze bestanden te bekijken, moet u echter de PDF-viewertoepassing gebruiken. Een eenvoudige oplossing is echter om PDF naar HTML te converteren en de HTML eenvoudig in de webbrowser te laden. Dus in dit artikel gaan we de details verder bespreken over het ontwikkelen van een PDF naar HTML-converter met behulp van REST API.

SXC naar Excel-conversie-API

Probeer Aspose.PDF Cloud SDK for Java om PDF-bestanden te maken, manipuleren en transformeren naar andere formaten. Om de SDK te kunnen gebruiken, voegt u de volgende informatie toe in pom.xml van het maven build-type project.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Nu Aspose.PDF Cloud SDK voor Java-referentie is toegevoegd aan uw project, is de volgende stap het maken van een gratis account via Aspose Cloud. Log in met een nieuw aangemaakt account en zoek/maak Client ID en Client Secret op bij Cloud Dashboard. Deze details zijn vereist in volgende secties.

PDF naar HTML-converter in Java

Laten we de details bespreken over het ontwikkelen van een PDF naar HTML-converter met behulp van Java Cloud SDK. Houd er rekening mee dat in het volgende codefragment zeer basale parameters worden gebruikt tijdens de conversie, maar we raden u ten zeerste aan om de sectie API-referentie te bezoeken voor de lijst met alle ondersteunde parameters en hun bijbehorende beschrijving.

  • Eerst moeten we een PdfApi-object maken terwijl we ClientID en Client-geheim als argumenten opgeven
  • Ten tweede laadt u het ingevoerde PDF-bestand met behulp van File instance
  • Ten derde, upload de invoer-PDF naar cloudopslag met behulp van de uploadFile(…)-methode
  • Omdat we alleen de tweede pagina van de PDF hoeven te converteren, geven we de waarde van de tweede pagina in het List-object
  • Roep nu de methode putPdfInStorageToHtml(…) aan die invoer-PDF, de naam van de resulterende HTML en verschillende andere conversieparameters vereist
try
    {
    // Haal ClientID en ClientSecret op van https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // maak een instantie van PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
 
    // naam van het ingevoerde PDF-document 
    String inputFile = "PdfWithScreenAnnotations.pdf";
    // naam van het resulterende HTML-bestand
    String resultantImage = "Resultant.html";
	  
    // lees de inhoud van het ingevoerde PDF-bestand
    File file = new File("//Users//"+inputFile);
	    
    // upload PDF naar cloudopslag
    pdfApi.uploadFile("input.pdf", file, null);
	       
    // lijst met PDF-pagina's die moeten worden geconverteerd
    List<Integer> list = new ArrayList<Integer>();
    //lijst.toevoegen(1);
    list.add(2);  // only convert second page of PDF
	    
    // bel de API voor conversie van PDF naar HTML
    pdfApi.putPdfInStorageToHtml("input.pdf",resultant,null,null,null, null, "Html5",false, null, 
	null, null, false, false, null, null,null, list, null,
	"AlwaysSaveAsTTF",null,null,null,"EmbedAllIntoHtml","AsEmbeddedPartsOfPngPageBackground",
	null, null, null, null, null, null, null, null, null, "Zip");
	    
    // succesbericht afdrukken
    System.out.println("PDF to HTML Successsul !");
    }catch(Exception ex)
    {
	System.out.println(ex);
    }
PDF naar HTML-converter

Image1:- PDF naar HTML-conversievoorbeeld

Het voorbeeld-pdf-bestand dat in het bovenstaande voorbeeld wordt gebruikt, kan worden gedownload van PdfWithScreenAnnotations.pdf

Converteer PDF naar HTML met behulp van cURL-opdrachten

De cURL-opdrachten zijn ook een van de handige manieren om toegang te krijgen tot REST API’s via de opdrachtregelterminal. Nu is de eerste vereiste voor deze aanpak het genereren van een JWT-toegangstoken (op basis van clientreferenties) terwijl de volgende opdracht wordt uitgevoerd.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Zodra we het JWT-token hebben, moeten we de volgende opdracht uitvoeren om PDF naar HTML te converteren. De resulterende HTML wordt opgeslagen als Zip-archief op cloudopslag.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/input.pdf/convert/html?outPath=resultant.zip&documentType=Html5&fixedLayout=false&splitCssIntoPages=false&splitIntoPages=false&explicitListOfSavedPages=2&fontSavingMode=AlwaysSaveAsTTF&partsEmbeddingMode=EmbedAllIntoHtml&rasterImagesSavingMode=AsEmbeddedPartsOfPngPageBackground&outputFormat=Zip" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Conclusie

We hebben de stappen geleerd om een PDF naar HTML-converter te ontwikkelen met Java Cloud SDK. Dus ofwel kunnen we het Jave-codefragment gebruiken om PDF naar HTML te converteren, of we kunnen de cULR-opdrachten gebruiken om PDF naar HTML5 te converteren. Als u wijzigingen wilt aanbrengen in de broncode van Java Cloud SDK, kunt u de volledige broncode downloaden van GitHub. U kunt overwegen ons te benaderen voor een snelle oplossing van problemen via het gratis productondersteuningsforum.

gerelateerde artikelen

We raden u ten zeerste aan de volgende links te bezoeken voor meer informatie over: