Pura PDF-kuvia

PDF-kuvien purkaminen Cloud Java -palvelun avulla

Käytämme säännöllisesti PDF-tiedostoja, koska ne tarjoavat hämmästyttävän tuen teksti- ja kuvasisällölle. Kun nämä elementit on sijoitettu asiakirjaan, tiedoston asettelu säilyy riippumatta siitä, mitä alustaa käytät niiden katseluun. Meillä voi kuitenkin olla vaatimus PDF-kuvien purkamisesta. Tämä voidaan suorittaa PDF-katseluohjelmalla, mutta sinun on kuljetettava jokainen sivu manuaalisesti ja tallennettava jokainen kuva erikseen. Lisäksi toisessa skenaariossa, jos sinulla on kuvapohjainen PDF ja sinun on suoritettava PDF-tekstintunnistus, sinun on ensin purettava kaikki kuvat ja suoritettava sitten OCR-toiminto. Tämä on todella vaikeaa, kun sinulla on suuri joukko asiakirjoja, mutta ohjelmallinen ratkaisu voi olla luotettava ja nopea ratkaisu. Joten tässä artikkelissa aiomme tutkia vaihtoehtoja kuvien purkamiseen PDF-tiedostosta Java Cloud SDK:n avulla

PDF to JPG Conversion API

Aspose.PDF Cloud SDK for Java on hämmästyttävä valinta PDF-tiedoston muuntamiseksi JPG-muotoon tai JPG:n PDF-muotoon Java-sovelluksessa. Samalla sen avulla voit myös poimia kuvia PDF-tiedostosta, poimia tekstiä PDF-tiedostosta, poimia liitteitä PDF-tiedostosta sekä tarjoaa lukuisia vaihtoehtoja PDF-käsittelyyn. Joten jotta voimme ottaa käyttöön ominaisuuden PDF-kuvien tallentamiseen Java-sovelluksessa, meidän on ensin lisättävä Cloud SDK -viite projektiimme. Joten lisää seuraavat tiedot maven build -tyyppisen projektin pom.xml-tiedostoon.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Kun SDK-viite on lisätty ja sinulla ei ole Aspose Cloudin -tiliä, luo ilmainen tili käyttämällä kelvollista sähköpostiosoitetta. Kirjaudu sitten sisään äskettäin luodulla tilillä ja etsi/luo asiakastunnus ja asiakassalaisuus osoitteessa Cloud Dashboard. Näitä tietoja tarvitaan todennustarkoituksiin seuraavissa osissa.

Pura PDF-kuvia Javassa

Noudata alla annettuja ohjeita kuvien purkamiseksi PDF-tiedostosta, ja kun toiminto on valmis, kuvat tallennetaan erilliseen kansioon pilvitallennustilassa.

  • Ensin meidän on luotava PdfApi-objekti ja annettava ClientID ja Client Secret argumenteiksi
  • Toiseksi lataa syöttö PDF-tiedosto käyttämällä Tiedosto-instanssia
  • Lataa syötetty PDF pilvitallennustilaan käyttämällä uploadFile(…) -menetelmää
  • Aiomme myös käyttää valinnaista parametria poimittujen kuvien korkeus- ja leveystietojen asettamiseen
  • Kutsu lopuksi putImagesExtractAsJpeg(…)-menetelmä, joka ottaa syötteen PDF-nimen, sivunumeron kuvien poimimiseen, purettujen kuvien mitat ja kansion nimen pilvitallennustilassa poimittujen kuvien tallentamiseksi.
try
    {
    // Hanki ClientID ja ClientSecret osoitteesta https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // luo PdfApi-esiintymä
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);

    // syötettävän PDF-dokumentin nimi
    String inputFile = "marketing.pdf";

    // lue syötetyn PDF-tiedoston sisältö
    File file = new File("//Users//"+inputFile);
	    
    // lataa PDF pilvitallennustilaan
    pdfApi.uploadFile("input.pdf", file, null);

    // PDF-sivu kuvien purkamiseksi
    int pageNumber =1;

    // leveys poimittuja kuvia varten
    int width = 600;
    // poimittujen kuvien korkeus
    int height = 800;
	    
    // kansio purettujen kuvien tallentamiseen
    String folderName = "NewFolder";
	       
    // Pura PDF-kuvia ja tallenna pilvitallennustilaan
    pdfApi.putImagesExtractAsJpeg(inputFile, pageNumber, width, height, null, null, folderName);
	    
    // tulosta menestysviesti
    System.out.println("PDF images Successsuly extracted !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
Pura PDF-kuvien esikatselu

Kuva1: - Pura PDF-kuvien esikatselu

Yllä olevassa esimerkissä käytetty PDF-mallitiedosto voidaan ladata osoitteesta input.pdf.

Tallenna PDF-kuvat cURL-komentojen avulla

Nyt aiomme kutsua API:ta PDF-kuvien purkamiseen käyttämällä cURL-komentoja. Tämän lähestymistavan ennakkoedellytyksenä meidän on ensin luotava JWT-käyttöoikeustunnus (perustuu asiakkaan tunnistetietoihin) samalla kun suoritamme seuraavan komennon.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Kun meillä on JWT-tunnus, suorita seuraava komento tallentaaksesi PDF-kuvat erilliseen kansioon pilvitallennustilaan.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/input_file.pdf/pages/1/images/extract/jpeg?width=0&height=0&destFolder=NewFolder" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Johtopäätös

Luettuasi tämän artikkelin olet oppinut yksinkertaisen mutta luotettavan tavan poimia PDF-kuvia Java-koodinpätkän ja cURL-komentojen avulla. Kuten olemme huomanneet, saamme vipuvaikutuksen kuvien poimimiseen PDF-tiedoston määritetyltä sivulta, ja se tarjoaa paremman hallinnan purkuprosessiin. Tuote Dokumentaatio on rikastettu joukolla hämmästyttäviä aiheita, jotka selittävät tarkemmin tämän API:n ominaisuuksia.

Koska kaikki Cloud SDK:mme on julkaistu MIT-lisenssillä, voit myös ladata täydellisen lähdekoodin GitHubista ja muokata sitä tarpeidesi mukaan. Jos sinulla on ongelmia, voit ottaa meihin yhteyttä saadaksesi nopean ratkaisun ilmaisen tuotetukifoorumin kautta.

Aiheeseen liittyvät artikkelit

Saat lisätietoja seuraavista linkeistä: