Ekstrakt PDF slika

Kako izdvojiti PDF slike koristeći Cloud Java

Redovno koristimo PDF fajlove jer pružaju nevjerovatnu podršku za tekstualni i slikovni sadržaj. Nakon što su ovi elementi postavljeni unutar dokumenta, izgled datoteke je sačuvan bez obzira koju platformu koristite za njihovo pregledavanje. Ali, možda imamo zahtjev da izdvojimo PDF slike. Ovo se može postići pomoću aplikacije za pregled PDF-a, ali morate ručno proći kroz svaku stranicu i pojedinačno spremiti svaku sliku. Nadalje, u drugom scenariju, ako imate PDF baziran na slici i trebate izvršiti PDF OCR, tada prvo morate izdvojiti sve slike, a zatim izvršiti operaciju OCR. Ovo postaje zaista teško kada imate veliki skup dokumenata, ali programsko rješenje može biti pouzdano i brzo rješenje. Dakle, u ovom članku ćemo istražiti opcije za izdvajanje slika iz PDF-a pomoću Java Cloud SDK

API za pretvaranje PDF u JPG

Da biste pretvorili PDF u JPG ili JPG u PDF u Java aplikaciji, Aspose.PDF Cloud SDK za Javu je nevjerovatan izbor. U isto vrijeme, također vam omogućava da izvučete slike iz PDF-a, izvučete tekst iz PDF-a, izvučete priloge iz PDF-a, kao i pruža mnoštvo opcija za manipulaciju PDF-om. Dakle, da bismo implementirali funkciju za spremanje PDF slika u Java aplikaciji, prvo moramo dodati Cloud SDK referencu u naš projekat. Stoga, molimo dodajte sljedeće detalje u pom.xml projekta tipa maven build.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Kada se doda SDK referenca i nemate nijedan postojeći nalog preko Aspose Cloud, kreirajte besplatan nalog koristeći važeću adresu e-pošte. Zatim se prijavite koristeći novokreirani nalog i potražite/kreirajte ID klijenta i Client Secret na Cloud Dashboard. Ovi detalji su potrebni za potrebe provjere autentičnosti u sljedećim odjeljcima.

Ekstrakt PDF slika u Javi

Molimo slijedite dolje navedene korake da biste izdvojili slike iz PDF-a i kada se operacija završi, slike se pohranjuju u posebnu mapu na Cloud memoriji.

  • Prvo trebamo kreirati PdfApi objekat dok pružamo ClientID i Client secret kao argumente
  • Drugo, učitajte ulaznu PDF datoteku koristeći instancu datoteke
  • Prenesite ulazni PDF u pohranu u oblaku koristeći metodu uploadFile(…).
  • Također ćemo koristiti opcioni parametar za postavljanje detalja o visini i širini za ekstrahovane slike
  • Konačno pozovite metodu putImagesExtractAsJpeg(…) koja uzima ulazni naziv PDF-a, PageNumber za izdvajanje slika, dimenzije ekstrahovanih slika i naziv foldera na Cloud memoriji za spremanje ekstrahiranih slika
try
    {
    // Preuzmite ClientID i ClientSecret sa https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // kreirajte instancu PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);

    // naziv ulaznog PDF dokumenta
    String inputFile = "marketing.pdf";

    // pročitajte sadržaj ulazne PDF datoteke
    File file = new File("//Users//"+inputFile);
	    
    // otpremite PDF u pohranu u oblaku
    pdfApi.uploadFile("input.pdf", file, null);

    // Stranica u PDF-u za izdvajanje slika
    int pageNumber =1;

    // širina za ekstrahovane slike
    int width = 600;
    // visina ekstrahovanih slika
    int height = 800;
	    
    // folder za čuvanje ekstrahovanih slika
    String folderName = "NewFolder";
	       
    // Izvucite PDF slike i spremite ih na Cloud Storage
    pdfApi.putImagesExtractAsJpeg(inputFile, pageNumber, width, height, null, null, folderName);
	    
    // odštampati poruku o uspjehu
    System.out.println("PDF images Successsuly extracted !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
Pregled ekstrahiranja PDF slika

Slika 1:- Izvucite pregled PDF slika

Primjer PDF datoteke korišten u gornjem primjeru može se preuzeti sa input.pdf.

Sačuvajte PDF slike koristeći cURL komande

Sada ćemo pozvati API za ekstrakciju PDF slika pomoću cURL naredbi. Sada, kao preduvjet za ovaj pristup, prvo moramo generirati JWT pristupni token (na osnovu akreditiva klijenta) dok izvršavamo sljedeću naredbu.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Kada dobijemo JWT token, izvršite sljedeću naredbu za spremanje PDF slika u posebnu mapu preko Cloud memorije.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/input_file.pdf/pages/1/images/extract/jpeg?width=0&height=0&destFolder=NewFolder" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Zaključak

Nakon što ste pročitali ovaj članak, naučili ste jednostavan, ali pouzdan pristup za izdvajanje PDF slika pomoću isječka Java koda, kao i putem cURL komandi. Kao što smo primijetili, dobijamo polugu za izdvajanje slika sa određene stranice PDF datoteke i pružamo veću kontrolu nad procesom ekstrakcije. Proizvod Dokumentacija obogaćen je nizom nevjerovatnih tema koje dodatno objašnjavaju mogućnosti ovog API-ja.

Također, kako su svi naši Cloud SDK-ovi objavljeni pod MIT licencom, možete razmotriti preuzimanje kompletnog izvornog koda sa GitHub i modificirati ga prema vašim zahtjevima. U slučaju bilo kakvih problema, možete razmisliti da nam se obratite za brzo rješenje putem besplatnog foruma za podršku proizvoda.

povezani članci

Posjetite sljedeće linkove da saznate više o: