Käytämme säännöllisesti PDF-tiedostoja, koska ne tarjoavat hämmästyttävän tuen teksti- ja kuvasisällölle. Kun nämä elementit on sijoitettu asiakirjaan, tiedoston asettelu säilyy riippumatta siitä, mitä alustaa käytät niiden katseluun. Meillä voi kuitenkin olla vaatimus PDF-kuvien purkamisesta. Tämä voidaan suorittaa PDF-katseluohjelmalla, mutta sinun on kuljetettava jokainen sivu manuaalisesti ja tallennettava jokainen kuva erikseen. Lisäksi toisessa skenaariossa, jos sinulla on kuvapohjainen PDF ja sinun on suoritettava PDF-tekstintunnistus, sinun on ensin purettava kaikki kuvat ja suoritettava sitten OCR-toiminto. Tämä on todella vaikeaa, kun sinulla on suuri joukko asiakirjoja, mutta ohjelmallinen ratkaisu voi olla luotettava ja nopea ratkaisu. Joten tässä artikkelissa aiomme tutkia vaihtoehtoja kuvien purkamiseen PDF-tiedostosta Java Cloud SDK:n avulla
PDF to JPG Conversion API
Aspose.PDF Cloud SDK for Java on hämmästyttävä valinta PDF-tiedoston muuntamiseksi JPG-muotoon tai JPG:n PDF-muotoon Java-sovelluksessa. Samalla sen avulla voit myös poimia kuvia PDF-tiedostosta, poimia tekstiä PDF-tiedostosta, poimia liitteitä PDF-tiedostosta sekä tarjoaa lukuisia vaihtoehtoja PDF-käsittelyyn. Joten jotta voimme ottaa käyttöön ominaisuuden PDF-kuvien tallentamiseen Java-sovelluksessa, meidän on ensin lisättävä Cloud SDK -viite projektiimme. Joten lisää seuraavat tiedot maven build -tyyppisen projektin pom.xml-tiedostoon.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Kun SDK-viite on lisätty ja sinulla ei ole Aspose Cloudin -tiliä, luo ilmainen tili käyttämällä kelvollista sähköpostiosoitetta. Kirjaudu sitten sisään äskettäin luodulla tilillä ja etsi/luo asiakastunnus ja asiakassalaisuus osoitteessa Cloud Dashboard. Näitä tietoja tarvitaan todennustarkoituksiin seuraavissa osissa.
Pura PDF-kuvia Javassa
Noudata alla annettuja ohjeita kuvien purkamiseksi PDF-tiedostosta, ja kun toiminto on valmis, kuvat tallennetaan erilliseen kansioon pilvitallennustilassa.
- Ensin meidän on luotava PdfApi-objekti ja annettava ClientID ja Client Secret argumenteiksi
- Toiseksi lataa syöttö PDF-tiedosto käyttämällä Tiedosto-instanssia
- Lataa syötetty PDF pilvitallennustilaan käyttämällä uploadFile(…) -menetelmää
- Aiomme myös käyttää valinnaista parametria poimittujen kuvien korkeus- ja leveystietojen asettamiseen
- Kutsu lopuksi putImagesExtractAsJpeg(…)-menetelmä, joka ottaa syötteen PDF-nimen, sivunumeron kuvien poimimiseen, purettujen kuvien mitat ja kansion nimen pilvitallennustilassa poimittujen kuvien tallentamiseksi.
try
{
// Hanki ClientID ja ClientSecret osoitteesta https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// luo PdfApi-esiintymä
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// syötettävän PDF-dokumentin nimi
String inputFile = "marketing.pdf";
// lue syötetyn PDF-tiedoston sisältö
File file = new File("//Users//"+inputFile);
// lataa PDF pilvitallennustilaan
pdfApi.uploadFile("input.pdf", file, null);
// PDF-sivu kuvien purkamiseksi
int pageNumber =1;
// leveys poimittuja kuvia varten
int width = 600;
// poimittujen kuvien korkeus
int height = 800;
// kansio purettujen kuvien tallentamiseen
String folderName = "NewFolder";
// Pura PDF-kuvia ja tallenna pilvitallennustilaan
pdfApi.putImagesExtractAsJpeg(inputFile, pageNumber, width, height, null, null, folderName);
// tulosta menestysviesti
System.out.println("PDF images Successsuly extracted !");
}catch(Exception ex)
{
System.out.println(ex);
}
Yllä olevassa esimerkissä käytetty PDF-mallitiedosto voidaan ladata osoitteesta input.pdf.
Tallenna PDF-kuvat cURL-komentojen avulla
Nyt aiomme kutsua API:ta PDF-kuvien purkamiseen käyttämällä cURL-komentoja. Tämän lähestymistavan ennakkoedellytyksenä meidän on ensin luotava JWT-käyttöoikeustunnus (perustuu asiakkaan tunnistetietoihin) samalla kun suoritamme seuraavan komennon.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Kun meillä on JWT-tunnus, suorita seuraava komento tallentaaksesi PDF-kuvat erilliseen kansioon pilvitallennustilaan.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/input_file.pdf/pages/1/images/extract/jpeg?width=0&height=0&destFolder=NewFolder" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Johtopäätös
Luettuasi tämän artikkelin olet oppinut yksinkertaisen mutta luotettavan tavan poimia PDF-kuvia Java-koodinpätkän ja cURL-komentojen avulla. Kuten olemme huomanneet, saamme vipuvaikutuksen kuvien poimimiseen PDF-tiedoston määritetyltä sivulta, ja se tarjoaa paremman hallinnan purkuprosessiin. Tuote Dokumentaatio on rikastettu joukolla hämmästyttäviä aiheita, jotka selittävät tarkemmin tämän API:n ominaisuuksia.
Koska kaikki Cloud SDK:mme on julkaistu MIT-lisenssillä, voit myös ladata täydellisen lähdekoodin GitHubista ja muokata sitä tarpeidesi mukaan. Jos sinulla on ongelmia, voit ottaa meihin yhteyttä saadaksesi nopean ratkaisun ilmaisen tuotetukifoorumin kautta.
Aiheeseen liittyvät artikkelit
Saat lisätietoja seuraavista linkeistä: