Slikovni PDF v PDF, po katerem je mogoče iskati

Pretvorite slikovni PDF v PDF, po katerem je mogoče iskati

V današnjem svetu, ki temelji na podatkih, so PDF-ji postali nepogrešljiv format za shranjevanje in skupno rabo dokumentov. Vseh datotek PDF pa ni mogoče preprosto iskati ali urejati, zlasti tistih, ki temeljijo na slikah. Pri delu z dokumenti je res težko kopirati/izvleči besedilne informacije za nadaljnjo manipulacijo. Na srečo lahko z močjo tehnologije optičnega prepoznavanja znakov (OCR) slikovne datoteke PDF z lahkoto pretvorite v datoteke PDF, po katerih je mogoče iskati. V tem tehničnem blogu bomo raziskali, kako pretvoriti PDF OCR v PDF z možnostjo iskanja z uporabo različnih tehnik, s posebnim poudarkom na API-ju REST. Razpravljali bomo tudi o tem, kako izvleči besedilo iz dokumentov PDF OCR, kar vam bo omogočilo celovito razumevanje, kako izkoristiti tehnologijo OCR za sprostitev polnega potenciala vaših dokumentov PDF.

OCR PDF z uporabo Java SDK

Aspose.PDF Cloud SDK for Java je zmogljiv API v oblaku, ki ponuja široko paleto funkcij in zmožnosti za delo z dokumenti PDF. Ena njegovih ključnih funkcij je zmožnost izvajanja OCR na PDF-jih, kar lahko močno poenostavi postopek ekstrahiranja besedila iz slikovnih PDF-jev in ustvarjanje PDF-jev, po katerih je mogoče iskati. S svojim uporabniku prijaznim vmesnikom in obsežno dokumentacijo ta SDK olajša avtomatizacijo postopka izvajanja OCR na PDF-jih, s čimer prihranite čas in povečate produktivnost.

Poleg tega je ta API, ki temelji na oblaku, zasnovan za obvladovanje najrazličnejših formatov vnosa in lahko celo prepozna ročno napisano besedilo, zaradi česar je odlična izbira za podjetja in razvijalce, ki želijo poenostaviti potek dela z dokumenti. Zdaj je prvi korak, da dodate njegovo referenco v projekt Java z dodajanjem naslednjih podrobnosti v pom.xml projekta maven build.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Če še nimate obstoječega računa, morate ustvariti brezplačen račun prek Aspose Cloud. Prijavite se z novo ustvarjenim računom in poiščite/ustvarite ID stranke in skrivnost stranke na Nadzorna plošča v oblaku. Te podrobnosti so obvezne v naslednjih razdelkih.

Skeniran PDF v PDF z možnostjo iskanja z uporabo Jave

V tem razdelku so razložene podrobnosti o pretvorbi skeniranega PDF-ja v PDF, po katerem je mogoče iskati, z uporabo odrezka kode Java. Upoštevajte, da Java Cloud SDK podpira prepoznavanje naslednjih jezikov: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra ali njihova kombinacija, npr. eng,rus.

  • Najprej moramo ustvariti objekt PdfApi, kjer posredujemo ClientID in skrivne podrobnosti odjemalca kot argumenta
  • Drugič, ustvarite primerek razreda File za nalaganje slikovnega PDF-ja
  • Tretjič, pokličite metodo uploadFile(…), da naložite vhodni PDF v shrambo v oblaku
  • Ker naš slikovni PDF vsebuje angleško besedilo, moramo ustvariti objekt niza z vrednostjo »eng«
  • Na koncu pokličite metodo putSearchableDocument(…), ki kot argumenta zahteva vhodni PDF in kodo jezika.

Ko je koda uspešno izvedena, se PDF, po katerem je mogoče iskati, shrani v shrambo v oblaku

try
    {
    // Pridobite ClientID in ClientSecret na https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi primerek
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // vhodna slika dokument PDF
    String name = "ScannedPDF.pdf";	        
	    			    
    // Naloži datoteko iz lokalnega sistema
    File file = new File(name);
    // naložite datoteko v shrambo v oblaku
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // jezike, uporabljene v slikovnem PDF-ju
    String lang = "eng";
	    				
    //  izvedite OCR na slikovnem dokumentu PDF
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // sporočilo o uspešnem tiskanju
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
Slikovni PDF v PDF, po katerem je mogoče iskati

Slika1: – Predogled PDF-ja po možnosti iskanja

Skeniran PDF, uporabljen v zgornjem primeru, je mogoče prenesti iz BusinessReport.pdf in dobljeni PDF, po katerem je mogoče iskati, iz Converted.pdf

OCR na spletu z ukazi cURL

Ukazi cURL so eden od priročnih pristopov za klicanje API-jev REST. V tem razdelku bomo torej uporabili ukaze cURL za OCR na spletu. Zdaj moramo kot predpogoj najprej ustvariti žeton dostopa JWT (na podlagi poverilnic odjemalca), medtem ko izvajamo naslednji ukaz.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Ko imamo žeton JWT, izvedite naslednji ukaz za izvedbo OCR v spletu in pretvorbo slike PDF v dokument PDF, po katerem je mogoče iskati. Nastala datoteka se nato shrani v shrambo v oblaku.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Zaključek

Izvajanje OCR na PDF-jih je kritičen postopek za sprostitev celotnega potenciala teh dokumentov. S pomočjo orodij za OCR v oblaku, kot je Aspose.PDF Cloud SDK za Javo, je mogoče ta postopek poenostaviti in avtomatizirati, s čimer prihranite čas in povečate produktivnost. Z izkoriščanjem moči OCR lahko podjetja in razvijalci pretvorijo slikovne PDF-je v PDF-je, po katerih je mogoče iskati, kar olajša iskanje, urejanje in skupno rabo. Jasno je, da ta API ponuja vrsto zmogljivih funkcij in zmožnosti za delo s PDF-ji. Če sledite navodilom po korakih v tem tehničnem spletnem dnevniku, lahko začnete z OCR v PDF-jih in svoj potek dela z dokumenti dvignete na višjo raven.

Razmislite o dostopu do API-ja v spletnem brskalniku z swagger vmesnikom. Poleg tega, ker so naši SDK-ji zgrajeni pod licenco MIT, lahko celotno izvorno kodo prenesete iz GitHub. Če med uporabo API-ja naletite na težave, nas kontaktirajte prek brezplačnega foruma za podporo izdelkom.

povezani članki

Zelo priporočamo, da obiščete naslednje povezave, če želite izvedeti več o: