PDF tal-immaġni għal PDF li jista' jitfittex

Ikkonverti l-Immaġini PDF għal PDF li jista ‘jitfittex

Fid-dinja tal-lum immexxija mid-data, PDFs saru format indispensabbli għall-ħażna u l-kondiviżjoni tad-dokumenti. Madankollu, mhux il-PDFs kollha jistgħu jiġu mfittxija jew editjati faċilment, speċjalment dawk li huma bbażati fuq l-immaġini. Meta tkun qed tittratta dokumenti, huwa verament diffiċli li tikkopja/tiġbed kwalunkwe informazzjoni testwali għal aktar manipulazzjoni. Fortunatament, bil-qawwa tat-teknoloġija tar-Rikonoxximent tal-Karattri Ottiċi (OCR), tista ’tikkonverti PDFs tal-immaġni fi PDFs li jistgħu jitfittxu bil-faċilità. F’dan il-blog tekniku, aħna se nesploraw kif tikkonverti OCR PDF għal PDF li jista ‘jitfittex billi tuża diversi tekniki, b’fokus speċifiku fuq REST API. Se niddiskutu wkoll kif tiġbed it-test minn PDFs OCR, li jagħtik fehim komprensiv ta ‘kif tisfrutta t-teknoloġija OCR biex nisfruttaw il-potenzjal sħiħ tad-dokumenti PDF tiegħek.

OCR PDF bl-użu ta’ Java SDK

Aspose.PDF Cloud SDK għal Java hija API qawwija bbażata fuq cloud li toffri firxa wiesgħa ta’ karatteristiċi u kapaċitajiet biex taħdem ma’ dokumenti PDF. Waħda mill-funzjonalitajiet ewlenin tagħha hija l-abbiltà li twettaq OCR fuq PDFs, li tista ’tissimplifika bil-kbir il-proċess ta’ estrazzjoni ta ’test minn PDFs ibbażati fuq immaġni u toħloq PDFs li jistgħu jitfittxu. Bl-interface faċli għall-utent u d-dokumentazzjoni komprensiva tiegħu, dan l-SDK jagħmilha faċli biex jiġi awtomatizzat il-proċess tat-twettiq tal-OCR fuq PDFs, jiffranka l-ħin u tiżdied il-produttività.

Barra minn hekk, Din l-API bbażata fuq il-cloud hija mfassla biex timmaniġġja varjetà wiesgħa ta ‘formati ta’ input u tista ‘saħansitra tirrikonoxxi test miktub bl-idejn, li jagħmilha għażla eċċellenti għan-negozji u l-iżviluppaturi li qed ifittxu li jissimplifikaw il-fluss tax-xogħol tad-dokumenti tagħhom. Issa l-ewwel pass huwa li żżid ir-referenza tagħha fil-proġett Java billi żżid id-dettalji li ġejjin f’pom.xml tal-proġett tal-bini maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Jekk m’għandekx kont eżistenti, trid toħloq kont b’xejn fuq Aspose Cloud. Idħol billi tuża kont maħluq ġdid u fittex/oħloq Client ID u Client Secret fi Cloud Dashboard. Dawn id-dettalji huma meħtieġa fit-taqsimiet sussegwenti.

PDF skannjat għal PDF li jista’ jitfittex bl-użu ta’ Java

Din it-taqsima tispjega d-dettalji dwar kif tikkonverti PDF skannjat għal PDF Fittex bl-użu ta’ snippet tal-kodiċi Java. Jekk jogħġbok innota li Java Cloud SDK jappoġġja r-rikonoxximent tal-lingwi li ġejjin: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , lanqas, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra jew il-kombinazzjoni tagħhom eż. eng,rus.

  • L-ewwel irridu noħolqu oġġett ta ‘PdfApi, fejn ngħaddu dettalji sigrieti ClientID u Klijent bħala argumenti
  • It-tieni, oħloq eżempju tal-klassi File biex tagħbija l-Immaġini PDF
  • It-tielet, sejjaħ il-metodu uploadFile(…) biex ittella’ l-input PDF fil-ħażna tas-sħab
  • Peress li l-immaġni PDF tagħna fiha test bl-Ingliż, għalhekk irridu noħolqu oġġett string li jkollu valur “eng”
  • Fl-aħħarnett, sejjaħ il-metodu putSearchableDocument(…), li jeħtieġ PDF input u kodiċi tal-lingwa bħala argumenti.

Ladarba l-kodiċi jiġi esegwit b’suċċess, il-PDF li jista ‘jitfittex jinħażen fil-ħażna tas-sħab

try
    {
    // Ikseb ClientID u ClientSecret minn https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi istanza
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // immaġni tal-input tad-dokument PDF
    String name = "ScannedPDF.pdf";	        
	    			    
    // Tagħbija l-fajl mis-sistema lokali
    File file = new File(name);
    // ittella l-fajl fil-ħażna sħaba
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // il-lingwi użati fl-immaġini PDF
    String lang = "eng";
	    				
    //  wettaq l-OCR fuq id-dokument PDF tal-immaġni
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // istampa messaġġ ta' suċċess
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
PDF tal-immaġni għal PDF li jista' jitfittex

Image1:- Preview PDF li jista’ jitfittex

Il-PDF skannjat użat fl-eżempju ta’ hawn fuq jista’ jitniżżel minn BusinessReport.pdf u l-PDF li jista’ jitfittex li jirriżulta minn Converted.pdf

OCR Online bl-użu ta’ Kmandi tal-cURL

Il-kmandi tal-cURL huma wieħed mill-approċċi konvenjenti biex issejjaħ l-API REST. Allura f’din it-taqsima, se nużaw il-kmandi tal-cURL għall-OCR onlajn. Issa, bħala prerekwiżit, jeħtieġ li l-ewwel niġġeneraw token ta ‘aċċess JWT (ibbażat fuq il-kredenzjali tal-klijent) waqt li nwettqu l-kmand li ġej.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Ladarba jkollna token JWT, jekk jogħġbok il-kmand li ġej biex twettaq OCR onlajn u tikkonverti Image PDF f’dokument PDF li jista ‘jitfittex. Il-fajl li jirriżulta mbagħad jinħażen fil-ħażna tas-sħab.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Konklużjoni

It-twettiq tal-OCR fuq PDFs huwa proċess kritiku biex jinfetaħ il-potenzjal sħiħ ta ‘dawn id-dokumenti. Bl-għajnuna ta ‘għodod OCR ibbażati fuq sħab bħal Aspose.PDF Cloud SDK għal Java, dan il-proċess jista’ jiġi ssimplifikat u awtomatizzat, jiffranka l-ħin u jżid il-produttività. Billi jisfruttaw il-qawwa tal-OCR, in-negozji u l-iżviluppaturi jistgħu jittrasformaw PDFs ibbażati fuq l-immaġini f’PDF li jistgħu jitfittxu, u jagħmluhom aktar faċli biex ifittxu, jeditjaw u jaqsmu. Huwa ċar li din l-API toffri firxa ta ‘karatteristiċi u kapaċitajiet qawwija biex taħdem ma’ PDFs. Billi ssegwi l-gwidi pass pass ipprovduti f’dan il-blog tekniku, tista’ tibda bl-OCR fuq PDFs u tieħu l-fluss tax-xogħol tad-dokumenti tiegħek għal-livell li jmiss.

Tista’ tikkunsidra li taċċessa l-API f’web browser billi tuża l-swagger interface. Barra minn hekk, peress li l-SDKs tagħna huma mibnija taħt liċenzja MIT, għalhekk il-kodiċi tas-sors sħiħ jista’ jitniżżel minn GitHub. F’każ li tiltaqa’ ma’ xi kwistjonijiet waqt li tuża l-API, jekk jogħġbok tħossok liberu li tikkuntattjana permezz ta’ forum ta’ appoġġ għall-prodott b’xejn.

Artikoli Relatati

Nirrakkomandaw ħafna li żżur il-links li ġejjin biex titgħallem aktar dwar: