Bild PDF op Sichbar PDF

Konvertéiert Bild PDF op Sichbar PDF

An der haitegen datengedriwwener Welt sinn PDFs en onverzichtbare Format ginn fir Dokumenter ze späicheren an ze deelen. Wéi och ëmmer, net all PDFs si liicht sichtbar oder editéierbar, besonnesch déi déi op Bildbasis sinn. Wann Dir mat Dokumenter handelt, ass et wierklech schwéier all textuell Informatioun ze kopéieren / extrahéieren fir weider Manipulatioun. Glécklecherweis, mat der Kraaft vun der Optical Character Recognition (OCR) Technologie, kënnt Dir Bild PDFs a sichtbar PDFs mat Liichtegkeet konvertéieren. An dësem technesche Blog wäerte mir entdecken wéi Dir OCR PDF an sichtbar PDF konvertéiert mat verschiddenen Techniken, mat engem spezifesche Fokus op REST API. Mir wäerten och diskutéieren wéi Dir Text aus OCR PDFs extrahéiert, wat Iech e verständlecht Verständnis gëtt wéi Dir OCR Technologie benotzt fir dat vollt Potenzial vun Ären PDF Dokumenter ze spären.

OCR PDF benotzt Java SDK

Aspose.PDF Cloud SDK fir Java ass e mächtege Cloud-baséiert API deen eng breet Palette vu Funktiounen a Fäegkeeten ubitt fir mat PDF Dokumenter ze schaffen. Eng vu senge Schlësselfunktioune ass d’Fäegkeet OCR op PDFs auszeféieren, wat de Prozess vum Extraktioun vum Text aus Bildbaséierter PDFs staark vereinfachen kann an Sichbar PDFs erstellen. Mat senger userfrëndlecher Interface an ëmfaassender Dokumentatioun mécht dës SDK et einfach de Prozess vun der Ausféierung vun OCR op PDFs ze automatiséieren, Zäit spueren an d’Produktivitéit erhéijen.

Ausserdeem ass Dës Cloud-baséiert API entwéckelt fir eng breet Varietéit vun Inputformater ze handhaben a ka souguer handgeschriwwenen Text erkennen, sou datt et eng exzellent Wiel fir Geschäfter an Entwéckler mécht, déi hir Dokument Workflow rationaliséieren. Elo ass den éischte Schrëtt fir seng Referenz am Java-Projet ze addéieren andeems Dir folgend Detailer am pom.xml vum Maven Build Project bäidréit.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Wann Dir kee bestehende Kont hutt, musst Dir e gratis Kont iwwer Aspose Cloud erstellen. Login mat engem neie Kont erstallt a kuckt / erstellt Client ID a Client Secret um Cloud Dashboard. Dës Detailer sinn an de folgende Rubriken néideg.

Gescannt PDF op Sichbar PDF mat Java

Dës Sektioun erkläert d’Detailer wéi Dir gescannt PDF op Sichbar PDF konvertéiert mat Java Code Snippet. Maacht weg datt Java Cloud SDK d’Unerkennung vun de folgende Sprooche ënnerstëtzt: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra oder hir Kombinatioun zB eng,rus.

  • Als éischt musse mir en Objet vum PdfApi erstellen, wou mir ClientID a Client geheim Detailer als Argumenter passéieren
  • Zweetens, erstellt eng Instanz vun der Dateiklass fir de Bild PDF ze lueden
  • Drëttens, rufft d’Method uploadFile (…) fir den Input PDF op d’Wolleklagerung eropzelueden
  • Well eise Bild PDF engleschen Text enthält, musse mir e Stringobjekt erstellen mat engem Wäert “eng”
  • Schlussendlech, rufft d’Method putSearchableDocument(…) un, déi en Input PDF an e Sproochecode als Argumenter erfuerdert.

Wann de Code erfollegräich ausgeführt ass, gëtt de sichtbare PDF an der Cloudlagerung gespäichert

try
    {
    // Kritt ClientID a ClientSecret vun https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi Instanz
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // Input Bild PDF Dokument
    String name = "ScannedPDF.pdf";	        
	    			    
    // Lued d'Datei vum lokalen System
    File file = new File(name);
    // lued d'Datei op Cloud Storage erop
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // d'Sproochen déi am Bild PDF benotzt ginn
    String lang = "eng";
	    				
    //  Leeschtunge den OCR op Bild PDF Dokument
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // Drécken Erfolleg Message
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
Bild PDF op Sichbar PDF

Bild 1: - Sichbar PDF Virschau

De gescannte PDF, deen am uewe genannte Beispill benotzt gëtt, kann erofgeluede ginn BusinessReport.pdf an de resultéierende sichtbare PDF vun Converted.pdf

OCR Online mat cURL Kommandoen

D’cURL Kommandoen sinn eng vun de prakteschen Approche fir d’REST APIs ze ruffen. Also an dëser Sektioun wäerte mir d’cURL Kommandoen fir OCR online benotzen. Elo, als Viraussetzung, musse mir als éischt e JWT Zougang Token generéieren (baséiert op Client Umeldungsinformatiounen) wärend de folgende Kommando ausféiert.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Wann mir JWT Token hunn, w.e.g. de folgende Kommando fir OCR online auszeféieren an Bild PDF op sichtbar PDF Dokument ze konvertéieren. Déi resultéierend Datei gëtt dann an der Wolleklagerung gespäichert.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Conclusioun

OCR op PDFs ausféieren ass e kritesche Prozess fir dat vollt Potenzial vun dësen Dokumenter opzemaachen. Mat der Hëllef vu Cloud-baséiert OCR Tools wéi Aspose.PDF Cloud SDK fir Java kann dëse Prozess vereinfacht an automatiséiert ginn, Zäit spueren an d’Produktivitéit erhéijen. Andeems Dir d’Kraaft vum OCR benotzt, kënnen d’Entreprisen an d’Entwéckler Bild-baséiert PDFs an sichtbar PDFs transforméieren, wat se méi einfach maachen ze sichen, z’änneren an ze deelen. Et ass kloer datt dës API eng Rei vu mächtege Funktiounen a Fäegkeeten ubitt fir mat PDFs ze schaffen. Andeems Dir de Schrëtt-fir-Schrëtt Guiden an dësem technesche Blog geliwwert hutt, kënnt Dir mat OCR op PDFs ufänken an Ären Dokument Workflow op den nächsten Niveau huelen.

Dir kënnt iwwerleeën Zougang zu der API an engem Webbrowser mat der swagger Interface. Ausserdeem, well eis SDKs ënner enger MIT Lizenz gebaut ginn, sou datt de komplette Quellcode vum GitHub erofgeluede ka ginn. Am Fall wou Dir Problemer begéint wärend Dir d’API benotzt, w.e.g. kontaktéiert eis iwwer gratis Produkt Support Forum.

Zesummenhang Artikelen

Mir recommandéieren Iech déi folgend Linken ze besichen fir méi iwwer ze léieren: