OCR PDF do PDF s možností vyhledávání: Zdarma online OCR PDF pomocí Java

Obrázek PDF do PDF s možností vyhledávání — Převést obrázek PDF do PDF s možností vyhledávání

V dnešním světě založeném na datech se PDF staly nepostradatelným formátem pro ukládání a sdílení dokumentů. Ne všechny soubory PDF však lze snadno prohledávat nebo upravovat, zejména ty, které jsou založeny na obrázcích. Při práci s dokumenty je opravdu obtížné kopírovat/extrahovat jakékoli textové informace pro další manipulaci. Naštěstí pomocí technologie optického rozpoznávání znaků (OCR) můžete snadno převést soubory PDF na soubory PDF s možností vyhledávání. V tomto technickém blogu prozkoumáme, jak převést OCR PDF na prohledávatelné PDF pomocí různých technik, se specifickým zaměřením na REST API. Budeme také diskutovat o tom, jak extrahovat text z OCR PDF, což vám poskytne komplexní pochopení toho, jak využít technologii OCR k využití plného potenciálu vašich dokumentů PDF.

OCR PDF pomocí Java SDK
Naskenované PDF do PDF s možností vyhledávání pomocí Javy
OCR Online pomocí příkazů cURL

OCR PDF pomocí Java SDK

Aspose.PDF Cloud SDK for Java je výkonné cloudové API, které nabízí širokou škálu funkcí a možností pro práci s dokumenty PDF. Jednou z jeho klíčových funkcí je schopnost provádět OCR na PDF, což může značně zjednodušit proces extrahování textu z obrázků PDF a vytváření prohledávatelných PDF. Tato sada SDK se svým uživatelsky přívětivým rozhraním a komplexní dokumentací usnadňuje automatizaci procesu provádění OCR na souborech PDF, šetří čas a zvyšuje produktivitu.

Kromě toho je toto cloudové rozhraní API navrženo tak, aby zvládlo širokou škálu vstupních formátů a dokáže dokonce rozpoznat ručně psaný text, což z něj činí vynikající volbu pro podniky a vývojáře, kteří chtějí zefektivnit pracovní tok dokumentů. Nyní je prvním krokem přidání jeho reference do projektu Java přidáním následujících podrobností do pom.xml projektu maven build.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Pokud nemáte existující účet, musíte si vytvořit bezplatný účet přes Aspose Cloud. Přihlaste se pomocí nově vytvořeného účtu a vyhledejte/vytvořte ID klienta a tajný klíč klienta na Cloud Dashboard. Tyto podrobnosti jsou vyžadovány v následujících částech.

Naskenované PDF do PDF s možností vyhledávání pomocí Javy

Tato část vysvětluje podrobnosti, jak převést naskenované PDF do PDF s možností vyhledávání pomocí úryvku kódu Java. Vezměte prosím na vědomí, že Java Cloud SDK podporuje rozpoznávání následujících jazyků: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra nebo jejich kombinace např. eng,rus.

Nejprve musíme vytvořit objekt PdfApi, kam předáme ClientID a tajné detaily klienta jako argumenty
Za druhé, vytvořte instanci třídy File pro načtení obrázku PDF
Zatřetí, zavolejte metodu uploadFile(…) pro nahrání vstupního PDF do cloudového úložiště
Protože náš obrázek PDF obsahuje anglický text, musíme vytvořit objekt typu string s hodnotou „eng“
Nakonec zavolejte metodu putSearchableDocument(…), která vyžaduje vstupní PDF a kód jazyka jako argumenty.

Po úspěšném provedení kódu se prohledávatelné PDF uloží do cloudového úložiště

try
    {
    // Získejte ClientID a ClientSecret z https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi instance
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // vstupní obrázek PDF dokument
    String name = "ScannedPDF.pdf";	        
	    			    
    // Načtěte soubor z místního systému
    File file = new File(name);
    // nahrajte soubor do cloudového úložiště
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // jazyky používané v obrázkovém PDF
    String lang = "eng";
	    				
    //  proveďte OCR na obrázku PDF dokumentu
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // tisk zprávy o úspěchu
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }

Naskenovaný PDF použitý ve výše uvedeném příkladu lze stáhnout z BusinessReport.pdf a výsledný prohledávatelný PDF z Converted.pdf

OCR Online pomocí příkazů cURL

Příkazy cURL jsou jedním z pohodlných přístupů k volání REST API. V této části tedy použijeme příkazy cURL pro OCR online. Nyní, jako předpoklad, musíme nejprve vygenerovat přístupový token JWT (na základě přihlašovacích údajů klienta) při provádění následujícího příkazu.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Jakmile máme token JWT, použijte následující příkaz k provedení OCR online a převodu Image PDF na dokument PDF s možností vyhledávání. Výsledný soubor se pak uloží do cloudového úložiště.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Závěr

Provádění OCR na souborech PDF je kritickým procesem pro využití plného potenciálu těchto dokumentů. S pomocí cloudových nástrojů OCR, jako je Aspose.PDF Cloud SDK pro Java, lze tento proces zjednodušit a automatizovat, což šetří čas a zvyšuje produktivitu. Využitím výkonu OCR mohou podniky a vývojáři transformovat soubory PDF založené na obrázcích na soubory PDF s možností vyhledávání, což usnadňuje vyhledávání, úpravy a sdílení. Je jasné, že toto API nabízí řadu výkonných funkcí a možností pro práci s PDF. Pokud budete postupovat podle podrobných průvodců uvedených v tomto technickém blogu, můžete začít s OCR na souborech PDF a posunout svůj pracovní postup dokumentů na další úroveň.

Můžete zvážit přístup k API ve webovém prohlížeči pomocí swagger interface. Navíc, protože naše SDK jsou vytvořeny pod licencí MIT, kompletní zdrojový kód lze stáhnout z GitHub. V případě, že při používání API narazíte na nějaké problémy, neváhejte nás kontaktovat prostřednictvím free product support forum.

Související články

Důrazně doporučujeme navštívit následující odkazy, kde se dozvíte více o:

OCR PDF pomocí Java SDK#

Naskenované PDF do PDF s možností vyhledávání pomocí Javy#

OCR Online pomocí příkazů cURL#

Závěr#

Související články#

OCR PDF pomocí Java SDK

Naskenované PDF do PDF s možností vyhledávání pomocí Javy

OCR Online pomocí příkazů cURL

Závěr

Související články