Պատկերը PDF-ից դեպի որոնելի PDF

Փոխարկեք պատկերի PDF-ը որոնելի PDF-ի

Ժամանակակից տվյալների վրա հիմնված աշխարհում PDF-ները դարձել են փաստաթղթերի պահպանման և փոխանակման անփոխարինելի ձևաչափ: Այնուամենայնիվ, ոչ բոլոր PDF-ներն են հեշտությամբ որոնելի կամ խմբագրելի, հատկապես նրանք, որոնք հիմնված են պատկերների վրա: Փաստաթղթերի հետ գործ ունենալիս իսկապես դժվար է պատճենել/արդյունահանել ցանկացած տեքստային տեղեկատվություն հետագա շահարկման համար: Բարեբախտաբար, օպտիկական նիշերի ճանաչման (OCR) տեխնոլոգիայի հզորությամբ դուք կարող եք հեշտությամբ վերափոխել պատկերի PDF-ները որոնելի PDF-ների: Այս տեխնիկական բլոգում մենք կուսումնասիրենք, թե ինչպես փոխարկել OCR PDF-ը որոնելի PDF-ի՝ օգտագործելով տարբեր տեխնիկա՝ հատուկ ուշադրություն դարձնելով REST API-ին: Մենք նաև կքննարկենք, թե ինչպես կարելի է տեքստ հանել OCR PDF-ներից՝ տալով ձեզ համապարփակ պատկերացում, թե ինչպես օգտագործել OCR տեխնոլոգիան՝ բացելու ձեր PDF փաստաթղթերի ամբողջ ներուժը:

OCR PDF՝ օգտագործելով Java SDK

Aspose.PDF Cloud SDK for Java-ը հզոր API է, որը հիմնված է ամպի վրա, որն առաջարկում է հնարավորությունների և հնարավորությունների լայն շրջանակ PDF փաստաթղթերի հետ աշխատելու համար: Դրա հիմնական գործառույթներից մեկը PDF ֆայլերի վրա OCR-ի կատարման հնարավորությունն է, որը կարող է մեծապես պարզեցնել պատկերի վրա հիմնված PDF-ներից տեքստ հանելու և որոնելի PDF ֆայլեր ստեղծելու գործընթացը: Օգտվողի համար հարմար ինտերֆեյսի և համապարփակ փաստաթղթերի շնորհիվ այս SDK-ն հեշտացնում է PDF ֆայլերում OCR-ի կատարման գործընթացը ավտոմատացնելը՝ խնայելով ժամանակը և բարձրացնելով արտադրողականությունը:

Ավելին, ամպի վրա հիմնված այս API-ն նախագծված է մուտքագրման ձևաչափերի լայն տեսականի մշակելու համար և կարող է նույնիսկ ճանաչել ձեռագիր տեքստը՝ դարձնելով այն հիանալի ընտրություն բիզնեսների և մշակողների համար, ովքեր ցանկանում են պարզեցնել իրենց փաստաթղթերի աշխատանքային հոսքը: Այժմ առաջին քայլը Java նախագծում դրա հղումն ավելացնելն է՝ ավելացնելով հետևյալ մանրամասները maven build նախագծի pom.xml-ում:

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Եթե դուք չունեք գոյություն ունեցող հաշիվ, դուք պետք է ստեղծեք անվճար հաշիվ Aspose Cloud-ի միջոցով: Մուտք գործեք՝ օգտագործելով նորաստեղծ հաշիվը և փնտրեք/ստեղծեք Հաճախորդի ID-ն և Հաճախորդի գաղտնիքը Cloud Dashboard-ում: Այս մանրամասները պահանջվում են հաջորդ բաժիններում:

Սկանավորվել է PDF-ը դեպի որոնելի PDF՝ Java-ի միջոցով

Այս բաժինը բացատրում է մանրամասները, թե ինչպես փոխարկել սկանավորված PDF-ը որոնելի PDF-ի՝ օգտագործելով Java կոդի հատվածը: Խնդրում ենք նկատի ունենալ, որ Java Cloud SDK-ն աջակցում է հետևյալ լեզուների ճանաչմանը. eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld: , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra կամ դրանց համակցությունը օրինակ eng,rus.

  • Սկզբում մենք պետք է ստեղծենք PdfApi-ի օբյեկտ, որտեղ որպես արգումենտ փոխանցում ենք ClientID-ի և Client-ի գաղտնի մանրամասները:
  • Երկրորդ, ստեղծեք File դասի օրինակ՝ Image PDF-ը բեռնելու համար
  • Երրորդ, զանգահարեք uploadFile(…) մեթոդը՝ մուտքագրված PDF-ը ամպային պահեստում վերբեռնելու համար
  • Քանի որ մեր պատկերի PDF-ը պարունակում է անգլերեն տեքստ, ուստի մենք պետք է ստեղծենք տողային օբյեկտ, որը պարունակում է «eng» արժեքը:
  • Ի վերջո, կանչեք putSearchableDocument(…) մեթոդը, որը պահանջում է մուտքագրված PDF և լեզվի կոդը որպես արգումենտ:

Կոդը հաջողությամբ գործարկվելուց հետո, որոնելի PDF-ը պահվում է ամպային պահեստում

try
    {
    // Ստացեք ClientID-ը և ClientSecret-ը https://dashboard.aspose.cloud/-ից
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // createPdfApi օրինակ
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // մուտքագրեք պատկեր PDF փաստաթուղթ
    String name = "ScannedPDF.pdf";	        
	    			    
    // Բեռնել ֆայլը տեղական համակարգից
    File file = new File(name);
    // վերբեռնեք ֆայլը ամպային պահեստում
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // պատկերների PDF-ում օգտագործվող լեզուները
    String lang = "eng";
	    				
    //  կատարեք OCR պատկերի PDF փաստաթղթի վրա
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // տպել հաջողության հաղորդագրություն
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
Պատկերը PDF-ից դեպի որոնելի PDF

Պատկեր 1.- Որոնելի PDF նախադիտում

Վերոնշյալ օրինակում օգտագործված սկանավորված PDF-ը կարելի է ներբեռնել BusinessReport.pdf-ից, իսկ արդյունքում փնտրելի PDF-ը՝ Converted.pdf-ից։

OCR առցանց՝ օգտագործելով cURL հրամանները

CURL հրամանները REST API-ներ կանչելու հարմար մոտեցումներից են: Այսպիսով, այս բաժնում մենք պատրաստվում ենք օգտագործել cURL հրամանները OCR-ի համար առցանց: Այժմ, որպես նախապայման, մենք պետք է նախ գեներացնենք JWT մուտքի նշան (հիմնված հաճախորդի հավատարմագրերի վրա) հետևյալ հրամանը կատարելիս։

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Երբ մենք ունենք JWT նշան, խնդրում ենք հետևյալ հրամանը՝ OCR-ն առցանց կատարելու և Image PDF-ը որոնելի PDF փաստաթղթի փոխարկելու համար: Արդյունքում ստացված ֆայլն այնուհետև պահվում է ամպային պահեստում:

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Եզրակացություն

PDF ֆայլերի վրա OCR-ի կատարումը կարևոր գործընթաց է այս փաստաթղթերի ամբողջ ներուժը բացելու համար: Ամպային վրա հիմնված OCR գործիքների օգնությամբ, ինչպիսին է Aspose.PDF Cloud SDK-ն Java-ի համար, այս գործընթացը կարող է պարզեցվել և ավտոմատացվել՝ խնայելով ժամանակը և բարձրացնելով արտադրողականությունը: Օգտվելով OCR-ի հզորությունից՝ ձեռնարկությունները և մշակողները կարող են վերափոխել պատկերի վրա հիմնված PDF-ները որոնելի PDF-ների՝ հեշտացնելով դրանց որոնումը, խմբագրումը և համօգտագործումը: Հասկանալի է, որ այս API-ն առաջարկում է մի շարք հզոր հնարավորություններ և հնարավորություններ PDF-ների հետ աշխատելու համար: Հետևելով այս տեխնիկական բլոգում ներկայացված քայլ առ քայլ ուղեցույցներին՝ դուք կարող եք սկսել OCR-ը PDF ֆայլերի վրա և ձեր փաստաթղթերի աշխատանքային հոսքը տեղափոխել հաջորդ մակարդակ:

Դուք կարող եք դիտարկել API-ին մուտք գործելու հնարավորություն վեբ բրաուզերի միջոցով՝ օգտագործելով swagger ինտերֆեյսը: Ավելին, քանի որ մեր SDK-ները կառուցված են MIT լիցենզիայի ներքո, ուստի ամբողջական ելակետային կոդը կարելի է ներբեռնել GitHub-ից: Եթե API-ն օգտագործելիս որևէ խնդրի հանդիպեք, խնդրում ենք ազատ զգալ կապվել մեզ հետ [անվճար արտադրանքի աջակցման ֆորումի] միջոցով:

Առնչվող հոդվածներ

Խորհուրդ ենք տալիս ավելին իմանալու համար այցելել հետևյալ հղումները.