Mūsdienu uz datiem balstītajā pasaulē PDF ir kļuvuši par neaizstājamu formātu dokumentu glabāšanai un kopīgošanai. Tomēr ne visi PDF faili ir viegli meklējami vai rediģējami, jo īpaši tie, kas ir balstīti uz attēliem. Strādājot ar dokumentiem, ir patiešām grūti nokopēt/izvilkt jebkādu tekstuālu informāciju turpmākai manipulācijai. Par laimi, izmantojot optiskās rakstzīmju atpazīšanas (OCR) tehnoloģiju, varat viegli pārvērst attēlu PDF failus meklējamos PDF failos. Šajā tehniskajā emuārā mēs izpētīsim, kā pārvērst OCR PDF par meklējamu PDF, izmantojot dažādas metodes, īpašu uzmanību pievēršot REST API. Mēs arī apspriedīsim, kā izvilkt tekstu no OCR PDF failiem, sniedzot jums visaptverošu izpratni par to, kā izmantot OCR tehnoloģiju, lai pilnībā izmantotu savu PDF dokumentu potenciālu.
- OCR PDF, izmantojot Java SDK
- Skenēts PDF PDF formātā, kurā var meklēt, izmantojot Java
- OCR tiešsaistē, izmantojot cURL komandas
OCR PDF, izmantojot Java SDK
Aspose.PDF Cloud SDK for Java ir jaudīgs mākoņdatošanas API, kas piedāvā plašu funkciju un iespēju klāstu darbam ar PDF dokumentiem. Viena no tās galvenajām funkcijām ir iespēja veikt OCR PDF failiem, kas var ievērojami vienkāršot teksta izvilkšanas procesu no attēliem balstītiem PDF failiem un meklējamus PDF failus. Pateicoties lietotājam draudzīgajam interfeisam un visaptverošajai dokumentācijai, šis SDK ļauj viegli automatizēt OCR veikšanas procesu PDF failos, ietaupot laiku un palielinot produktivitāti.
Turklāt šī mākoņdatošanas API ir izstrādāta, lai apstrādātu dažādus ievades formātus, un tā var pat atpazīt ar roku rakstītu tekstu, padarot to par lielisku izvēli uzņēmumiem un izstrādātājiem, kuri vēlas racionalizēt savu dokumentu darbplūsmu. Tagad pirmais solis ir pievienot tās atsauci Java projektā, pievienojot tālāk norādīto informāciju maven build projekta pom.xml.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Ja jums nav esoša konta, jums ir jāizveido bezmaksas konts pakalpojumā Aspose Cloud. Piesakieties, izmantojot jaunizveidoto kontu, un vietnē Cloud Dashboard atrodiet/izveidojiet klienta ID un klienta noslēpumu. Šī informācija ir nepieciešama turpmākajās sadaļās.
Skenēts PDF PDF formātā, kurā var meklēt, izmantojot Java
Šajā sadaļā ir izskaidrota informācija par to, kā pārveidot skenētu PDF par meklējamu PDF, izmantojot Java koda fragmentu. Lūdzu, ņemiet vērā, ka Java Cloud SDK atbalsta šādu valodu atpazīšanu: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra vai to kombinācija, piemēram, eng, rus.
- Vispirms mums ir jāizveido PdfApi objekts, kurā kā argumentus nododam ClientID un Client secret detaļas.
- Otrkārt, izveidojiet failu klases instanci, lai ielādētu attēla PDF
- Treškārt, izsauciet metodi uploadFile (…), lai augšupielādētu ievades PDF failu mākoņa krātuvē
- Tā kā mūsu attēla PDF satur tekstu angļu valodā, mums ir jāizveido virknes objekts ar vērtību “eng”
- Visbeidzot, izsauciet metodi putSearchableDocument(…), kurai kā argumentiem ir nepieciešams ievades PDF fails un valodas kods.
Kad kods ir veiksmīgi izpildīts, meklēšanas PDF fails tiek saglabāts mākoņa krātuvē
try
{
// Iegūstiet ClientID un ClientSecret no https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// izveidot PdfApi gadījumu
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// ievadiet attēlu PDF dokumentā
String name = "ScannedPDF.pdf";
// Ielādējiet failu no vietējās sistēmas
File file = new File(name);
// augšupielādējiet failu mākoņa krātuvē
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// valodas, kas tiek izmantotas attēlu PDF failā
String lang = "eng";
// veiciet OCR attēla PDF dokumentā
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// izdrukāt veiksmes ziņojumu
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
Iepriekš minētajā piemērā izmantoto skenēto PDF failu var lejupielādēt no BusinessReport.pdf un iegūto meklējamo PDF failu no Converted.pdf.
OCR tiešsaistē, izmantojot cURL komandas
CURL komandas ir viena no ērtajām pieejām REST API izsaukšanai. Tāpēc šajā sadaļā mēs izmantosim cURL komandas OCR tiešsaistē. Tagad kā priekšnoteikums mums vispirms ir jāģenerē JWT piekļuves marķieris (pamatojoties uz klienta akreditācijas datiem), vienlaikus izpildot šo komandu.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Kad esam ieguvuši JWT marķieri, lūdzu, izpildiet šo komandu, lai tiešsaistē veiktu OCR un pārveidotu attēlu PDF par meklējamu PDF dokumentu. Pēc tam iegūtais fails tiek saglabāts mākoņa krātuvē.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Secinājums
OCR veikšana PDF failos ir būtisks process, lai pilnībā izmantotu šo dokumentu potenciālu. Izmantojot mākoņdatošanas OCR rīkus, piemēram, Aspose.PDF Cloud SDK for Java, šo procesu var vienkāršot un automatizēt, ietaupot laiku un palielinot produktivitāti. Izmantojot OCR iespējas, uzņēmumi un izstrādātāji var pārveidot uz attēliem balstītus PDF failus meklējamos PDF failos, atvieglojot to meklēšanu, rediģēšanu un kopīgošanu. Ir skaidrs, ka šī API piedāvā virkni jaudīgu funkciju un iespēju darbam ar PDF failiem. Izpildot šajā tehniskajā emuārā sniegtās detalizētās rokasgrāmatas, varat sākt darbu ar OCR PDF failos un pacelt savu dokumentu darbplūsmu uz nākamo līmeni.
Varat apsvērt iespēju piekļūt API tīmekļa pārlūkprogrammā, izmantojot swagger interfeisu. Turklāt, tā kā mūsu SDK ir veidoti saskaņā ar MIT licenci, visu avota kodu var lejupielādēt no GitHub. Ja API lietošanas laikā rodas problēmas, lūdzu, sazinieties ar mums, izmantojot bezmaksas produktu atbalsta forumu.
Saistītie raksti
Mēs ļoti iesakām apmeklēt šīs saites, lai uzzinātu vairāk par: