A mai adatközpontú világban a PDF-ek a dokumentumok tárolásának és megosztásának nélkülözhetetlen formátumává váltak. Azonban nem minden PDF könnyen kereshető vagy szerkeszthető, különösen a képalapúak. A dokumentumok kezelésekor nagyon nehéz bármilyen szöveges információt másolni/kivonatolni további manipuláció céljából. Szerencsére az Optical Character Recognition (OCR) technológia segítségével könnyedén konvertálhatja a kép-PDF-eket kereshető PDF-ekké. Ebben a technikai blogban megvizsgáljuk, hogyan lehet OCR PDF-et kereshető PDF-vé konvertálni különféle technikák segítségével, különös tekintettel a REST API-ra. Azt is megvitatjuk, hogyan lehet szöveget kinyerni az OCR PDF-ekből, így átfogó képet kaphat arról, hogyan használhatja ki az OCR technológiát a PDF-dokumentumokban rejlő lehetőségek teljes kihasználásához.
- OCR PDF Java SDK használatával
- Szkennelt PDF-ből kereshető PDF-be Java segítségével
- OCR Online a cURL parancsokkal
OCR PDF Java SDK használatával
Az Aspose.PDF Cloud SDK for Java egy hatékony felhőalapú API, amely funkciók és lehetőségek széles skáláját kínálja a PDF-dokumentumokkal való munkavégzéshez. Egyik kulcsfontosságú funkciója az OCR végrehajtása a PDF-eken, ami nagymértékben leegyszerűsítheti a szöveg képalapú PDF-ekből történő kinyerésének és kereshető PDF-ek létrehozásának folyamatát. Felhasználóbarát felületével és átfogó dokumentációjával ez az SDK megkönnyíti az OCR végrehajtásának folyamatát a PDF-eken, így időt takarít meg és növeli a termelékenységet.
Ezenkívül ezt a felhőalapú API-t úgy tervezték, hogy a beviteli formátumok széles skáláját kezelje, és még a kézzel írt szöveget is képes felismerni, így kiváló választás a dokumentumok munkafolyamatának egyszerűsítésére törekvő vállalkozások és fejlesztők számára. Most az első lépés a hivatkozás hozzáadása a Java projekthez a következő részletek hozzáadásával a maven build projekt pom.xml fájljában.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Ha nincs meglévő fiókja, létre kell hoznia egy ingyenes fiókot az Aspose Cloud szolgáltatáson keresztül. Jelentkezzen be az újonnan létrehozott fiókkal, és keresse meg/hozza létre az ügyfél-azonosítót és az ügyféltitkot a Cloud Dashboard oldalon. Ezeket a részleteket a következő szakaszokban kell megadni.
Szkennelt PDF-ből kereshető PDF-be Java segítségével
Ez a rész ismerteti a beolvasott PDF-nek a Java kódrészlet használatával történő kereshető PDF-formátumba konvertálásának részleteit. Felhívjuk figyelmét, hogy a Java Cloud SDK a következő nyelvek felismerését támogatja: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra vagy ezek kombinációja pl. eng,rus.
- Először létre kell hoznunk egy PdfApi objektumot, ahol a ClientID és a Client titkos adatait argumentumként adjuk át.
- Másodszor, hozzon létre egy példányt a Fájl osztályból az Image PDF betöltéséhez
- Harmadszor, hívja meg az uploadFile(…) metódust a bemeneti PDF feltöltéséhez a felhőtárhelyre
- Mivel a PDF-képünk angol szöveget tartalmaz, ezért létre kell hoznunk egy karakterlánc objektumot, amely „eng” értékkel rendelkezik.
- Végül hívja meg a putSearchableDocument(…) metódust, amelyhez egy bemeneti PDF és egy nyelvi kód szükséges argumentumként.
A kód sikeres végrehajtása után a kereshető PDF-fájl felhőtárhelyen kerül tárolásra
try
{
// Szerezze be a ClientID-t és a ClientSecret-et a https://dashboard.aspose.cloud/ webhelyről
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// createPdfApi példány
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// bemeneti kép PDF dokumentum
String name = "ScannedPDF.pdf";
// Töltse be a fájlt a helyi rendszerről
File file = new File(name);
// töltse fel a fájlt a felhőtárhelyre
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// a kép PDF-ben használt nyelvek
String lang = "eng";
// hajtsa végre az OCR-t képen PDF dokumentumon
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// sikerüzenet nyomtatása
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
A fenti példában használt beolvasott PDF letölthető a BusinessReport.pdf oldalról, az eredményül kapott kereshető PDF pedig a Converted.pdf oldalról tölthető le.
OCR Online a cURL parancsokkal
A cURL parancsok a REST API-k meghívásának egyik kényelmes módja. Tehát ebben a részben a cURL parancsokat fogjuk használni az online OCR-hez. Most előfeltételként először létre kell hoznunk egy JWT hozzáférési tokent (az ügyfél hitelesítő adatai alapján), miközben végrehajtjuk a következő parancsot.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Miután megvan a JWT token, kérjük, a következő parancsot hajtsa végre az OCR online végrehajtásához, és az Image PDF-et kereshető PDF-dokumentummá konvertálja. Az eredményül kapott fájl ezután felhőtárhelyen kerül tárolásra.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Következtetés
Az OCR végrehajtása PDF-eken kritikus folyamat a dokumentumokban rejlő lehetőségek teljes kihasználásához. A felhőalapú OCR-eszközök, például az Aspose.PDF Cloud SDK for Java segítségével ez a folyamat leegyszerűsíthető és automatizálható, így időt takaríthat meg és növelheti a termelékenységet. Az OCR erejét kihasználva a vállalkozások és a fejlesztők a képalapú PDF-eket kereshető PDF-ekké alakíthatják át, így könnyebben kereshetők, szerkeszthetők és megoszthatók. Nyilvánvaló, hogy ez az API számos hatékony szolgáltatást és képességet kínál a PDF-ekkel való munkavégzéshez. Az ebben a technikai blogban található, lépésről lépésre található útmutatók követésével elkezdheti az OCR-t PDF-eken, és a dokumentum munkafolyamatát a következő szintre emelheti.
Érdemes lehet az API-t egy webböngészőn belül elérni a swagger felület használatával. Továbbá, mivel SDK-ink MIT-licenc alatt készülnek, így a teljes forráskód letölthető a GitHub oldalról. Ha bármilyen problémába ütközik az API használata során, forduljon hozzánk bizalommal az ingyenes terméktámogatási fórumon.
kapcsolódó cikkek
Erősen javasoljuk, hogy látogassa meg az alábbi linkeket, ha többet szeretne megtudni erről: