
Az optikai karakterfelismerés intelligens módja a tartalom felismerésének raszteres képeken. Még hasznosabbá válik, ha a régi archív irodalmat digitális formátumban kell megőriznie. Több ezer éves könyvek könnyen megőrizhetők, ha azokat OCR műveletek segítségével digitális könyvtárakká alakítják át. Emellett az évek során ez az igény mindenütt jelen van. Tehát ennek a követelménynek a teljesítéséhez vagy valamilyen kész szoftvert kell használnia, vagy ha tömeges műveleteket kell végrehajtania emberi beavatkozás nélkül, a leggyorsabb és legegyszerűbb módja a programozási API használata. A cikk további részében elmagyarázzuk a Python REST API használatával a képek OCR-jének végrehajtásának lépéseit.
OCR Online REST API
Az Aspose.OCR Cloud SDK for Python figyelemre méltó, ha raszteres képeken (BMP, JPEG, GIF, PNG, TIFF) való optikai karakterfelismerésről van szó. Az OCR műveletek végrehajtásakor lehetővé teszi a karakterek és a betűtípus-információk olvasását. Elvégezheti az OCR-t a teljes képen vagy egy adott részén, miközben megadja az X és Y koordinátákat. Az optikai karakterfelismerés befejezése után a válasz XML vagy JSON formátumban kerül visszaadásra, és a kivont szöveg TXT, PDF és HOCR formátumba menthető. Az alábbiakban felsorolunk néhány magas szintű szolgáltatást.
- Automatikus ferdeség korrekció
- Automatikus és kézi dokumentumelrendezés felismerés
- Fejlett automatizált kép-előfeldolgozás
- Több nemzetközi nyelvet támogat
- Nagy sebesség hardver erőforrások nélkül
Támogatott nyelvek
Az angol nyelv mellett az API teljes mértékben képes a francia, német, olasz, portugál és spanyol nyelvű szövegek felismerésére.
Támogatott fájlformátumok
Az alábbiakban megadjuk azoknak a fájlformátumoknak a teljes listáját, amelyeket a REST API jelenleg támogat az OCR műveletekhez.
.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .sr,tiffm,1][ras, tiffm .tif, .exr, .hdr, .pic
OCR Online Python használatával
API-jainkat a REST architektúra szerint fejlesztjük, ezért ebben a részben a kép szöveggé konvertálását vizsgáljuk meg cURL parancsok használatával. Megértjük, hogy a cURL parancsok a REST API-k konzolon keresztüli elérésének rugalmas módja. Most az egyik előfeltétel egy JWT token generálása. További kapcsolódó részletekért kérjük, látogasson el a Hogyan szerezhető be JWT token ügyfél-azonosító és ügyféltitkos használatával oldalon.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
Miután megvan a JWT token, próbálja meg a következő paranccsal OCR-műveletet végrehajtani a felhőtárolóban található, angol szöveget tartalmazó képen.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
Kép szöveggé átalakítása helyi képen
Ebben a részben OCR műveletet fogunk végrehajtani a helyi meghajtóról betöltött képen
# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# CAD és Storage API ügyfelek beállítása
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
Python OCR képen a Cloud Storage-ból
Megtanuljuk a részleteket arról, hogyan tölthetünk be egy képet a felhőtárhelyről, és hogyan hajthatunk végre Image OCR-t Python kódrészlet segítségével.
# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# CAD és Storage API ügyfelek beállítása
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
Kép OCR az URL-en
Abban az esetben, ha egy webes URL-címen elérhető képen optikai képfelismerést kell végrehajtani, az API teljes mértékben képes és támogatja ezt a funkciót. Az API postrecognizefromurl módszere használható ennek a követelménynek a teljesítésére.
# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# CAD és Storage API ügyfelek beállítása
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
Következtetés
Ebben a cikkben megismertük az OCR online végrehajtásának részleteit a cURL paranccsal, valamint a python kódrészlettel. Mivel Cloud SDK-jaink MIT licenc alatt készülnek, érdemes lehet letölteni a teljes forráskódot a GitHub-tárolóból. Ez a tárház ingyenes demókat is tartalmaz, és ezek végrehajtásához kövesse az alábbi lépéseket.
- Nézze meg az SDK-t, vagy szerezze be a pip webhelyről (pip install aspose-ocr-cloud)
- Állítsa be az ügyfél-azonosítót és az ügyféltitkot
- Futtassa a Python konzolt Demo vagy UnitTests
Kapcsolódó cikkek
Erősen javasoljuk, hogy látogassa meg az alábbi linkeket, ha többet szeretne megtudni erről: