OCR Online

Az optikai karakterfelismerés intelligens módja a tartalom felismerésének raszteres képeken. Még hasznosabbá válik, ha a régi archív irodalmat digitális formátumban kell megőriznie. Több ezer éves könyvek könnyen megőrizhetők, ha azokat OCR műveletek segítségével digitális könyvtárakká alakítják át. Emellett az évek során ez az igény mindenütt jelen van. Tehát ennek a követelménynek a teljesítéséhez vagy valamilyen kész szoftvert kell használnia, vagy ha tömeges műveleteket kell végrehajtania emberi beavatkozás nélkül, a leggyorsabb és legegyszerűbb módja a programozási API használata. A cikk további részében elmagyarázzuk a Python REST API használatával a képek OCR-jének végrehajtásának lépéseit.

OCR Online REST API

Az Aspose.OCR Cloud SDK for Python figyelemre méltó, ha raszteres képeken (BMP, JPEG, GIF, PNG, TIFF) való optikai karakterfelismerésről van szó. Az OCR műveletek végrehajtásakor lehetővé teszi a karakterek és a betűtípus-információk olvasását. Elvégezheti az OCR-t a teljes képen vagy egy adott részén, miközben megadja az X és Y koordinátákat. Az optikai karakterfelismerés befejezése után a válasz XML vagy JSON formátumban kerül visszaadásra, és a kivont szöveg TXT, PDF és HOCR formátumba menthető. Az alábbiakban felsorolunk néhány magas szintű szolgáltatást.

  • Automatikus ferdeség korrekció
  • Automatikus és kézi dokumentumelrendezés felismerés
  • Fejlett automatizált kép-előfeldolgozás
  • Több nemzetközi nyelvet támogat
  • Nagy sebesség hardver erőforrások nélkül

Támogatott nyelvek

Az angol nyelv mellett az API teljes mértékben képes a francia, német, olasz, portugál és spanyol nyelvű szövegek felismerésére.

Támogatott fájlformátumok

Az alábbiakban megadjuk azoknak a fájlformátumoknak a teljes listáját, amelyeket a REST API jelenleg támogat az OCR műveletekhez.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .sr,tiffm,1][ras, tiffm .tif, .exr, .hdr, .pic

OCR Online Python használatával

API-jainkat a REST architektúra szerint fejlesztjük, ezért ebben a részben a kép szöveggé konvertálását vizsgáljuk meg cURL parancsok használatával. Megértjük, hogy a cURL parancsok a REST API-k konzolon keresztüli elérésének rugalmas módja. Most az egyik előfeltétel egy JWT token generálása. További kapcsolódó részletekért kérjük, látogasson el a Hogyan szerezhető be JWT token ügyfél-azonosító és ügyféltitkos használatával oldalon.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

Miután megvan a JWT token, próbálja meg a következő paranccsal OCR-műveletet végrehajtani a felhőtárolóban található, angol szöveget tartalmazó képen.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Kép szöveggé átalakítása helyi képen

Ebben a részben OCR műveletet fogunk végrehajtani a helyi meghajtóról betöltött képen

# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # CAD és Storage API ügyfelek beállítása 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR képen a Cloud Storage-ból

Megtanuljuk a részleteket arról, hogyan tölthetünk be egy képet a felhőtárhelyről, és hogyan hajthatunk végre Image OCR-t Python kódrészlet segítségével.

# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # CAD és Storage API ügyfelek beállítása 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

Kép OCR az URL-en

Abban az esetben, ha egy webes URL-címen elérhető képen optikai képfelismerést kell végrehajtani, az API teljes mértékben képes és támogatja ezt a funkciót. Az API postrecognizefromurl módszere használható ennek a követelménynek a teljesítésére.

# A teljes példákért és adatfájlokért látogasson el a https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ oldalra.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # CAD és Storage API ügyfelek beállítása 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Következtetés

Ebben a cikkben megismertük az OCR online végrehajtásának részleteit a cURL paranccsal, valamint a python kódrészlettel. Mivel Cloud SDK-jaink MIT licenc alatt készülnek, érdemes lehet letölteni a teljes forráskódot a GitHub-tárolóból. Ez a tárház ingyenes demókat is tartalmaz, és ezek végrehajtásához kövesse az alábbi lépéseket.

  • Nézze meg az SDK-t, vagy szerezze be a pip webhelyről (pip install aspose-ocr-cloud)
  • Állítsa be az ügyfél-azonosítót és az ügyféltitkot
  • Futtassa a Python konzolt Demo vagy UnitTests

Kapcsolódó cikkek

Erősen javasoljuk, hogy látogassa meg az alábbi linkeket, ha többet szeretne megtudni erről: