Udfør OCR online. Billede til tekst ved hjælp af Python SDK

Optisk tegngenkendelse er en smart måde at genkende indhold over rasterbilleder. Det bliver endda mere brugbart, når du skal bevare den gamle arkivlitteratur i digitalt format. Tusindvis af år gamle bøger kan nemt bevares ved at omdanne dem til digitale biblioteker ved hjælp af OCR-operationer. Også gennem årene er dette behov blevet allestedsnærværende. Så for at opfylde dette krav skal du enten bruge noget out-of-the-box software, eller hvis du skal udføre masseoperationer uden menneskelig indgriben, er den hurtige og nemmeste måde at bruge programmerings-API. I resten af artiklen vil vi forklare trin til, hvordan man udfører OCR på billeder ved hjælp af Python REST API.

OCR Online REST API
- Understøttede sprog
- Understøttede filformater
OCR Online ved hjælp af Python

OCR Online REST API

Aspose.OCR Cloud SDK til Python er bemærkelsesværdig, når det kommer til optisk tegngenkendelse over rasterbilleder (BMP, JPEG, GIF, PNG, TIFF).Når du udfører OCR-operationer, giver det dig mulighed for at læse tegnene samt skrifttypeoplysninger. Du kan udføre OCR på hele billedet eller en specifik del, mens du angiver X- og Y-koordinater. Når den optiske tegngenkendelse er fuldført, returneres svaret i XML- eller JSON-formaterne, og den udtrukne tekst kan gemmes i TXT-, PDF- og HOCR-formater. Specificeret nedenfor er nogle funktioner på højt niveau.

Automatisk skævhedskorrektion
Automatisk og manuel registrering af dokumentlayout
Avanceret automatisk billedforbehandling
Understøtter flere internationale sprog
Høj hastighed uden hardwareressourcer

Understøttede sprog

Sammen med det engelske sprog er API’en fuldt ud i stand til at genkende tekst på fransk, tysk, italiensk, portugisisk og spansk.

Understøttede filformater

Specificeret nedenfor er den komplette liste over filformater, der i øjeblikket understøttes af REST API til OCR-operationer.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, iff.], .sr, iff. .hdr, .pic

OCR Online ved hjælp af Python

Vores API’er er udviklet i henhold til REST-arkitektur, så i dette afsnit skal vi udforske billed-til-tekst-konverteringen ved hjælp af cURL-kommandoer. Vi forstår, at cURL-kommandoerne er den fleksible måde at få adgang til REST API’er via konsollen. Nu er en af forudsætningerne at generere et JWT-token. For yderligere relaterede detaljer, besøg venligst Sådan opnår du JWT-token ved hjælp af et klient-id og klienthemmelighed.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

Når du har JWT-tokenet, prøv venligst at bruge følgende kommando til at udføre en OCR-handling på et billede, der er placeret på skylageret, og som indeholder engelsk tekst.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Billede til tekst-konvertering på lokalt billede

I dette afsnit skal vi udføre OCR-operation på billede indlæst fra lokalt drev

# For komplette eksempler og datafiler, gå til https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # Konfigurer CAD- og Storage API-klienter 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR på billede fra Cloud Storage

Vi skal lære detaljerne om, hvordan vi kan indlæse et billede fra Cloud-lagring og udføre billed-OCR ved hjælp af Python-kodestykket.

# For komplette eksempler og datafiler, gå til https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # Konfigurer CAD- og Storage API-klienter 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

Billed-OCR på URL

Hvis du støder på et krav om at udføre optisk billedgenkendelse på et billede, der er tilgængeligt på en web-URL, er API’en fuldt egnet og understøtter denne funktion. API-metoden postrecognizefromurl kan bruges til at opfylde dette krav.

# For komplette eksempler og datafiler, gå til https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # Konfigurer CAD- og Storage API-klienter 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Konklusion

I denne artikel har vi lært detaljerne om, hvordan man udfører OCR online ved hjælp af cURL-kommandoen såvel som gennem python-kodestykket. Da vores Cloud SDK’er er bygget under MIT-licens, kan du overveje at downloade den komplette kildekode fra GitHub repository. Dette lager kommer også med gratis demoer, og for at udføre dem, følg venligst nedenstående trin.

Tjek SDK’et eller få fra pip(pip install aspose-ocr-cloud)
Indstil dit klient-id og klienthemmelighed
Kør Python-konsollen Demo eller UnitTests

Relaterede artikler

Vi anbefaler stærkt, at du besøger følgende links for at lære mere om:

OCR Online REST API#

Understøttede sprog#

Understøttede filformater#

OCR Online ved hjælp af Python#

Billede til tekst-konvertering på lokalt billede#

Python OCR på billede fra Cloud Storage#

Billed-OCR på URL#

Konklusion#

Relaterede artikler#