OCR in linea

Il riconoscimento ottico dei caratteri è un modo intelligente per riconoscere il contenuto sulle immagini raster. Diventa ancora più utile quando è necessario conservare la vecchia letteratura d’archivio in un formato digitale. Migliaia di anni di libri possono essere facilmente conservati trasformandoli in librerie digitali utilizzando operazioni OCR. Inoltre, nel corso degli anni, questa necessità è diventata onnipresente. Quindi, per soddisfare questo requisito, è necessario utilizzare un software pronto all’uso o, nel caso in cui sia necessario eseguire operazioni in blocco senza intervento umano, il modo più rapido e semplice è utilizzare l’API di programmazione. Nel resto dell’articolo, spiegheremo i passaggi su come eseguire l’OCR sulle immagini utilizzando l’API REST Python.

API REST OCR online

Aspose.OCR Cloud SDK per Python è notevole quando si tratta di riconoscimento ottico dei caratteri su immagini raster (BMP, JPEG, GIF, PNG, TIFF).Quando si eseguono operazioni OCR, consente di leggere i caratteri e le informazioni sui font. È possibile eseguire l’OCR sull’intera immagine o su una porzione specifica fornendo le coordinate X e Y. Dopo il completamento del riconoscimento ottico dei caratteri, la risposta viene restituita nei formati XML o JSON e il testo estratto può essere salvato nei formati TXT, PDF e HOCR. Di seguito sono specificate alcune funzionalità di alto livello.

  • Correzione automatica dell’inclinazione
  • Rilevamento automatico e manuale del layout del documento
  • Pre-elaborazione avanzata delle immagini automatizzata
  • Supporta più lingue internazionali
  • Alta velocità senza risorse hardware

Lingue supportate

Oltre alla lingua inglese, l’API è in grado di riconoscere testi in francese, tedesco, italiano, portoghese e spagnolo.

Formati di file supportati

Di seguito è riportato l’elenco completo dei formati di file attualmente supportati dalla REST API per le operazioni OCR.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic

OCR online tramite Python

Le nostre API sono sviluppate secondo l’architettura REST, quindi in questa sezione esploreremo la conversione da Immagine a Testo utilizzando i comandi cURL. Sappiamo che i comandi cURL sono il modo flessibile per accedere alle API REST tramite console. Ora uno dei prerequisiti è generare un token JWT. Per ulteriori dettagli correlati, visita Come ottenere un token JWT utilizzando un ID client e un segreto client.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

Una volta ottenuto il token JWT, prova a utilizzare il seguente comando per eseguire un’operazione OCR su un’immagine situata nell’archivio cloud, contenente testo in inglese.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Conversione da immagine a testo su immagine locale

In questa sezione, eseguiremo l’operazione OCR sull’immagine caricata dall’unità locale

# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # Impostare i client CAD e Storage API 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR su immagine da Cloud Storage

Impareremo nei dettagli come caricare un’immagine da un archivio Cloud ed eseguire l’OCR delle immagini utilizzando un frammento di codice Python.

# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # Impostare i client API CAD e Storage 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

OCR dell’immagine sull’URL

Nel caso in cui si riscontri la necessità di eseguire il riconoscimento ottico delle immagini su un’immagine disponibile su un URL Web, l’API è pienamente in grado di farlo e supporta questa funzionalità. Il metodo postrecognizefromurl dell’API può essere utilizzato per soddisfare questa esigenza.

# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # Impostare i client API CAD e Storage 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Conclusione

In questo articolo, abbiamo appreso i dettagli su come eseguire l’OCR online utilizzando il comando cURL e tramite frammenti di codice python. Poiché i nostri Cloud SDK sono realizzati con licenza MIT, potresti prendere in considerazione di scaricare il codice sorgente completo da repository GitHub. Questo repository include anche demo gratuite e per eseguirle, segui i passaggi indicati di seguito.

  • Dai un’occhiata all’SDK o scaricalo da pip(pip install aspose-ocr-cloud)
  • Imposta il tuo ID cliente e il segreto cliente
  • Esegui la console Python Demo o UnitTests

Articoli correlati

Ti consigliamo vivamente di visitare i seguenti link per saperne di più: