
Il riconoscimento ottico dei caratteri è un modo intelligente per riconoscere il contenuto sulle immagini raster. Diventa ancora più utile quando è necessario conservare la vecchia letteratura d’archivio in un formato digitale. Migliaia di anni di libri possono essere facilmente conservati trasformandoli in librerie digitali utilizzando operazioni OCR. Inoltre, nel corso degli anni, questa necessità è diventata onnipresente. Quindi, per soddisfare questo requisito, è necessario utilizzare un software pronto all’uso o, nel caso in cui sia necessario eseguire operazioni in blocco senza intervento umano, il modo più rapido e semplice è utilizzare l’API di programmazione. Nel resto dell’articolo, spiegheremo i passaggi su come eseguire l’OCR sulle immagini utilizzando l’API REST Python.
API REST OCR online
Aspose.OCR Cloud SDK per Python è notevole quando si tratta di riconoscimento ottico dei caratteri su immagini raster (BMP, JPEG, GIF, PNG, TIFF).Quando si eseguono operazioni OCR, consente di leggere i caratteri e le informazioni sui font. È possibile eseguire l’OCR sull’intera immagine o su una porzione specifica fornendo le coordinate X e Y. Dopo il completamento del riconoscimento ottico dei caratteri, la risposta viene restituita nei formati XML o JSON e il testo estratto può essere salvato nei formati TXT, PDF e HOCR. Di seguito sono specificate alcune funzionalità di alto livello.
- Correzione automatica dell’inclinazione
- Rilevamento automatico e manuale del layout del documento
- Pre-elaborazione avanzata delle immagini automatizzata
- Supporta più lingue internazionali
- Alta velocità senza risorse hardware
Lingue supportate
Oltre alla lingua inglese, l’API è in grado di riconoscere testi in francese, tedesco, italiano, portoghese e spagnolo.
Formati di file supportati
Di seguito è riportato l’elenco completo dei formati di file attualmente supportati dalla REST API per le operazioni OCR.
.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic
OCR online tramite Python
Le nostre API sono sviluppate secondo l’architettura REST, quindi in questa sezione esploreremo la conversione da Immagine a Testo utilizzando i comandi cURL. Sappiamo che i comandi cURL sono il modo flessibile per accedere alle API REST tramite console. Ora uno dei prerequisiti è generare un token JWT. Per ulteriori dettagli correlati, visita Come ottenere un token JWT utilizzando un ID client e un segreto client.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
Una volta ottenuto il token JWT, prova a utilizzare il seguente comando per eseguire un’operazione OCR su un’immagine situata nell’archivio cloud, contenente testo in inglese.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
Conversione da immagine a testo su immagine locale
In questa sezione, eseguiremo l’operazione OCR sull’immagine caricata dall’unità locale
# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# Impostare i client CAD e Storage API
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
Python OCR su immagine da Cloud Storage
Impareremo nei dettagli come caricare un’immagine da un archivio Cloud ed eseguire l’OCR delle immagini utilizzando un frammento di codice Python.
# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# Impostare i client API CAD e Storage
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
OCR dell’immagine sull’URL
Nel caso in cui si riscontri la necessità di eseguire il riconoscimento ottico delle immagini su un’immagine disponibile su un URL Web, l’API è pienamente in grado di farlo e supporta questa funzionalità. Il metodo postrecognizefromurl dell’API può essere utilizzato per soddisfare questa esigenza.
# Per esempi completi e file di dati, visitare https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# Impostare i client API CAD e Storage
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
Conclusione
In questo articolo, abbiamo appreso i dettagli su come eseguire l’OCR online utilizzando il comando cURL e tramite frammenti di codice python. Poiché i nostri Cloud SDK sono realizzati con licenza MIT, potresti prendere in considerazione di scaricare il codice sorgente completo da repository GitHub. Questo repository include anche demo gratuite e per eseguirle, segui i passaggi indicati di seguito.
- Dai un’occhiata all’SDK o scaricalo da pip(pip install aspose-ocr-cloud)
- Imposta il tuo ID cliente e il segreto cliente
- Esegui la console Python Demo o UnitTests
Articoli correlati
Ti consigliamo vivamente di visitare i seguenti link per saperne di più: