OCR en ligne

La reconnaissance optique de caractères est un moyen intelligent de reconnaître le contenu des images matricielles. Elle devient encore plus utile lorsque vous devez conserver la littérature d’archives ancienne dans un format numérique. Des livres vieux de plusieurs milliers d’années peuvent être facilement préservés en les transformant sous forme de bibliothèques numériques à l’aide d’opérations OCR. De plus, au fil des ans, ce besoin est devenu omniprésent. Ainsi, pour répondre à cette exigence, vous devez soit utiliser un logiciel prêt à l’emploi, soit, si vous devez effectuer des opérations en masse sans intervention humaine, le moyen le plus rapide et le plus simple est d’utiliser une API de programmation. Dans le reste de l’article, nous allons expliquer les étapes à suivre pour effectuer l’OCR sur des images à l’aide de l’API REST Python.

API REST OCR en ligne

Aspose.OCR Cloud SDK pour Python est remarquable en matière de reconnaissance optique de caractères sur des images raster (BMP, JPEG, GIF, PNG, TIFF).Lors de l’exécution d’opérations OCR, il vous permet de lire les caractères ainsi que les informations de police. Vous pouvez effectuer l’OCR sur l’ensemble de l’image ou sur une partie spécifique tout en fournissant les coordonnées X et Y. Une fois la reconnaissance optique de caractères terminée, la réponse est renvoyée aux formats XML ou JSON et le texte extrait peut être enregistré aux formats TXT, PDF et HOCR. Vous trouverez ci-dessous quelques fonctionnalités de haut niveau.

  • Correction automatique de l’inclinaison
  • Détection automatique et manuelle de la mise en page des documents
  • Prétraitement d’image automatisé avancé
  • Prend en charge plusieurs langues internationales
  • Haute vitesse sans ressources matérielles

Langues prises en charge

Outre la langue anglaise, l’API est entièrement capable de reconnaître du texte en français, en allemand, en italien, en portugais et en espagnol.

Formats de fichiers pris en charge

Vous trouverez ci-dessous la liste complète des formats de fichiers actuellement pris en charge par l’API REST pour les opérations OCR.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic

OCR en ligne avec Python

Nos API sont développées selon l’architecture REST, donc dans cette section, nous allons explorer la conversion d’image en texte à l’aide de commandes cURL. Nous comprenons que les commandes cURL sont le moyen flexible d’accéder aux API REST via la console. L’une des conditions préalables est désormais de générer un jeton JWT. Pour plus de détails, veuillez consulter Comment obtenir un jeton JWT à l’aide d’un ID client et d’un secret client.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

Une fois que vous disposez du jeton JWT, essayez d’utiliser la commande suivante pour effectuer une opération OCR sur une image située sur un stockage cloud, contenant du texte anglais.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Conversion d’image en texte sur une image locale

Dans cette section, nous allons effectuer une opération OCR sur une image chargée à partir du lecteur local

# Pour des exemples complets et des fichiers de données, veuillez consulter https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # Configurer les clients API CAO et Stockage 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

OCR Python sur une image à partir du stockage cloud

Nous allons apprendre les détails sur la façon dont nous pouvons charger une image à partir du stockage Cloud et effectuer une reconnaissance optique de caractères (OCR) d’image à l’aide d’un extrait de code Python.

# Pour des exemples complets et des fichiers de données, veuillez consulter https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # Configurer les clients API CAO et Stockage 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

Image OCR sur URL

Si vous devez effectuer une reconnaissance optique d’image sur une image disponible sur une URL Web, l’API est entièrement capable de prendre en charge cette fonctionnalité. La méthode postrecognizefromurl de l’API peut être utilisée pour répondre à cette exigence.

# Pour des exemples complets et des fichiers de données, veuillez consulter https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # Configurer les clients API CAO et Stockage 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Conclusion

Dans cet article, nous avons appris les détails sur la façon d’effectuer l’OCR en ligne à l’aide de la commande cURL ainsi que via un extrait de code Python. Comme nos SDK Cloud sont construits sous licence MIT, vous pouvez envisager de télécharger le code source complet à partir du référentiel GitHub. Ce référentiel est également fourni avec des démos gratuites et pour les exécuter, veuillez suivre les étapes ci-dessous.

  • Consultez le SDK ou obtenez-le depuis pip(pip install aspose-ocr-cloud)
  • Définissez votre identifiant client et votre secret client
  • Exécutez la console Python Demo ou UnitTests

Articles connexes

Nous vous recommandons vivement de visiter les liens suivants pour en savoir plus sur :