OCR Çevrimiçi

Optik Karakter Tanıma, raster görüntüler üzerindeki içeriği tanımanın akıllı bir yoludur. Eski arşiv literatürünü dijital bir formatta saklamanız gerektiğinde daha da kullanışlı hale gelir. Binlerce yıllık kitaplar, OCR işlemleri kullanılarak dijital kütüphaneler biçimine dönüştürülerek kolayca saklanabilir. Ayrıca, yıllar geçtikçe bu ihtiyaç her yerde görülür hale geldi. Bu gereksinimi karşılamak için, ya kullanıma hazır bir yazılım kullanmanız ya da insan müdahalesi olmadan toplu işlemler gerçekleştirmeniz gerekiyorsa, en hızlı ve en kolay yol programlama API’sini kullanmaktır. Makalenin geri kalanında, Python REST API’sini kullanarak görüntülerde OCR’nin nasıl gerçekleştirileceğine dair adımları açıklayacağız.

OCR Çevrimiçi REST API

Aspose.OCR for Python Cloud SDK, raster görüntüler (BMP, JPEG, GIF, PNG, TIFF) üzerinde optik karakter tanıma söz konusu olduğunda dikkat çekicidir. OCR işlemlerini gerçekleştirirken, karakterleri ve yazı tipi bilgilerini okumanızı sağlar. X ve Y koordinatlarını sağlayarak tüm görüntüde veya belirli bir bölümde OCR gerçekleştirebilirsiniz. Optik Karakter Tanıma tamamlandıktan sonra, yanıt XML veya JSON formatlarında döndürülür ve çıkarılan metin TXT, PDF ve HOCR formatlarında kaydedilebilir. Aşağıda bazı üst düzey özellikler belirtilmiştir.

  • Otomatik eğiklik düzeltme
  • Otomatik ve manuel belge düzeni algılama
  • Gelişmiş otomatik görüntü ön işleme
  • Birden fazla uluslararası dili destekler
  • Donanım kaynağı olmadan yüksek hız

Desteklenen diller

API, İngilizce dilinin yanı sıra Fransızca, Almanca, İtalyanca, Portekizce ve İspanyolca dillerindeki metinleri de tanıma yeteneğine sahiptir.

Desteklenen dosya biçimleri

Aşağıda, REST API’nin OCR işlemleri için şu anda desteklediği dosya biçimlerinin tam listesi verilmiştir.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic

Python kullanarak Çevrimiçi OCR

API’lerimiz REST mimarisine göre geliştirilir, bu nedenle bu bölümde cURL komutlarını kullanarak Görüntüden Metne dönüştürmeyi inceleyeceğiz. cURL komutlarının konsol aracılığıyla REST API’lerine erişmenin esnek yolu olduğunu anlıyoruz. Şimdi ön koşullardan biri bir JWT belirteci oluşturmaktır. İlgili diğer ayrıntılar için lütfen İstemci Kimliği ve İstemci Gizli Anahtarı Kullanarak JWT Belirteci Nasıl Elde Edilir adresini ziyaret edin.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

JWT token’ına sahip olduğunuzda, bulut depolama alanında bulunan ve İngilizce metin içeren bir görüntü üzerinde OCR işlemi gerçekleştirmek için lütfen aşağıdaki komutu kullanmayı deneyin.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Yerel Görüntüde Görüntüden Metne Dönüştürme

Bu bölümde yerel sürücüden yüklenen görüntü üzerinde OCR işlemi gerçekleştireceğiz.

# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # CAD ve Depolama API istemcilerini kurun 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Cloud Depolamadan Görüntü Üzerinde Python OCR

Cloud depolama alanından bir görselin nasıl yükleneceğini ve Python kod parçacığını kullanarak Görüntü OCR’sinin nasıl gerçekleştirileceğinin ayrıntılarını öğreneceğiz.

# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # CAD ve Depolama API istemcilerini kurun 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

URL’de Görüntü OCR’ı

Bir Web URL’sinde bulunan bir görüntü üzerinde Optik Görüntü Tanıma gerçekleştirme gereksinimiyle karşılaşırsanız, API bu özelliği tam olarak destekler ve bu özelliği yerine getirir. API’nin postrecognizefromurl yöntemi bu gereksinimi karşılamak için kullanılabilir.

# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # CAD ve Depolama API istemcilerini kurun 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Çözüm

Bu makalede, cURL komutunu ve Python kod parçacığını kullanarak çevrimiçi OCR’nin nasıl gerçekleştirileceğinin ayrıntılarını öğrendik. Cloud SDK’larımız MIT lisansı altında oluşturulduğundan, GitHub deposundan tam kaynak kodunu indirmeyi düşünebilirsiniz. Bu depo ayrıca ücretsiz demolarla birlikte gelir ve bunları yürütmek için lütfen aşağıda verilen adımları izleyin.

  • SDK’yi kontrol edin veya pip adresinden edinin (pip install aspose-ocr-cloud)
  • İstemci Kimliğinizi ve İstemci Gizli Anahtarınızı Ayarlayın
  • Python konsolunu çalıştırın Demo veya UnitTests

İlgili Makaleler

Daha fazla bilgi edinmek için lütfen aşağıdaki bağlantıları ziyaret etmenizi şiddetle öneririz: