
Optik Karakter Tanıma, raster görüntüler üzerindeki içeriği tanımanın akıllı bir yoludur. Eski arşiv literatürünü dijital bir formatta saklamanız gerektiğinde daha da kullanışlı hale gelir. Binlerce yıllık kitaplar, OCR işlemleri kullanılarak dijital kütüphaneler biçimine dönüştürülerek kolayca saklanabilir. Ayrıca, yıllar geçtikçe bu ihtiyaç her yerde görülür hale geldi. Bu gereksinimi karşılamak için, ya kullanıma hazır bir yazılım kullanmanız ya da insan müdahalesi olmadan toplu işlemler gerçekleştirmeniz gerekiyorsa, en hızlı ve en kolay yol programlama API’sini kullanmaktır. Makalenin geri kalanında, Python REST API’sini kullanarak görüntülerde OCR’nin nasıl gerçekleştirileceğine dair adımları açıklayacağız.
OCR Çevrimiçi REST API
Aspose.OCR for Python Cloud SDK, raster görüntüler (BMP, JPEG, GIF, PNG, TIFF) üzerinde optik karakter tanıma söz konusu olduğunda dikkat çekicidir. OCR işlemlerini gerçekleştirirken, karakterleri ve yazı tipi bilgilerini okumanızı sağlar. X ve Y koordinatlarını sağlayarak tüm görüntüde veya belirli bir bölümde OCR gerçekleştirebilirsiniz. Optik Karakter Tanıma tamamlandıktan sonra, yanıt XML veya JSON formatlarında döndürülür ve çıkarılan metin TXT, PDF ve HOCR formatlarında kaydedilebilir. Aşağıda bazı üst düzey özellikler belirtilmiştir.
- Otomatik eğiklik düzeltme
- Otomatik ve manuel belge düzeni algılama
- Gelişmiş otomatik görüntü ön işleme
- Birden fazla uluslararası dili destekler
- Donanım kaynağı olmadan yüksek hız
Desteklenen diller
API, İngilizce dilinin yanı sıra Fransızca, Almanca, İtalyanca, Portekizce ve İspanyolca dillerindeki metinleri de tanıma yeteneğine sahiptir.
Desteklenen dosya biçimleri
Aşağıda, REST API’nin OCR işlemleri için şu anda desteklediği dosya biçimlerinin tam listesi verilmiştir.
.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic
Python kullanarak Çevrimiçi OCR
API’lerimiz REST mimarisine göre geliştirilir, bu nedenle bu bölümde cURL komutlarını kullanarak Görüntüden Metne dönüştürmeyi inceleyeceğiz. cURL komutlarının konsol aracılığıyla REST API’lerine erişmenin esnek yolu olduğunu anlıyoruz. Şimdi ön koşullardan biri bir JWT belirteci oluşturmaktır. İlgili diğer ayrıntılar için lütfen İstemci Kimliği ve İstemci Gizli Anahtarı Kullanarak JWT Belirteci Nasıl Elde Edilir adresini ziyaret edin.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
JWT token’ına sahip olduğunuzda, bulut depolama alanında bulunan ve İngilizce metin içeren bir görüntü üzerinde OCR işlemi gerçekleştirmek için lütfen aşağıdaki komutu kullanmayı deneyin.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
Yerel Görüntüde Görüntüden Metne Dönüştürme
Bu bölümde yerel sürücüden yüklenen görüntü üzerinde OCR işlemi gerçekleştireceğiz.
# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# CAD ve Depolama API istemcilerini kurun
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
Cloud Depolamadan Görüntü Üzerinde Python OCR
Cloud depolama alanından bir görselin nasıl yükleneceğini ve Python kod parçacığını kullanarak Görüntü OCR’sinin nasıl gerçekleştirileceğinin ayrıntılarını öğreneceğiz.
# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# CAD ve Depolama API istemcilerini kurun
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
URL’de Görüntü OCR’ı
Bir Web URL’sinde bulunan bir görüntü üzerinde Optik Görüntü Tanıma gerçekleştirme gereksinimiyle karşılaşırsanız, API bu özelliği tam olarak destekler ve bu özelliği yerine getirir. API’nin postrecognizefromurl yöntemi bu gereksinimi karşılamak için kullanılabilir.
# Tam örnekler ve veri dosyaları için lütfen https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ adresine gidin.
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# CAD ve Depolama API istemcilerini kurun
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
Çözüm
Bu makalede, cURL komutunu ve Python kod parçacığını kullanarak çevrimiçi OCR’nin nasıl gerçekleştirileceğinin ayrıntılarını öğrendik. Cloud SDK’larımız MIT lisansı altında oluşturulduğundan, GitHub deposundan tam kaynak kodunu indirmeyi düşünebilirsiniz. Bu depo ayrıca ücretsiz demolarla birlikte gelir ve bunları yürütmek için lütfen aşağıda verilen adımları izleyin.
- SDK’yi kontrol edin veya pip adresinden edinin (pip install aspose-ocr-cloud)
- İstemci Kimliğinizi ve İstemci Gizli Anahtarınızı Ayarlayın
- Python konsolunu çalıştırın Demo veya UnitTests
İlgili Makaleler
Daha fazla bilgi edinmek için lütfen aşağıdaki bağlantıları ziyaret etmenizi şiddetle öneririz: