OCR آنلاین را انجام دهید. تصویر به متن با استفاده از Python SDK

تشخیص نوری کاراکتر روشی هوشمندانه برای تشخیص محتوا از روی تصاویر شطرنجی است. حتی زمانی مفیدتر می شود که نیاز به حفظ ادبیات آرشیوی قدیمی در قالب دیجیتال داشته باشید. کتاب‌های هزاران ساله را می‌توان به راحتی با تبدیل آنها به کتابخانه‌های دیجیتال با استفاده از عملیات OCR حفظ کرد. همچنین با گذشت سال ها این نیاز همه جا فراگیر شده است. بنابراین برای انجام این نیاز، یا باید از نرم افزارهای خارج از جعبه استفاده کنید، یا در صورت نیاز به انجام عملیات انبوه بدون دخالت انسان، سریع ترین و ساده ترین راه استفاده از API برنامه نویسی است. در ادامه مقاله قصد داریم مراحل نحوه اجرای OCR روی تصاویر با استفاده از Python REST API را توضیح دهیم.

OCR Online REST API
- زبان های پشتیبانی شده
- فرمت های فایل پشتیبانی شده
OCR آنلاین با استفاده از پایتون

OCR Online REST API

Aspose.OCR Cloud SDK برای پایتون زمانی که صحبت از تشخیص نویسه نوری روی تصاویر شطرنجی می شود قابل توجه است (BMP، JPEG، GIF، PNG، TIFF).هنگام انجام عملیات OCR، شما را قادر می سازد تا کاراکترها و همچنین اطلاعات فونت را بخوانید. شما می توانید OCR را روی کل تصویر یا یک بخش خاص در حالی که مختصات X و Y را ارائه می دهید، انجام دهید. پس از تکمیل تشخیص کاراکترهای نوری، پاسخ در قالب‌های XML یا JSON برگردانده می‌شود و متن استخراج‌شده را می‌توان در قالب‌های TXT، PDF و HOCR ذخیره کرد. در زیر برخی از ویژگی های سطح بالا مشخص شده است.

تصحیح انحراف خودکار
تشخیص طرح بندی سند به صورت خودکار و دستی
پیش پردازش خودکار تصویر پیشرفته
پشتیبانی از چندین زبان بین المللی
سرعت بالا بدون منابع سخت افزاری

زبان های پشتیبانی شده

علاوه بر زبان انگلیسی، API به طور کامل قادر به تشخیص متن به زبان های فرانسوی، آلمانی، ایتالیایی، پرتغالی و اسپانیایی است.

فرمت های فایل پشتیبانی شده

در زیر لیست کاملی از فرمت‌های فایلی که در حال حاضر توسط REST API برای عملیات OCR پشتیبانی می‌شوند، مشخص شده است.

.bmp، .dib، .jpeg، .jpg، .jpe، .jp2، .png، .webp، .pbm، .pgm، .ppm، .pxm، .pnm، .pxm، .pnm، .pxm، .pnm، pxm. .tif، .exr، .hdr، .pic

OCR آنلاین با استفاده از پایتون

API های ما بر اساس معماری REST توسعه یافته اند، بنابراین در این بخش، ما قصد داریم با استفاده از دستورات cURL، تبدیل تصویر به متن را بررسی کنیم. ما می دانیم که دستورات cURL روشی انعطاف پذیر برای دسترسی به API های REST از طریق کنسول هستند. اکنون یکی از پیش نیازها تولید توکن JWT است. برای جزئیات بیشتر، لطفاً به [چگونگی دریافت رمز JWT با استفاده از شناسه مشتری و راز مشتری20 مراجعه کنید.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

پس از دریافت رمز JWT، لطفاً از دستور زیر برای انجام عملیات OCR روی تصویری که در فضای ذخیره سازی ابری قرار دارد و حاوی متن انگلیسی است، استفاده کنید.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

تبدیل تصویر به متن در تصویر محلی

در این قسمت قصد داریم عملیات OCR را روی تصویر بارگذاری شده از درایو محلی انجام دهیم

# برای نمونه‌های کامل و فایل‌های داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # کلاینت های CAD و Storage API را راه اندازی کنید 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR در تصویر از Cloud Storage

ما قصد داریم جزئیات مربوط به نحوه بارگذاری یک تصویر از فضای ذخیره سازی ابری و انجام تصویر OCR را با استفاده از قطعه کد پایتون بیاموزیم.

# برای نمونه‌های کامل و فایل‌های داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # کلاینت های CAD و Storage API را راه اندازی کنید 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

تصویر OCR در URL

در صورتی که با الزامی برای انجام تشخیص تصویر نوری روی یک تصویر موجود در URL وب مواجه شدید، API کاملاً قادر است و از این ویژگی پشتیبانی می کند. روش postrecognizefromurl API می تواند برای انجام این نیاز استفاده شود.

# برای نمونه‌های کامل و فایل‌های داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # کلاینت های CAD و Storage API را راه اندازی کنید 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

نتیجه گیری

در این مقاله، جزئیات نحوه انجام OCR آنلاین با استفاده از دستور cURL و همچنین از طریق قطعه کد پایتون را آموختیم. از آنجایی که SDK های ابری ما تحت مجوز MIT ساخته شده اند، بنابراین می توانید کد منبع کامل را از مخزن GitHub دانلود کنید. این مخزن دارای دموهای رایگان نیز می باشد و برای اجرای آنها لطفا مراحل زیر را دنبال کنید.

SDK را بررسی کنید یا از pip دریافت کنید (pip install aspose-ocr-cloud)
شناسه مشتری و راز مشتری خود را تنظیم کنید
کنسول پایتون Demo یا UnitTests را اجرا کنید

مقالات مرتبط

ما به شما توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید:

OCR Online REST API#

زبان های پشتیبانی شده#

فرمت های فایل پشتیبانی شده#

OCR آنلاین با استفاده از پایتون#

تبدیل تصویر به متن در تصویر محلی#

Python OCR در تصویر از Cloud Storage#

تصویر OCR در URL#

نتیجه گیری#

مقالات مرتبط#