
تشخیص نوری کاراکتر روشی هوشمندانه برای تشخیص محتوا از روی تصاویر شطرنجی است. حتی زمانی مفیدتر می شود که نیاز به حفظ ادبیات آرشیوی قدیمی در قالب دیجیتال داشته باشید. کتابهای هزاران ساله را میتوان به راحتی با تبدیل آنها به کتابخانههای دیجیتال با استفاده از عملیات OCR حفظ کرد. همچنین با گذشت سال ها این نیاز همه جا فراگیر شده است. بنابراین برای انجام این نیاز، یا باید از نرم افزارهای خارج از جعبه استفاده کنید، یا در صورت نیاز به انجام عملیات انبوه بدون دخالت انسان، سریع ترین و ساده ترین راه استفاده از API برنامه نویسی است. در ادامه مقاله قصد داریم مراحل نحوه اجرای OCR روی تصاویر با استفاده از Python REST API را توضیح دهیم.
OCR Online REST API
Aspose.OCR Cloud SDK برای پایتون زمانی که صحبت از تشخیص نویسه نوری روی تصاویر شطرنجی می شود قابل توجه است (BMP، JPEG، GIF، PNG، TIFF).هنگام انجام عملیات OCR، شما را قادر می سازد تا کاراکترها و همچنین اطلاعات فونت را بخوانید. شما می توانید OCR را روی کل تصویر یا یک بخش خاص در حالی که مختصات X و Y را ارائه می دهید، انجام دهید. پس از تکمیل تشخیص کاراکترهای نوری، پاسخ در قالبهای XML یا JSON برگردانده میشود و متن استخراجشده را میتوان در قالبهای TXT، PDF و HOCR ذخیره کرد. در زیر برخی از ویژگی های سطح بالا مشخص شده است.
- تصحیح انحراف خودکار
- تشخیص طرح بندی سند به صورت خودکار و دستی
- پیش پردازش خودکار تصویر پیشرفته
- پشتیبانی از چندین زبان بین المللی
- سرعت بالا بدون منابع سخت افزاری
زبان های پشتیبانی شده
علاوه بر زبان انگلیسی، API به طور کامل قادر به تشخیص متن به زبان های فرانسوی، آلمانی، ایتالیایی، پرتغالی و اسپانیایی است.
فرمت های فایل پشتیبانی شده
در زیر لیست کاملی از فرمتهای فایلی که در حال حاضر توسط REST API برای عملیات OCR پشتیبانی میشوند، مشخص شده است.
.bmp، .dib، .jpeg، .jpg، .jpe، .jp2، .png، .webp، .pbm، .pgm، .ppm، .pxm، .pnm، .pxm، .pnm، .pxm، .pnm، pxm. .tif، .exr، .hdr، .pic
OCR آنلاین با استفاده از پایتون
API های ما بر اساس معماری REST توسعه یافته اند، بنابراین در این بخش، ما قصد داریم با استفاده از دستورات cURL، تبدیل تصویر به متن را بررسی کنیم. ما می دانیم که دستورات cURL روشی انعطاف پذیر برای دسترسی به API های REST از طریق کنسول هستند. اکنون یکی از پیش نیازها تولید توکن JWT است. برای جزئیات بیشتر، لطفاً به [چگونگی دریافت رمز JWT با استفاده از شناسه مشتری و راز مشتری20 مراجعه کنید.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
پس از دریافت رمز JWT، لطفاً از دستور زیر برای انجام عملیات OCR روی تصویری که در فضای ذخیره سازی ابری قرار دارد و حاوی متن انگلیسی است، استفاده کنید.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
تبدیل تصویر به متن در تصویر محلی
در این قسمت قصد داریم عملیات OCR را روی تصویر بارگذاری شده از درایو محلی انجام دهیم
# برای نمونههای کامل و فایلهای داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# کلاینت های CAD و Storage API را راه اندازی کنید
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
Python OCR در تصویر از Cloud Storage
ما قصد داریم جزئیات مربوط به نحوه بارگذاری یک تصویر از فضای ذخیره سازی ابری و انجام تصویر OCR را با استفاده از قطعه کد پایتون بیاموزیم.
# برای نمونههای کامل و فایلهای داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# کلاینت های CAD و Storage API را راه اندازی کنید
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
تصویر OCR در URL
در صورتی که با الزامی برای انجام تشخیص تصویر نوری روی یک تصویر موجود در URL وب مواجه شدید، API کاملاً قادر است و از این ویژگی پشتیبانی می کند. روش postrecognizefromurl API می تواند برای انجام این نیاز استفاده شود.
# برای نمونههای کامل و فایلهای داده، لطفاً به https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/ بروید
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# کلاینت های CAD و Storage API را راه اندازی کنید
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
نتیجه گیری
در این مقاله، جزئیات نحوه انجام OCR آنلاین با استفاده از دستور cURL و همچنین از طریق قطعه کد پایتون را آموختیم. از آنجایی که SDK های ابری ما تحت مجوز MIT ساخته شده اند، بنابراین می توانید کد منبع کامل را از مخزن GitHub دانلود کنید. این مخزن دارای دموهای رایگان نیز می باشد و برای اجرای آنها لطفا مراحل زیر را دنبال کنید.
- SDK را بررسی کنید یا از pip دریافت کنید (pip install aspose-ocr-cloud)
- شناسه مشتری و راز مشتری خود را تنظیم کنید
- کنسول پایتون Demo یا UnitTests را اجرا کنید
مقالات مرتبط
ما به شما توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: