
التعرف الضوئي على الحروف هو وسيلة ذكية للتعرف على المحتوى عبر الصور النقطية. بل إنه يصبح أكثر فائدة عندما تحتاج إلى الحفاظ على الأدبيات الأرشيفية القديمة بتنسيق رقمي. يمكن بسهولة الحفاظ على الكتب التي يبلغ عمرها آلاف السنين عن طريق تحويلها إلى شكل مكتبات رقمية باستخدام عمليات التعرف الضوئي على الحروف. كما أصبحت هذه الحاجة منتشرة على مر السنين. لذا، من أجل تحقيق هذا المطلب، إما أنك تحتاج إلى استخدام بعض البرامج الجاهزة، أو في حالة احتياجك إلى إجراء عمليات مجمعة دون تدخل بشري، فإن الطريقة السريعة والأسهل هي استخدام واجهة برمجة التطبيقات. في بقية المقالة، سنشرح الخطوات الخاصة بكيفية إجراء التعرف الضوئي على الحروف على الصور باستخدام واجهة برمجة تطبيقات Python REST.
واجهة برمجة تطبيقات OCR Online REST
تتميز مجموعة أدوات تطوير البرامج السحابية Aspose.OCR for Python بقدرتها على التعرف الضوئي على الحروف عبر الصور النقطية (BMP، JPEG، GIF، PNG، TIFF).عند إجراء عمليات التعرف الضوئي على الحروف، فإنها تمكنك من قراءة الحروف بالإضافة إلى معلومات الخط. يمكنك إجراء التعرف الضوئي على الحروف على الصورة بأكملها أو جزء معين مع توفير إحداثيات X وY. بعد اكتمال التعرف الضوئي على الحروف، يتم إرجاع الاستجابة بتنسيق XML أو JSON ويمكن حفظ النص المستخرج بتنسيقات TXT وPDF وHOCR. فيما يلي بعض الميزات عالية المستوى.
- تصحيح الانحراف التلقائي
- الكشف التلقائي واليدوي عن تخطيط المستندات
- معالجة الصور المسبقة الآلية المتقدمة
- يدعم العديد من اللغات العالمية
- سرعة عالية بدون موارد الأجهزة
اللغات المدعومة
إلى جانب اللغة الإنجليزية، تتمتع واجهة برمجة التطبيقات بالقدرة الكاملة على التعرف على النصوص باللغات الفرنسية والألمانية والإيطالية والبرتغالية والإسبانية.
تنسيقات الملفات المدعومة
موضح أدناه القائمة الكاملة لتنسيقات الملفات التي تدعمها حاليًا واجهة برمجة التطبيقات REST لعمليات التعرف الضوئي على الحروف.
.bmp، .dib، .jpeg، .jpg، .jpe، .jp2، .png، .webp، .pbm، .pgm، .ppm، .pxm، .pnm .pfm، .sr، .ras، .tiff، .tif، .exr، .hdr، .pic
التعرف الضوئي على الحروف عبر الإنترنت باستخدام بايثون
تم تطوير واجهات برمجة التطبيقات الخاصة بنا وفقًا لهندسة REST، لذا في هذا القسم، سنستكشف تحويل الصورة إلى نص باستخدام أوامر cURL. نحن ندرك أن أوامر cURL هي الطريقة المرنة للوصول إلى واجهات برمجة تطبيقات REST عبر وحدة التحكم. الآن أحد المتطلبات الأساسية هو إنشاء رمز JWT. لمزيد من التفاصيل ذات الصلة، يرجى زيارة كيفية الحصول على رمز JWT باستخدام معرف العميل وسر العميل.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
بمجرد حصولك على رمز JWT، يرجى محاولة استخدام الأمر التالي لإجراء عملية OCR على صورة موجودة على وحدة تخزين سحابية، تحتوي على نص باللغة الإنجليزية.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
تحويل الصورة إلى نص على الصورة المحلية
في هذا القسم، سنقوم بإجراء عملية التعرف الضوئي على الحروف (OCR) على الصورة المحملة من محرك الأقراص المحلي
# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# إعداد عملاء CAD وStorage API
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
التعرف الضوئي على الحروف باستخدام Python على الصور من التخزين السحابي
سنتعلم التفاصيل حول كيفية تحميل صورة من التخزين السحابي وإجراء التعرف الضوئي على الحروف على الصور باستخدام مقتطف كود Python.
# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# إعداد عملاء CAD وStorage API
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
التعرف الضوئي على الحروف للصور على عنوان URL
في حالة مواجهة متطلب لإجراء التعرف الضوئي على الصور على صورة متاحة على عنوان URL على الويب، فإن واجهة برمجة التطبيقات قادرة تمامًا على ذلك وتدعم هذه الميزة. يمكن استخدام طريقة postrecognizefromurl من واجهة برمجة التطبيقات لإنجاز هذا المتطلب.
# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# إعداد عملاء CAD وStorage API
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
خاتمة
في هذه المقالة، تعلمنا التفاصيل حول كيفية إجراء التعرف الضوئي على الحروف عبر الإنترنت باستخدام أمر cURL وكذلك من خلال مقتطف كود بايثون. نظرًا لأن مجموعات SDK السحابية الخاصة بنا مبنية بموجب ترخيص MIT، فقد تفكر في تنزيل الكود المصدر الكامل من مستودع GitHub. يأتي هذا المستودع أيضًا مع عروض توضيحية مجانية ولتنفيذها، يرجى اتباع الخطوات الموضحة أدناه.
- قم بفحص SDK أو احصل عليه من pip(pip install aspose-ocr-cloud)
- قم بتعيين معرف العميل والسر الخاص بالعميل
- تشغيل وحدة التحكم في Python العرض التوضيحي أو اختبارات الوحدة
مقالات ذات صلة
ننصحك بشدة بزيارة الروابط التالية لمعرفة المزيد عن: