إجراء التعرف الضوئي على الحروف عبر الإنترنت. تحويل الصورة إلى نص باستخدام Python SDK

التعرف الضوئي على الحروف هو وسيلة ذكية للتعرف على المحتوى عبر الصور النقطية. بل إنه يصبح أكثر فائدة عندما تحتاج إلى الحفاظ على الأدبيات الأرشيفية القديمة بتنسيق رقمي. يمكن بسهولة الحفاظ على الكتب التي يبلغ عمرها آلاف السنين عن طريق تحويلها إلى شكل مكتبات رقمية باستخدام عمليات التعرف الضوئي على الحروف. كما أصبحت هذه الحاجة منتشرة على مر السنين. لذا، من أجل تحقيق هذا المطلب، إما أنك تحتاج إلى استخدام بعض البرامج الجاهزة، أو في حالة احتياجك إلى إجراء عمليات مجمعة دون تدخل بشري، فإن الطريقة السريعة والأسهل هي استخدام واجهة برمجة التطبيقات. في بقية المقالة، سنشرح الخطوات الخاصة بكيفية إجراء التعرف الضوئي على الحروف على الصور باستخدام واجهة برمجة تطبيقات Python REST.

واجهة برمجة تطبيقات OCR Online REST
- اللغات المدعومة
- تنسيقات الملفات المدعومة
التعرف الضوئي على الحروف عبر الإنترنت باستخدام بايثون

واجهة برمجة تطبيقات OCR Online REST

تتميز مجموعة أدوات تطوير البرامج السحابية Aspose.OCR for Python بقدرتها على التعرف الضوئي على الحروف عبر الصور النقطية (BMP، JPEG، GIF، PNG، TIFF).عند إجراء عمليات التعرف الضوئي على الحروف، فإنها تمكنك من قراءة الحروف بالإضافة إلى معلومات الخط. يمكنك إجراء التعرف الضوئي على الحروف على الصورة بأكملها أو جزء معين مع توفير إحداثيات X وY. بعد اكتمال التعرف الضوئي على الحروف، يتم إرجاع الاستجابة بتنسيق XML أو JSON ويمكن حفظ النص المستخرج بتنسيقات TXT وPDF وHOCR. فيما يلي بعض الميزات عالية المستوى.

تصحيح الانحراف التلقائي
الكشف التلقائي واليدوي عن تخطيط المستندات
معالجة الصور المسبقة الآلية المتقدمة
يدعم العديد من اللغات العالمية
سرعة عالية بدون موارد الأجهزة

اللغات المدعومة

إلى جانب اللغة الإنجليزية، تتمتع واجهة برمجة التطبيقات بالقدرة الكاملة على التعرف على النصوص باللغات الفرنسية والألمانية والإيطالية والبرتغالية والإسبانية.

تنسيقات الملفات المدعومة

موضح أدناه القائمة الكاملة لتنسيقات الملفات التي تدعمها حاليًا واجهة برمجة التطبيقات REST لعمليات التعرف الضوئي على الحروف.

.bmp، .dib، .jpeg، .jpg، .jpe، .jp2، .png، .webp، .pbm، .pgm، .ppm، .pxm، .pnm .pfm، .sr، .ras، .tiff، .tif، .exr، .hdr، .pic

التعرف الضوئي على الحروف عبر الإنترنت باستخدام بايثون

تم تطوير واجهات برمجة التطبيقات الخاصة بنا وفقًا لهندسة REST، لذا في هذا القسم، سنستكشف تحويل الصورة إلى نص باستخدام أوامر cURL. نحن ندرك أن أوامر cURL هي الطريقة المرنة للوصول إلى واجهات برمجة تطبيقات REST عبر وحدة التحكم. الآن أحد المتطلبات الأساسية هو إنشاء رمز JWT. لمزيد من التفاصيل ذات الصلة، يرجى زيارة كيفية الحصول على رمز JWT باستخدام معرف العميل وسر العميل.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

بمجرد حصولك على رمز JWT، يرجى محاولة استخدام الأمر التالي لإجراء عملية OCR على صورة موجودة على وحدة تخزين سحابية، تحتوي على نص باللغة الإنجليزية.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

تحويل الصورة إلى نص على الصورة المحلية

في هذا القسم، سنقوم بإجراء عملية التعرف الضوئي على الحروف (OCR) على الصورة المحملة من محرك الأقراص المحلي

# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # إعداد عملاء CAD وStorage API 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

التعرف الضوئي على الحروف باستخدام Python على الصور من التخزين السحابي

سنتعلم التفاصيل حول كيفية تحميل صورة من التخزين السحابي وإجراء التعرف الضوئي على الحروف على الصور باستخدام مقتطف كود Python.

# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # إعداد عملاء CAD وStorage API 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

التعرف الضوئي على الحروف للصور على عنوان URL

في حالة مواجهة متطلب لإجراء التعرف الضوئي على الصور على صورة متاحة على عنوان URL على الويب، فإن واجهة برمجة التطبيقات قادرة تمامًا على ذلك وتدعم هذه الميزة. يمكن استخدام طريقة postrecognizefromurl من واجهة برمجة التطبيقات لإنجاز هذا المتطلب.

# للحصول على أمثلة كاملة وملفات البيانات، يرجى الانتقال إلى https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # إعداد عملاء CAD وStorage API 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

خاتمة

في هذه المقالة، تعلمنا التفاصيل حول كيفية إجراء التعرف الضوئي على الحروف عبر الإنترنت باستخدام أمر cURL وكذلك من خلال مقتطف كود بايثون. نظرًا لأن مجموعات SDK السحابية الخاصة بنا مبنية بموجب ترخيص MIT، فقد تفكر في تنزيل الكود المصدر الكامل من مستودع GitHub. يأتي هذا المستودع أيضًا مع عروض توضيحية مجانية ولتنفيذها، يرجى اتباع الخطوات الموضحة أدناه.

قم بفحص SDK أو احصل عليه من pip(pip install aspose-ocr-cloud)
قم بتعيين معرف العميل والسر الخاص بالعميل
تشغيل وحدة التحكم في Python العرض التوضيحي أو اختبارات الوحدة

واجهة برمجة تطبيقات OCR Online REST#

اللغات المدعومة#

تنسيقات الملفات المدعومة#

التعرف الضوئي على الحروف عبر الإنترنت باستخدام بايثون#

تحويل الصورة إلى نص على الصورة المحلية#

التعرف الضوئي على الحروف باستخدام Python على الصور من التخزين السحابي#

التعرف الضوئي على الحروف للصور على عنوان URL#

خاتمة#

مقالات ذات صلة#