OCR מקוון

זיהוי תווים אופטי הוא דרך חכמה לזהות תוכן על פני תמונות רסטר. זה אפילו הופך שימושי יותר כאשר אתה צריך לשמר את הספרות הארכיונית הישנה בפורמט דיגיטלי. ניתן לשמר בקלות ספרים בני אלפי שנים על ידי הפיכתם לצורת ספריות דיגיטליות באמצעות פעולות OCR. כמו כן, עם השנים, הצורך הזה הפך לכל מקום. אז כדי למלא את הדרישה הזו, או שאתה צריך להשתמש בתוכנה מחוץ לקופסה, או במקרה שאתה צריך לבצע פעולות בכמות גדולה ללא התערבות אנושית, הדרך המהירה והקלה ביותר היא להשתמש ב-API לתכנות. בהמשך המאמר, אנו הולכים להסביר את השלבים כיצד לבצע OCR על תמונות באמצעות Python REST API.

OCR Online REST API

Aspose.OCR Cloud SDK עבור Python מדהים בכל הנוגע לזיהוי תווים אופטי על פני תמונות רסטר (BMP, JPEG, GIF, PNG, TIFF).בעת ביצוע פעולות OCR, זה מאפשר לך לקרוא את התווים כמו גם מידע על גופנים. אתה יכול לבצע את ה-OCR על כל התמונה או על חלק מסוים תוך מתן קואורדינטות X ו-Y. לאחר השלמת זיהוי התווים האופטיים, התגובה מוחזרת בפורמטים של XML או JSON וניתן לשמור את הטקסט שחולץ בפורמטים TXT, PDF ו-HOCR. מפורטים להלן כמה תכונות ברמה גבוהה.

  • תיקון הטיה אוטומטי
  • זיהוי פריסת מסמכים אוטומטי וידני
  • עיבוד מוקדם אוטומטי מתקדם של תמונות
  • תומך במספר שפות בינלאומיות
  • מהירות גבוהה ללא משאבי חומרה

שפות נתמכות

יחד עם השפה האנגלית, ה-API מסוגל לזהות טקסט בשפות צרפתית, גרמנית, איטלקית, פורטוגזית וספרדית.

פורמטי קבצים נתמכים

להלן הרשימה המלאה של פורמטי הקבצים הנתמכים כעת על ידי REST API עבור פעולות OCR.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, iffr.][, .sr, iff. .hdr, .pic

OCR מקוון באמצעות Python

ממשקי ה-API שלנו מפותחים לפי ארכיטקטורת REST, אז בסעיף זה, אנו הולכים לחקור את המרת תמונה לטקסט באמצעות פקודות cURL. אנו מבינים שפקודות cURL הן הדרך הגמישה לגשת לממשקי REST API דרך המסוף. כעת אחד הדרישות המוקדמות הוא ליצור אסימון JWT. לפרטים קשורים נוספים, בקר בכתובת כיצד להשיג אסימון JWT באמצעות מזהה לקוח וסוד לקוח.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

לאחר שיש לך את אסימון JWT, נסה להשתמש בפקודה הבאה כדי לבצע פעולת OCR על תמונה הממוקמת באחסון בענן, המכילה טקסט באנגלית.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

המרת תמונה לטקסט בתמונה מקומית

בסעיף זה, אנו הולכים לבצע פעולת OCR על תמונה שנטענה מהכונן המקומי

# לדוגמאות מלאות וקבצי נתונים, נא עבור אל https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # הגדר לקוחות CAD ו- Storage API 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR על תמונה מ-Cloud Storage

אנו הולכים ללמוד את הפרטים כיצד אנו יכולים לטעון תמונה מאחסון בענן ולבצע תמונה OCR באמצעות קטע קוד של Python.

# לדוגמאות מלאות וקבצי נתונים, נא עבור אל https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # הגדר לקוחות CAD ו- Storage API 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

OCR תמונה בכתובת האתר

במקרה שנתקלתם בדרישה לבצע זיהוי תמונה אופטי בתמונה הזמינה בכתובת אתר אינטרנט, ה-API מסוגל לחלוטין ותומך בתכונה זו. ניתן להשתמש בשיטת postrecognizefromurl של API כדי להשיג דרישה זו.

# לדוגמאות מלאות וקבצי נתונים, נא עבור אל https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # הגדר לקוחות CAD ו- Storage API 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

מַסְקָנָה

במאמר זה, למדנו את הפרטים כיצד לבצע OCR מקוון באמצעות פקודת cURL וכן באמצעות קטע קוד python. מכיוון ש-SDK של הענן שלנו בנויים תחת רישיון MIT, אז אתה יכול לשקול להוריד את קוד המקור המלא מ-מאגר GitHub. מאגר זה מגיע גם עם הדגמות חינמיות ועל מנת לבצע אותן, אנא עקוב אחר השלבים המפורטים להלן.

  • בדוק את ה-SDK או קבל מ-pip(pip התקנת aspose-ocr-cloud)
  • הגדר את מזהה הלקוח וסוד הלקוח שלך
  • הפעל את קונסולת Python Demo או UnitTests

מאמרים קשורים

אנו ממליצים לך בחום לבקר בקישורים הבאים כדי ללמוד עוד על: