OCR ონლაინ

ოპტიკური სიმბოლოების ამოცნობა არის ჭკვიანური გზა შინაარსის ამოცნობისთვის რასტრულ სურათებზე. ის უფრო სასარგებლოც კი ხდება, როცა ძველი საარქივო ლიტერატურის ციფრულ ფორმატში შენარჩუნება გჭირდებათ. ათასობით წლის წიგნის ადვილად შენახვა შესაძლებელია ციფრული ბიბლიოთეკების სახით OCR ოპერაციების გამოყენებით. ასევე, წლების განმავლობაში, ეს საჭიროება საყოველთაო გახდა. ასე რომ, ამ მოთხოვნის შესასრულებლად, ან უნდა გამოიყენოთ გარკვეული პროგრამული უზრუნველყოფა, ან იმ შემთხვევაში, თუ თქვენ გჭირდებათ დიდი ოპერაციების შესრულება ადამიანის ჩარევის გარეშე, სწრაფი და მარტივი გზაა პროგრამირების API-ს გამოყენება. სტატიის დანარჩენ ნაწილში ჩვენ ვაპირებთ ავხსნათ ნაბიჯები, თუ როგორ უნდა შეასრულოთ OCR სურათებზე Python REST API-ს გამოყენებით.

OCR Online REST API

Aspose.OCR Cloud SDK Python-ისთვის გასაოცარია, როდესაც საქმე ეხება სიმბოლოების ოპტიკურ ამოცნობას რასტრულ სურათებზე (BMP, JPEG, GIF, PNG, TIFF).OCR ოპერაციების შესრულებისას, ის საშუალებას გაძლევთ წაიკითხოთ სიმბოლოები და შრიფტის ინფორმაცია. თქვენ შეგიძლიათ შეასრულოთ OCR მთელ სურათზე ან კონკრეტულ ნაწილზე X და Y კოორდინატების მიწოდებისას. ოპტიკური სიმბოლოების ამოცნობის დასრულების შემდეგ, პასუხი ბრუნდება XML ან JSON ფორმატში და ამოღებული ტექსტი შეიძლება შეინახოს TXT, PDF და HOCR ფორმატებში. ქვემოთ მოცემულია რამდენიმე მაღალი დონის ფუნქცია.

  • დახრილობის ავტომატური კორექტირება
  • დოკუმენტის განლაგების ავტომატური და ხელით გამოვლენა
  • გაფართოებული ავტომატური სურათის წინასწარი დამუშავება
  • მხარს უჭერს მრავალ საერთაშორისო ენას
  • მაღალი სიჩქარე ტექნიკის რესურსების გარეშე

მხარდაჭერილი ენები

ინგლისურ ენასთან ერთად API-ს შეუძლია სრულად ამოიცნოს ტექსტი ფრანგულ, გერმანულ, იტალიურ, პორტუგალიურ და ესპანურ ენებზე.

მხარდაჭერილი ფაილის ფორმატები

ქვემოთ მოცემულია ფაილის ფორმატების სრული სია, რომლებსაც ამჟამად მხარს უჭერს REST API OCR ოპერაციებისთვის.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm, .pxm, .pnm, .pxm, .pnm, .pxm, .pnm. .tif, .exr, .hdr, .pic

OCR ონლაინ პითონის გამოყენებით

ჩვენი API შემუშავებულია REST არქიტექტურის მიხედვით, ამიტომ ამ განყოფილებაში ჩვენ ვაპირებთ გამოვიკვლიოთ გამოსახულების ტექსტში კონვერტაცია cURL ბრძანებების გამოყენებით. ჩვენ გვესმის, რომ cURL ბრძანებები არის REST API-ებზე წვდომის მოქნილი გზა კონსოლის საშუალებით. ახლა ერთ-ერთი წინაპირობაა JWT ტოკენის გენერირება. დამატებითი დეტალებისთვის, გთხოვთ, ეწვიოთ How to Obtain JWT token using Client ID და Client Secret.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

მას შემდეგ, რაც თქვენ გაქვთ JWT ჟეტონი, გთხოვთ, გამოიყენოთ შემდეგი ბრძანება, რათა შეასრულოთ OCR ოპერაცია ღრუბლოვან საცავში მდებარე სურათზე, რომელიც შეიცავს ინგლისურ ტექსტს.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

სურათის ტექსტის კონვერტაცია ადგილობრივ სურათზე

ამ განყოფილებაში ჩვენ ვაპირებთ შევასრულოთ OCR ოპერაცია ლოკალური დისკიდან დატვირთულ სურათზე

# სრული მაგალითებისა და მონაცემთა ფაილებისთვის გთხოვთ ეწვიოთ https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # დააყენეთ CAD და Storage API კლიენტები 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR სურათზე Cloud Storage-დან

ჩვენ ვაპირებთ ვისწავლოთ დეტალები იმის შესახებ, თუ როგორ შეგვიძლია ჩავტვირთოთ სურათი Cloud საცავიდან და შევასრულოთ Image OCR Python კოდის ფრაგმენტის გამოყენებით.

# სრული მაგალითებისა და მონაცემთა ფაილებისთვის გთხოვთ ეწვიოთ https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # დააყენეთ CAD და Storage API კლიენტები 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

სურათის OCR URL-ზე

იმ შემთხვევაში, თუ თქვენ წააწყდებით ოპტიკური გამოსახულების ამოცნობის მოთხოვნას ვებ URL-ზე არსებულ სურათზე, API სრულად შეუძლია და მხარს უჭერს ამ ფუნქციას. ამ მოთხოვნის შესასრულებლად შეიძლება გამოყენებულ იქნას API-ს postrecognizefromurl მეთოდი.

# სრული მაგალითებისა და მონაცემთა ფაილებისთვის გთხოვთ ეწვიოთ https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # დააყენეთ CAD და Storage API კლიენტები 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

დასკვნა

ამ სტატიაში ჩვენ ვისწავლეთ დეტალები, თუ როგორ უნდა შეასრულოთ OCR ონლაინ რეჟიმში cURL ბრძანების გამოყენებით, ასევე პითონის კოდის ფრაგმენტით. ვინაიდან ჩვენი Cloud SDK-ები აგებულია MIT ლიცენზიით, ასე რომ თქვენ შეგიძლიათ განიხილოთ სრული წყაროს კოდის ჩამოტვირთვა GitHub საცავიდან. ამ საცავს ასევე გააჩნია უფასო დემო ვერსია და მათი განსახორციელებლად, გთხოვთ, მიჰყევით ქვემოთ მოცემულ ნაბიჯებს.

  • შეამოწმეთ SDK ან მიიღეთ pip-დან (pip install aspose-ocr-cloud)
  • დააყენეთ თქვენი კლიენტის ID და კლიენტის საიდუმლო
  • გაუშვით Python კონსოლი Demo ან UnitTests

დაკავშირებული სტატიები

ჩვენ გირჩევთ, ეწვიოთ შემდეგ ბმულებს მეტის გასაგებად: