Выполните OCR онлайн. Изображение в текст с использованием Python SDK

Оптическое распознавание символов — это умный способ распознавания контента на растровых изображениях. Он становится еще более полезным, когда вам нужно сохранить старую архивную литературу в цифровом формате. Книги возрастом в тысячи лет можно легко сохранить, преобразовав их в форму цифровых библиотек с помощью операций OCR. Кроме того, с годами эта потребность стала повсеместной. Поэтому для выполнения этого требования вам нужно либо использовать какое-то готовое программное обеспечение, либо, если вам нужно выполнить массовые операции без вмешательства человека, самый быстрый и простой способ — использовать API программирования. В оставшейся части статьи мы объясним шаги по выполнению OCR на изображениях с помощью Python REST API.

OCR Онлайн REST API
- Поддерживаемые языки
- Поддерживаемые форматы файлов
OCR онлайн с использованием Python

OCR Онлайн REST API

Aspose.OCR Cloud SDK для Python замечателен, когда дело касается оптического распознавания символов на растровых изображениях (BMP, JPEG, GIF, PNG, TIFF).При выполнении операций OCR он позволяет вам считывать символы, а также информацию о шрифте. Вы можете выполнить OCR на всем изображении или на определенной его части, указав координаты X и Y. После завершения оптического распознавания символов ответ возвращается в форматах XML или JSON, а извлеченный текст можно сохранить в форматах TXT, PDF и HOCR. Ниже указаны некоторые высокоуровневые функции.

Автоматическая коррекция перекоса
Автоматическое и ручное определение макета документа
Расширенная автоматизированная предварительная обработка изображений
Поддерживает несколько международных языков.
Высокая скорость без аппаратных ресурсов

Поддерживаемые языки

Наряду с английским языком API полностью способен распознавать текст на французском, немецком, итальянском, португальском и испанском языках.

Поддерживаемые форматы файлов

Ниже приведен полный список форматов файлов, которые в настоящее время поддерживаются REST API для операций OCR.

.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic

OCR онлайн с использованием Python

Наши API разработаны в соответствии с архитектурой REST, поэтому в этом разделе мы рассмотрим преобразование изображения в текст с использованием команд cURL. Мы понимаем, что команды cURL являются гибким способом доступа к API REST через консоль. Теперь одним из предварительных условий является генерация токена JWT. Для получения дополнительных сведений посетите Как получить токен JWT с использованием идентификатора клиента и секретного ключа клиента.

curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"

Получив токен JWT, попробуйте выполнить операцию OCR на изображении, размещенном в облачном хранилище и содержащем текст на английском языке, с помощью следующей команды.

curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"

Преобразование изображения в текст на локальном изображении

В этом разделе мы выполним операцию OCR на изображении, загруженном с локального диска.

# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromContent(object):

  def __init__(self):

      # Настройка клиентов CAD и Storage API 
      with open("config.json") as f:
          server_file_info = json.load(f)


      config = Configuration( apiKey=server_file_info['AppKey'],
                              appSid=server_file_info['AppSid'])      
      self.ocr_api = OcrApi(config)

  def recognize_text(self):
      file_name = "5.png"
      src = os.path.join(os.path.abspath("data/"), file_name)
      try:

          res = self.ocr_api.post_recognize_from_content(src)  # type: asposeocrcloud.models.OcrResponse
          return res.text

      except ApiException as ex:
          print("Exception")
          print("Info: " + str(ex))
          raise ex

obj=RecognizeFromContent()
print(obj.recognize_text())

Python OCR на изображении из облачного хранилища

Мы узнаем подробности о том, как загрузить изображение из облачного хранилища и выполнить OCR изображения с помощью фрагмента кода Python.

# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup

import json as json

class  RecognizeFromStorage(object):

    def __init__(self):

        # Настройка клиентов САПР и API хранения 
        with open("config.json") as f:
            server_file_info = json.load(f)
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)
        self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)

    def recognize_text(self):
        self.storage_api.upload_file("5.png", r"data\5.png")
        res = self.ocr_api.get_recognize_from_storage("5.png")
        return res.text

obj=RecognizeFromStorage()
print(obj.recognize_text())

Распознавание текста изображения по URL-адресу

В случае, если вы столкнетесь с необходимостью выполнить оптическое распознавание изображений на изображении, доступном по URL-адресу в Интернете, API полностью способен и поддерживает эту функцию. Метод postrecognizefromurl API может быть использован для выполнения этого требования.

# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException

import json as json

class  RecognizeFromURL(object):

    def __init__(self):
       
        # Настройка клиентов САПР и API хранения 
        with open("config.json") as f:
            server_file_info = json.load(f)        
        config = Configuration( apiKey=server_file_info['AppKey'],
                                appSid=server_file_info['AppSid'])      
        self.ocr_api = OcrApi(config)  
         
    def recognize_text(self):
        url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
        try:
            res = self.ocr_api.post_recognize_from_url(url)  # type: asposeocrcloud.models.OcrResponse
            return res.text

        except ApiException as ex:
            print("Exception")
            print("Info: " + str(ex))
            raise ex
                   
obj=RecognizeFromURL()
print(obj.recognize_text())

Заключение

В этой статье мы узнали подробности о том, как выполнять OCR онлайн с помощью команды cURL, а также с помощью фрагмента кода python. Поскольку наши Cloud SDK созданы по лицензии MIT, вы можете рассмотреть возможность загрузки полного исходного кода из репозитория GitHub. Этот репозиторий также поставляется с бесплатными демонстрациями, и для их запуска следуйте инструкциям, приведенным ниже.

Ознакомьтесь с SDK или получите его с помощью pip(pip install aspose-ocr-cloud)
Установите свой идентификатор клиента и секретный код клиента
Запустите консоль Python Demo или UnitTests

OCR Онлайн REST API#

Поддерживаемые языки#

Поддерживаемые форматы файлов#

OCR онлайн с использованием Python#

Преобразование изображения в текст на локальном изображении#

Python OCR на изображении из облачного хранилища#

Распознавание текста изображения по URL-адресу#

Заключение#

Похожие статьи#