
Оптическое распознавание символов — это умный способ распознавания контента на растровых изображениях. Он становится еще более полезным, когда вам нужно сохранить старую архивную литературу в цифровом формате. Книги возрастом в тысячи лет можно легко сохранить, преобразовав их в форму цифровых библиотек с помощью операций OCR. Кроме того, с годами эта потребность стала повсеместной. Поэтому для выполнения этого требования вам нужно либо использовать какое-то готовое программное обеспечение, либо, если вам нужно выполнить массовые операции без вмешательства человека, самый быстрый и простой способ — использовать API программирования. В оставшейся части статьи мы объясним шаги по выполнению OCR на изображениях с помощью Python REST API.
OCR Онлайн REST API
Aspose.OCR Cloud SDK для Python замечателен, когда дело касается оптического распознавания символов на растровых изображениях (BMP, JPEG, GIF, PNG, TIFF).При выполнении операций OCR он позволяет вам считывать символы, а также информацию о шрифте. Вы можете выполнить OCR на всем изображении или на определенной его части, указав координаты X и Y. После завершения оптического распознавания символов ответ возвращается в форматах XML или JSON, а извлеченный текст можно сохранить в форматах TXT, PDF и HOCR. Ниже указаны некоторые высокоуровневые функции.
- Автоматическая коррекция перекоса
- Автоматическое и ручное определение макета документа
- Расширенная автоматизированная предварительная обработка изображений
- Поддерживает несколько международных языков.
- Высокая скорость без аппаратных ресурсов
Поддерживаемые языки
Наряду с английским языком API полностью способен распознавать текст на французском, немецком, итальянском, португальском и испанском языках.
Поддерживаемые форматы файлов
Ниже приведен полный список форматов файлов, которые в настоящее время поддерживаются REST API для операций OCR.
.bmp, .dib, .jpeg, .jpg, .jpe, .jp2, .png, .webp, .pbm, .pgm, .ppm, .pxm, .pnm .pfm, .sr, .ras, .tiff, .tif, .exr, .hdr, .pic
OCR онлайн с использованием Python
Наши API разработаны в соответствии с архитектурой REST, поэтому в этом разделе мы рассмотрим преобразование изображения в текст с использованием команд cURL. Мы понимаем, что команды cURL являются гибким способом доступа к API REST через консоль. Теперь одним из предварительных условий является генерация токена JWT. Для получения дополнительных сведений посетите Как получить токен JWT с использованием идентификатора клиента и секретного ключа клиента.
curl -v "https://api.aspose.cloud/oauth2/token" \-X POST \-d "grant_type=client_credentials&client_id=xxxxx-xxxx-xxx-xxxx-&client_secret=xxxxxxxxx" \-H "Content-Type: application/x-www-form-urlencoded" \ -H "Accept: application/json"
Получив токен JWT, попробуйте выполнить операцию OCR на изображении, размещенном в облачном хранилище и содержащем текст на английском языке, с помощью следующей команды.
curl -X GET "https://api.aspose.cloud/v3.0/ocr/downsize.jpeg/recognize?language=1" -H "accept: application/json" -H "authorization: Bearer <JWT Token>"
Преобразование изображения в текст на локальном изображении
В этом разделе мы выполним операцию OCR на изображении, загруженном с локального диска.
# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromContent(object):
def __init__(self):
# Настройка клиентов CAD и Storage API
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
file_name = "5.png"
src = os.path.join(os.path.abspath("data/"), file_name)
try:
res = self.ocr_api.post_recognize_from_content(src) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromContent()
print(obj.recognize_text())
Python OCR на изображении из облачного хранилища
Мы узнаем подробности о том, как загрузить изображение из облачного хранилища и выполнить OCR изображения с помощью фрагмента кода Python.
# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
import json as json
class RecognizeFromStorage(object):
def __init__(self):
# Настройка клиентов САПР и API хранения
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
self.storage_api= asposeocrcloud.api.storage_api.StorageApi(config)
def recognize_text(self):
self.storage_api.upload_file("5.png", r"data\5.png")
res = self.ocr_api.get_recognize_from_storage("5.png")
return res.text
obj=RecognizeFromStorage()
print(obj.recognize_text())
Распознавание текста изображения по URL-адресу
В случае, если вы столкнетесь с необходимостью выполнить оптическое распознавание изображений на изображении, доступном по URL-адресу в Интернете, API полностью способен и поддерживает эту функцию. Метод postrecognizefromurl API может быть использован для выполнения этого требования.
# Полные примеры и файлы данных можно найти по адресу https://github.com/aspose-ocr-cloud/aspose-ocr-cloud-python/
import os
import asposeocrcloud.api.storage_api
from asposeocrcloud.configuration import Configuration
from asposeocrcloud.api.ocr_api import OcrApi
from asposeocrcloud.models import OCRRect, OCRRegion, OCRRequestData, OCRRequestDataStorage, LanguageGroup
from asposeocrcloud.rest import ApiException
import json as json
class RecognizeFromURL(object):
def __init__(self):
# Настройка клиентов САПР и API хранения
with open("config.json") as f:
server_file_info = json.load(f)
config = Configuration( apiKey=server_file_info['AppKey'],
appSid=server_file_info['AppSid'])
self.ocr_api = OcrApi(config)
def recognize_text(self):
url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png"
try:
res = self.ocr_api.post_recognize_from_url(url) # type: asposeocrcloud.models.OcrResponse
return res.text
except ApiException as ex:
print("Exception")
print("Info: " + str(ex))
raise ex
obj=RecognizeFromURL()
print(obj.recognize_text())
Заключение
В этой статье мы узнали подробности о том, как выполнять OCR онлайн с помощью команды cURL, а также с помощью фрагмента кода python. Поскольку наши Cloud SDK созданы по лицензии MIT, вы можете рассмотреть возможность загрузки полного исходного кода из репозитория GitHub. Этот репозиторий также поставляется с бесплатными демонстрациями, и для их запуска следуйте инструкциям, приведенным ниже.
- Ознакомьтесь с SDK или получите его с помощью pip(pip install aspose-ocr-cloud)
- Установите свой идентификатор клиента и секретный код клиента
- Запустите консоль Python Demo или UnitTests
Похожие статьи
Мы настоятельно рекомендуем вам посетить следующие ссылки, чтобы узнать больше о: