Aspose.OCR Cloud Family

Aspose.OCR Cloud дозволяє виконувати оптичне розпізнавання символів і сканувати документи в хмарі. Він підтримує читання та розпізнавання тексту з найбільш поширених форматів растрових зображень (BMP, JPG, GIF, PNG, TIFF).Виконуйте розпізнавання символів на зображеннях із меншою кількістю рядків коду. Просто передайте певне зображення до Aspose.OCR Cloud API, і він поверне відповідь із розпізнаним текстом. API здатний розпізнавати текст англійською, французькою та іспанською мовами та повертати відповідь у форматах XML або JSON. У цій статті ми збираємося обговорити кроки для OCR на зображеннях за допомогою Java SDK.

Під час процесу розпізнавання ви можете читати символи, а також пов’язану інформацію про шрифт. Ви можете виконати OCR для всього зображення або надати координати X і Y, щоб виконати це для певної частини растрового зображення. Він також здатний виконувати автоматичне виправлення перекосів, а також автоматичні та ручні операції виявлення макета документа з високою швидкістю, оскільки він не залежить від апаратних ресурсів.

Незалежний від платформи

Хмарний API повністю не залежить від вашої операційної системи, системи бази даних або мови розробки, і ви можете використовувати будь-яку мову та платформу, які підтримують HTTP, для взаємодії з нашим API. Однак написання клієнтського коду вручну може бути важким, схильним до помилок і займає багато часу. Тому, щоб полегшити нашим клієнтам використання мови Java, опубліковано пакет Aspose.OCR Cloud Java SDK для певної мови. Під час використання SDK він піклується про багато низькорівневих деталей під час надсилання запитів і обробки відповідей і дозволяє вам зосередитися на написанні коду, що відповідає потребам вашого конкретного проекту.

Розпізнавання тексту із зображення URL-адреси

Cloud OCR API надає можливість безпосередньо виконувати операції розпізнавання тексту на файлах зображень, доступних через веб-URL-адреси. Вам не потрібно завантажувати його виключно в певне хмарне сховище.

Фрагмент коду Java

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Автоматично створений блок catch
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// метод розпізнавання тексту із зображення, розміщеного на URL
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

Розпізнавання тексту із зображення в сховищі

Фрагмент коду Java

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Автоматично створений блок catch
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

команда cURL

Доступ до Cloud API також можна отримати за допомогою команд cURL, так само можна отримати доступ до Aspose.OCR Cloud за допомогою команди cURL. Однак зауважте, що для доступу до API нам потрібно створити маркер доступу JWT на основі персональних облікових даних клієнта. Будь ласка, виконайте таку команду для створення маркера доступу JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Після створення маркера JWT скористайтеся наступною командою для розпізнавання зображень.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

URL запиту

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

Тіло відповіді

{
  "text": "MOORE STEPHENS",
  "code": 200
}

Висновок

У цій статті ми детально розповіли про те, як розпізнати зображення. Крім того, ми дослідили варіанти виконання операцій оптичного розпізнавання символів на зображеннях за допомогою команд cURL. Зверніть увагу, що повний вихідний код SDK доступний на GitHub. Подібним чином ми також рекомендуємо дізнатися більше про API, ознайомившись із продуктом Документація.

Схожі статті