Aspose.OCR felhőcsalád

Az Aspose.OCR Cloud lehetővé teszi az optikai karakterfelismerés és a dokumentumok beolvasását a felhőben. Támogatja a leggyakrabban használt raszteres képformátumok (BMP, JPG, GIF, PNG, TIFF) szövegének olvasását és felismerését. Karakterfelismerés végrehajtása kevesebb kódsorral rendelkező képeken. Egyszerűen adjon át egy adott képet az Aspose.OCR Cloud API-nak, és a válasz felismert szöveggel tér vissza. Az API képes felismerni az angol, francia, spanyol szöveget, és XML vagy JSON formátumban adja vissza a választ. Ebben a cikkben a Java SDK használatával készült képek OCR végrehajtásának lépéseit tárgyaljuk.

A felismerési folyamat során elolvashatja a karaktereket, valamint a kapcsolódó betűtípus-információkat. Elvégezheti az OCR-t a teljes képen, vagy megadhat X és Y koordinátákat a raszterkép egy meghatározott részén történő végrehajtásához. Automatikus ferdeség-javításra, valamint automatikus és kézi dokumentumelrendezés-észlelési műveletekre is képes nagy sebességgel, mivel nincs hardver erőforrás-függősége.

Platformfüggetlen

A Cloud API teljesen független az Ön operációs rendszerétől, adatbázisrendszerétől vagy fejlesztési nyelvétől, és bármilyen HTTP-t támogató nyelvet és platformot használhat az API-nkkal való interakcióhoz. Az ügyfélkód kézi írása azonban nehéz, hibás és időigényes lehet. Ezért annak érdekében, hogy ügyfeleink Java nyelvet használhassanak, megjelenik egy nyelvspecifikus Aspose.OCR Cloud Java SDK. Az SDK használatakor sok alacsony szintű részletről gondoskodik a kérések és a válaszok kezelése közben, és lehetővé teszi, hogy az adott projekt igényeinek megfelelő kód írására összpontosítson.

Szöveg felismerése az URL-képből

A Cloud OCR API lehetőséget biztosít a szövegfelismerési műveletek közvetlen végrehajtására a web URL-eken keresztül elérhető képfájlokon. Nem kell kizárólag egy adott felhőtárhelyre feltöltenie.

Java kódrészlet

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Automatikusan generált elkapó blokk
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// módszer az URL-en tárolt kép szövegének felismerésére
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

Szöveg felismerése a tárhelyen lévő képből

Java kódrészlet

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Automatikusan generált elkapó blokk
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

cURL parancsot

A Cloud API-k a cURL parancsokkal is elérhetők, és hasonlóképpen az Aspose.OCR Cloud is elérhető a cURL paranccsal. Felhívjuk azonban figyelmét, hogy az API-k eléréséhez létre kell hoznunk egy JWT hozzáférési tokent a személyre szabott ügyfél-hitelesítő adataink alapján. Kérjük, hajtsa végre a következő parancsot a JWT hozzáférési jogkivonat generálásához.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

A JWT token létrehozása után használja a következő parancsot a képek OCR végrehajtásához.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

URL kérése

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

Választest

{
  "text": "MOORE STEPHENS",
  "code": 200
}

Következtetés

Ebben a cikkben megvitattuk a képek OCR végrehajtásának részleteit. Megvizsgáltuk továbbá az optikai karakterfelismerési műveletek elvégzésének lehetőségeit a képeken cURL parancsok használatával. Felhívjuk figyelmét, hogy az SDK teljes forráskódja elérhető a GitHub webhelyen. Hasonlóképpen azt is javasoljuk, hogy többet tudjon meg az API-ról a Dokumentáció termék felfedezésével.

Kapcsolódó cikkek