Famiglia Aspose.OCR Cloud

Aspose.OCR Cloud consente di eseguire il riconoscimento ottico dei caratteri e la scansione di documenti nel cloud. Supporta la lettura e il riconoscimento del testo dai formati di immagini raster più comunemente utilizzati (BMP, JPG, GIF, PNG, TIFF).Esegui il riconoscimento dei caratteri sulle immagini con meno righe di codice. Basta passare un’immagine specifica all’API Aspose.OCR Cloud e verrà restituita una risposta con il testo riconosciuto. L’API è in grado di riconoscere testo in inglese, francese, spagnolo e restituisce la risposta in formato XML o JSON. In questo articolo, discuteremo i passaggi per eseguire l’OCR sulle immagini utilizzando Java SDK.

Durante il processo di riconoscimento, puoi leggere i caratteri e le informazioni associate al font. Puoi eseguire l’OCR sull’intera immagine o fornire le coordinate X e Y per eseguirlo su una porzione specifica dell’immagine raster. È anche in grado di eseguire una correzione automatica dell’inclinazione, oltre a operazioni di rilevamento automatico e manuale del layout del documento ad alta velocità, poiché non ha dipendenza dalle risorse hardware.

Piattaforma indipendente

La Cloud API è completamente indipendente dal tuo sistema operativo, sistema di database o linguaggio di sviluppo e puoi usare qualsiasi linguaggio e piattaforma che supporti HTTP per interagire con la nostra API. Tuttavia, scrivere manualmente il codice client può essere difficile, soggetto a errori e richiedere molto tempo. Pertanto, per facilitare i nostri clienti nell’uso del linguaggio Java, viene pubblicato un Aspose.OCR Cloud Java SDK specifico per il linguaggio. Quando si usa l’SDK, si occupa di molti dettagli di basso livello durante l’esecuzione delle richieste e la gestione delle risposte e ti consente di concentrarti sulla scrittura di codice specifico per le tue particolari esigenze di progetto.

Riconoscere il testo dall’immagine URL

La Cloud OCR API fornisce un’opzione per eseguire direttamente operazioni di riconoscimento del testo su file di immagini disponibili tramite URL web. Non è necessario caricarlo esclusivamente su un particolare archivio cloud.

Frammento di codice Java

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Blocco catch generato automaticamente
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// metodo per riconoscere il testo da un'immagine ospitata su URL
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

Riconoscere il testo dall’immagine in archivio

Frammento di codice Java

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Blocco catch generato automaticamente
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

comando cURL

È possibile accedere alle API Cloud anche tramite comandi cURL e, analogamente, anche ad Aspose.OCR Cloud è possibile accedere tramite il comando cURL. Tuttavia, tieni presente che per accedere alle API, dobbiamo generare un token di accesso JWT basato sulle nostre credenziali client personalizzate. Esegui il seguente comando per la generazione del token di accesso JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Una volta generato il token JWT, utilizzare il seguente comando per eseguire l’OCR sulle immagini.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

Richiedi URL

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

Corpo della risposta

{
  "text": "MOORE STEPHENS",
  "code": 200
}

Conclusione

In questo articolo, abbiamo discusso i dettagli su come eseguire l’OCR sulle immagini. Inoltre, abbiamo esplorato le opzioni per eseguire operazioni di riconoscimento ottico dei caratteri sulle immagini utilizzando i comandi cURL. Si prega di notare che il codice sorgente completo dell’SDK è disponibile su GitHub. Allo stesso modo, consigliamo anche di saperne di più sull’API esplorando il prodotto Documentazione.

Articoli correlati