Família Aspose.OCR Cloud

Aspose.OCR Cloud permite que você execute o reconhecimento óptico de caracteres e a digitalização de documentos na nuvem. Ele suporta a leitura e o reconhecimento de texto dos formatos de imagem raster mais comumente usados (BMP, JPG, GIF, PNG, TIFF).Execute o reconhecimento de caracteres em imagens com menos linhas de código. Basta passar uma imagem específica para a API Aspose.OCR Cloud e retornará uma resposta com o texto reconhecido. A API é capaz de reconhecer texto em inglês, francês, espanhol e retorna a resposta nos formatos XML ou JSON. Neste artigo, discutiremos as etapas para executar o OCR em imagens usando o Java SDK.

Durante o processo de reconhecimento, você pode ler caracteres, bem como as informações de fonte associadas. Você pode executar OCR na imagem inteira ou fornecer coordenadas X e Y para executá-lo em uma parte específica da imagem raster. Ele também é capaz de executar uma correção automática de inclinação, além de operações de detecção automática e manual de layout de documento em alta velocidade, pois não tem dependência de recursos de hardware.

Independente de plataforma

A Cloud API é completamente independente do seu sistema operacional, sistema de banco de dados ou linguagem de desenvolvimento e você pode usar qualquer linguagem e plataforma que suporte HTTP para interagir com nossa API. No entanto, escrever manualmente o código do cliente pode ser difícil, propenso a erros e demorado. Portanto, para facilitar o uso da linguagem Java por nossos clientes, um Aspose.OCR Cloud Java SDK específico da linguagem é publicado. Ao usar o SDK, ele cuida de muitos detalhes de baixo nível ao fazer solicitações e manipular respostas e permite que você se concentre em escrever código específico para as necessidades particulares do seu projeto.

Reconhecer texto de imagem de URL

A Cloud OCR API fornece uma opção para executar diretamente operações de reconhecimento de texto em arquivos de imagem disponíveis em URLs da web. Você não precisa fazer upload exclusivamente para um armazenamento em nuvem específico.

Trecho de código Java

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Bloco de captura gerado automaticamente
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// método para reconhecer texto de imagem hospedada em URL
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

Reconhecer texto de imagem no armazenamento

Trecho de código Java

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO Bloco de captura gerado automaticamente
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

comando cURL

As APIs do Cloud também podem ser acessadas por meio de comandos cURL e, da mesma forma, o Aspose.OCR Cloud também pode ser acessado por meio do comando cURL. No entanto, observe que, para acessar as APIs, precisamos gerar um token de acesso JWT com base em nossas credenciais de cliente personalizadas. Execute o comando a seguir para geração de token de acesso JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Depois que o token JWT for gerado, use o seguinte comando para executar o OCR nas imagens.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

URL da solicitação

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

Corpo de resposta

{
  "text": "MOORE STEPHENS",
  "code": 200
}

Conclusão

Neste artigo, discutimos os detalhes sobre como executar OCR em imagens. Além disso, exploramos as opções para executar operações de reconhecimento óptico de caracteres em imagens usando comandos cURL. Observe que o código-fonte completo do SDK está disponível no GitHub. Da mesma forma, também recomendamos aprender mais sobre API explorando o produto Documentação.

Artigos relacionados