
Aspose.OCR Cloud le permite realizar reconocimiento óptico de caracteres y escaneo de documentos en la nube. Admite la lectura y el reconocimiento de texto de los formatos de imágenes rasterizadas más utilizados (BMP, JPG, GIF, PNG, TIFF).Realice el reconocimiento de caracteres en imágenes con menos líneas de código. Simplemente pase una imagen específica a la API de Aspose.OCR Cloud y devolverá una respuesta con el texto reconocido. La API es capaz de reconocer texto en inglés, francés y español y devuelve la respuesta en formatos XML o JSON. En este artículo, analizaremos los pasos para realizar OCR en imágenes utilizando el SDK de Java.
Durante el proceso de reconocimiento, puede leer caracteres, así como la información de fuente asociada. Puede realizar el OCR en toda la imagen o proporcionar las coordenadas X e Y para realizarlo en una parte específica de la imagen rasterizada. También es capaz de realizar una corrección automática de la inclinación, además de operaciones de detección automática y manual del diseño del documento a alta velocidad, ya que no depende de los recursos del hardware.
Independiente de la plataforma
La API de la nube es completamente independiente de su sistema operativo, sistema de base de datos o lenguaje de desarrollo y puede usar cualquier lenguaje y plataforma que admita HTTP para interactuar con nuestra API. Sin embargo, escribir manualmente el código del cliente puede ser difícil, propenso a errores y llevar mucho tiempo. Por lo tanto, para facilitar a nuestros clientes el uso del lenguaje Java, se publica un SDK de Java de Aspose.OCR Cloud específico para el lenguaje. Al usar el SDK, se encarga de muchos detalles de bajo nivel mientras realiza solicitudes y maneja respuestas y le permite concentrarse en escribir código específico para las necesidades de su proyecto en particular.
Reconocer texto a partir de una imagen URL
La API de OCR en la nube ofrece una opción para realizar operaciones de reconocimiento de texto directamente en archivos de imágenes disponibles en URL web. No es necesario cargarlos exclusivamente en un almacenamiento en la nube específico.
Fragmento de código Java
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Bloque de captura generado automáticamente
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// Método para reconocer texto de una imagen alojada en una URL
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Reconocer texto de una imagen almacenada
Fragmento de código Java
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Bloque de captura generado automáticamente
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Comando cURL
También se puede acceder a las API de Cloud mediante comandos cURL y, de manera similar, también se puede acceder a Aspose.OCR Cloud mediante el comando cURL. Sin embargo, tenga en cuenta que para acceder a las API, necesitamos generar un token de acceso JWT basado en nuestras credenciales de cliente personalizadas. Ejecute el siguiente comando para generar el token de acceso JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Una vez generado el token JWT, utilice el siguiente comando para realizar OCR en las imágenes.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
URL de solicitud
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
Cuerpo de respuesta
{
"text": "MOORE STEPHENS",
"code": 200
}
Conclusión
En este artículo, analizamos los detalles sobre cómo realizar el reconocimiento óptico de caracteres en imágenes. Además, exploramos las opciones para realizar operaciones de reconocimiento óptico de caracteres en imágenes mediante comandos cURL. Tenga en cuenta que el código fuente completo del SDK está disponible en GitHub. De manera similar, también recomendamos obtener más información sobre la API explorando la Documentación del producto.