
Aspose.OCR Cloud ermöglicht Ihnen die optische Zeichenerkennung und das Scannen von Dokumenten in der Cloud. Es unterstützt das Lesen und Erkennen von Text in den am häufigsten verwendeten Rasterbildformaten (BMP, JPG, GIF, PNG, TIFF).Führen Sie die Zeichenerkennung auf Bildern mit weniger Codezeilen durch. Übergeben Sie einfach ein bestimmtes Bild an die Aspose.OCR Cloud API und Sie erhalten eine Antwort mit erkanntem Text. Die API kann englischen, französischen und spanischen Text erkennen und gibt die Antwort im XML oder JSON-Format zurück. In diesem Artikel besprechen wir die Schritte zur Durchführung von OCR auf Bildern mit Java SDK.
Während des Erkennungsprozesses können Sie Zeichen sowie die zugehörigen Schriftinformationen lesen. Sie können OCR auf dem gesamten Bild ausführen oder X und Y-Koordinaten angeben, um es auf einem bestimmten Teil des Rasterbilds auszuführen. Es ist auch in der Lage, eine automatische Schräglagenkorrektur sowie automatische und manuelle Dokumentlayouterkennungsvorgänge mit hoher Geschwindigkeit durchzuführen, da es nicht von Hardwareressourcen abhängig ist.
Plattformunabhängig
Die Cloud-API ist völlig unabhängig von Ihrem Betriebssystem, Datenbanksystem oder Ihrer Entwicklungssprache und Sie können jede Sprache und Plattform verwenden, die HTTP unterstützt, um mit unserer API zu interagieren. Das manuelle Schreiben von Client-Code kann jedoch schwierig, fehleranfällig und zeitaufwändig sein. Um unseren Kunden die Verwendung der Java-Sprache zu erleichtern, wird daher ein sprachspezifisches Aspose.OCR Cloud Java SDK veröffentlicht. Wenn Sie das SDK verwenden, kümmert es sich um viele Details auf niedriger Ebene beim Erstellen von Anfragen und Verarbeiten von Antworten und ermöglicht es Ihnen, sich auf das Schreiben von Code zu konzentrieren, der speziell auf Ihre speziellen Projektanforderungen zugeschnitten ist.
Text aus URL bild erkennen
Die Cloud OCR API bietet die Möglichkeit, Texterkennungsvorgänge direkt an Bilddateien durchzuführen, die über Web-URLs verfügbar sind. Sie müssen die Dateien nicht ausschließlich auf einen bestimmten Cloud-Speicher hochladen.
Java-Codeausschnitt
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Automatisch generierter Catch-Block
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// Methode zum Erkennen von Text aus einem unter einer URL gehosteten Bild
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Text aus gespeicherten Bildern erkennen
Java-Codeausschnitt
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Automatisch generierter Catch-Block
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
cURL-Befehl
Auf die Cloud-APIs kann auch über cURL-Befehle zugegriffen werden, und auf Aspose.OCR Cloud kann ebenfalls über den cURL-Befehl zugegriffen werden. Beachten Sie jedoch, dass wir zum Zugriff auf die APIs ein JWT-Zugriffstoken basierend auf unseren personalisierten Clientanmeldeinformationen generieren müssen. Führen Sie zur Generierung des JWT-Zugriffstokens den folgenden Befehl aus.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Sobald das JWT-Token generiert ist, verwenden Sie bitte den folgenden Befehl, um OCR auf Bildern durchzuführen.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
Anforderungs-URL
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
Antworttext
{
"text": "MOORE STEPHENS",
"code": 200
}
Abschluss
In diesem Artikel haben wir die Details zur Durchführung von OCR auf Bildern besprochen. Außerdem haben wir die Optionen zur Durchführung von OCR-Operationen auf Bildern mithilfe von cURL-Befehlen untersucht. Bitte beachten Sie, dass der vollständige Quellcode des SDK auf GitHub verfügbar ist. Ebenso empfehlen wir, mehr über die API zu erfahren, indem Sie die Produkt-Dokumentation durchsehen.