
Aspose.OCR Cloud giver dig mulighed for at udføre optisk tegngenkendelse og dokumentscanning i skyen. Det understøtter læsning og genkendelse af tekst fra de mest almindeligt anvendte rasterbilledformater (BMP, JPG, GIF, PNG, TIFF).Udfør tegngenkendelse på billeder med færre kodelinjer. Du skal blot sende et specifikt billede til Aspose.OCR Cloud API og returnere et svar med genkendt tekst. API’et er i stand til at genkende engelsk, fransk, spansk tekst og returnerer svaret i XML- eller JSON-formater. I denne artikel vil vi diskutere trinene til at udføre OCR på billeder ved hjælp af Java SDK.
Under genkendelsesprocessen kan du læse tegn såvel som den tilhørende skrifttypeinformation. Du kan udføre OCR på hele billedet eller angive X- og Y-koordinater for at udføre det på en bestemt del af rasterbilledet. Den er også i stand til at udføre en automatisk skævhedskorrektion plus automatisk og manuel dokumentlayoutregistrering med høj hastighed, da den ikke er afhængig af hardwareressourcer.
Platform uafhængig
Cloud API er fuldstændig uafhængig af dit operativsystem, databasesystem eller udviklingssprog, og du må bruge ethvert sprog og platform, der understøtter HTTP til at interagere med vores API. Manuel skrivning af klientkode kan dog være vanskelig, fejltilbøjelig og tidskrævende. For at gøre det lettere for vores kunder at bruge Java-sprog udgives en sprogspecifik Aspose.OCR Cloud Java SDK. Når du bruger SDK, tager den sig af en masse detaljer på lavt niveau, mens den fremsætter anmodninger og håndterer svar og giver dig mulighed for at fokusere på at skrive kode, der er specifik til dine specifikke projektbehov.
Genkend tekst fra URL-billede
Cloud OCR API giver mulighed for direkte at udføre tekstgenkendelsesoperationer på billedfiler, der er tilgængelige via web-URL’er. Du behøver ikke udelukkende at uploade det til et bestemt cloudlager.
Java-kodestykke
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Autogenereret catch block
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// metode til at genkende tekst fra billede hostet på URL
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Genkend tekst fra billede på lager
Java-kodestykke
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Autogenereret catch block
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
cURL kommando
Cloud API’erne kan også tilgås via cURL-kommandoer, og på samme måde kan Aspose.OCR Cloud også tilgås via cURL-kommandoen. Bemærk dog, at for at få adgang til API’erne skal vi generere et JWT-adgangstoken baseret på vores personlige klientoplysninger. Udfør venligst følgende kommando for generering af JWT-adgangstoken.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Når JWT-tokenet er genereret, skal du bruge følgende kommando til at udføre OCR på billeder.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
Anmod om URL
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
Svarorgan
{
"text": "MOORE STEPHENS",
"code": 200
}
Konklusion
I denne artikel har vi diskuteret detaljerne om, hvordan man udfører OCR på billeder. Vi har også undersøgt mulighederne for at udføre optiske tegngenkendelsesoperationer på billeder ved hjælp af cURL-kommandoer. Bemærk venligst, at den komplette kildekode for SDK er tilgængelig på GitHub. På samme måde anbefaler vi også at lære mere om API ved at udforske produktet Dokumentation.