
Το Aspose.OCR Cloud σάς δίνει τη δυνατότητα να εκτελείτε την αναγνώριση οπτικών χαρακτήρων και τη σάρωση εγγράφων στο Cloud. Υποστηρίζει την ανάγνωση και την αναγνώριση κειμένου από τις πιο συχνά χρησιμοποιούμενες μορφές εικόνας ράστερ (BMP, JPG, GIF, PNG, TIFF).Εκτελέστε αναγνώριση χαρακτήρων σε εικόνες με λιγότερες γραμμές κώδικα. Απλώς περάστε μια συγκεκριμένη εικόνα στο Aspose.OCR Cloud API και θα επιστρέψει μια απάντηση με αναγνωρισμένο κείμενο. Το API είναι σε θέση να αναγνωρίζει αγγλικό, γαλλικό, ισπανικό κείμενο και επιστρέφει την απόκριση σε μορφές XML ή JSON. Σε αυτό το άρθρο, θα συζητήσουμε τα βήματα για την εκτέλεση OCR σε εικόνες χρησιμοποιώντας Java SDK.
Κατά τη διαδικασία αναγνώρισης, μπορείτε να διαβάσετε χαρακτήρες καθώς και τις σχετικές πληροφορίες γραμματοσειράς. Μπορείτε να εκτελέσετε OCR σε ολόκληρη την εικόνα ή να παρέχετε συντεταγμένες X και Y για να το εκτελέσετε σε ένα συγκεκριμένο τμήμα της εικόνας ράστερ. Είναι επίσης σε θέση να εκτελέσει μια αυτόματη διόρθωση λοξής, καθώς και αυτόματες και μη αυτόματες λειτουργίες ανίχνευσης διάταξης εγγράφων με υψηλή ταχύτητα, καθώς δεν έχει εξάρτηση από πόρους υλικού.
Ανεξάρτητη πλατφόρμα
Το Cloud API είναι εντελώς ανεξάρτητο από το λειτουργικό σας σύστημα, το σύστημα βάσης δεδομένων ή τη γλώσσα ανάπτυξης και μπορείτε να χρησιμοποιήσετε οποιαδήποτε γλώσσα και πλατφόρμα που υποστηρίζει HTTP για να αλληλεπιδράσετε με το API μας. Ωστόσο, η μη αυτόματη εγγραφή κώδικα πελάτη μπορεί να είναι δύσκολη, επιρρεπής σε σφάλματα και χρονοβόρα. Επομένως, για να διευκολύνουμε τους πελάτες μας να χρησιμοποιούν γλώσσα Java, δημοσιεύεται ένα Aspose.OCR Cloud Java SDK για συγκεκριμένη γλώσσα. Όταν χρησιμοποιείτε το SDK, φροντίζει για πολλές λεπτομέρειες χαμηλού επιπέδου κατά την υποβολή αιτημάτων και τον χειρισμό των απαντήσεων και σας δίνει τη δυνατότητα να εστιάσετε στη σύνταξη κώδικα συγκεκριμένου για τις ιδιαίτερες ανάγκες του έργου σας.
Αναγνώριση κειμένου από εικόνα URL
Το Cloud OCR API παρέχει μια επιλογή για την απευθείας εκτέλεση λειτουργιών αναγνώρισης κειμένου σε αρχεία εικόνας που είναι διαθέσιμα μέσω διευθύνσεων URL ιστού. Δεν χρειάζεται να το ανεβάσετε αποκλειστικά σε συγκεκριμένο χώρο αποθήκευσης cloud.
Απόσπασμα κώδικα Java
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Μπλοκ σύλληψης που δημιουργείται αυτόματα
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// μέθοδος αναγνώρισης κειμένου από την εικόνα που φιλοξενείται στη διεύθυνση URL
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Αναγνώριση κειμένου από εικόνα στον χώρο αποθήκευσης
Απόσπασμα κώδικα Java
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Μπλοκ σύλληψης που δημιουργείται αυτόματα
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
εντολή cURL
Τα API του Cloud είναι επίσης προσβάσιμα μέσω εντολών cURL και ομοίως, το Aspose.OCR Cloud μπορεί επίσης να προσπελαστεί μέσω της εντολής cURL. Ωστόσο, σημειώστε ότι για να αποκτήσουμε πρόσβαση στα API, πρέπει να δημιουργήσουμε ένα διακριτικό πρόσβασης JWT με βάση τα εξατομικευμένα διαπιστευτήρια πελάτη μας. Εκτελέστε την ακόλουθη εντολή για τη δημιουργία διακριτικών πρόσβασης JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Μόλις δημιουργηθεί το διακριτικό JWT, χρησιμοποιήστε την ακόλουθη εντολή για να εκτελέσετε OCR σε εικόνες.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
Αίτημα URL
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
Σώμα ανταπόκρισης
{
"text": "MOORE STEPHENS",
"code": 200
}
Σύναψη
Σε αυτό το άρθρο, έχουμε συζητήσει τις λεπτομέρειες σχετικά με τον τρόπο εκτέλεσης της OCR σε εικόνες. Επίσης, έχουμε εξερευνήσει τις επιλογές για την εκτέλεση λειτουργιών Optical Characters Recognition σε εικόνες χρησιμοποιώντας εντολές cURL. Λάβετε υπόψη ότι ο πλήρης πηγαίος κώδικας του SDK είναι διαθέσιμος στο GitHub. Ομοίως, συνιστούμε επίσης να μάθετε περισσότερα σχετικά με το API εξερευνώντας το προϊόν Τεκμηρίωση.