
Aspose.OCR Cloud מאפשר לך לבצע זיהוי תווים אופטיים וסריקת מסמכים בענן. הוא תומך בקריאה וזיהוי של טקסט מרוב הפורמטים הנפוצים של תמונת רסטר (BMP, JPG, GIF, PNG, TIFF).בצע זיהוי תווים בתמונות עם פחות שורות קוד. כל שעליך לעשות הוא להעביר תמונה ספציפית ל-Aspose.OCR Cloud API, ותחזיר תגובה עם טקסט מזוהה. ה-API מסוגל לזהות טקסט באנגלית, צרפתית, ספרדית ומחזיר את התגובה בפורמטים של XML או JSON. במאמר זה, אנו הולכים לדון בשלבים לביצוע OCR על תמונות באמצעות Java SDK.
במהלך תהליך הזיהוי, אתה יכול לקרוא תווים כמו גם את פרטי הגופן המשויכים. אתה יכול לבצע OCR על כל התמונה או לספק קואורדינטות X ו-Y כדי לבצע אותו בחלק מסוים של תמונת הרסטר. הוא גם מסוגל לבצע תיקון הטיה אוטומטי, בתוספת פעולות זיהוי אוטומטיות וידניות של פריסת מסמכים במהירות גבוהה, מכיוון שאין לו תלות במשאבי חומרה.
פלטפורמה עצמאית
ה-API של הענן אינו תלוי לחלוטין במערכת ההפעלה, מערכת מסד הנתונים או שפת הפיתוח שלך ואתה רשאי להשתמש בכל שפה ופלטפורמה שתומכת ב-HTTP כדי ליצור אינטראקציה עם ה-API שלנו. עם זאת, כתיבה ידנית של קוד לקוח יכולה להיות קשה, מועדת לשגיאות וגוזלת זמן. לכן, על מנת להקל על הלקוחות שלנו להשתמש בשפת Java, מתפרסם Aspose.OCR Cloud Java SDK ספציפי לשפה. בעת שימוש ב-SDK, הוא דואג להרבה פרטים ברמה נמוכה תוך הגשת בקשות וטיפול בתגובות ומאפשר לך להתמקד בכתיבת קוד ספציפי לצרכי הפרויקט הספציפיים שלך.
זיהוי טקסט מתמונת כתובת אתר
ה-Cloud OCR API מספק אפשרות לבצע ישירות פעולות זיהוי טקסט בקובצי תמונה הזמינים בכתובות אתרים באינטרנט. אינך צריך להעלות אותו באופן בלעדי לאחסון ענן מסוים.
קטע קוד Java
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO בלוק תפס שנוצר באופן אוטומטי
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// שיטה לזיהוי טקסט מתמונה המתארחת בכתובת URL
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
זיהוי טקסט מתמונה באחסון
קטע קוד Java
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO בלוק תפס שנוצר באופן אוטומטי
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
פקודת cURL
ניתן לגשת אל ממשקי הענן גם באמצעות פקודות cURL ובאופן דומה, ניתן לגשת אל Aspose.OCR Cloud גם באמצעות פקודת cURL. עם זאת, שים לב שכדי לגשת לממשקי ה-API, עלינו ליצור אסימון גישה של JWT על סמך אישורי הלקוח המותאמים אישית שלנו. אנא בצע את הפקודה הבאה ליצירת אסימון גישה של JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
לאחר יצירת אסימון JWT, אנא השתמש בפקודה הבאה כדי לבצע OCR בתמונות.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
בקש כתובת אתר
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
גוף תגובה
{
"text": "MOORE STEPHENS",
"code": 200
}
מַסְקָנָה
במאמר זה, דנו בפרטים כיצד לבצע OCR בתמונות. כמו כן, בדקנו את האפשרויות לבצע פעולות זיהוי תווים אופטיים בתמונות באמצעות פקודות cURL. שים לב שקוד המקור המלא של SDK זמין ב-GitHub. באופן דומה, אנו ממליצים גם ללמוד עוד על API על ידי בחינת המוצר תיעוד.