عائلة Aspose.OCR السحابية

يتيح لك Aspose.OCR Cloud إجراء التعرف الضوئي على الحروف ومسح المستندات في السحابة. وهو يدعم قراءة النص والتعرف عليه من أكثر تنسيقات الصور النقطية شيوعًا (BMP، JPG، GIF، PNG، TIFF).قم بإجراء التعرف على الحروف على الصور التي تحتوي على عدد أقل من أسطر التعليمات البرمجية. ما عليك سوى تمرير صورة معينة إلى واجهة برمجة تطبيقات Aspose.OCR Cloud، وسوف تعيد استجابة بنص تم التعرف عليه. واجهة برمجة التطبيقات قادرة على التعرف على النص الإنجليزي والفرنسي والإسباني وتعيد الاستجابة بتنسيقات XML أو JSON. في هذه المقالة، سنناقش الخطوات اللازمة لإجراء التعرف الضوئي على الحروف على الصور باستخدام Java SDK.

أثناء عملية التعرف، يمكنك قراءة الأحرف بالإضافة إلى معلومات الخط المرتبطة بها. يمكنك إجراء التعرف الضوئي على الحروف على الصورة بأكملها أو توفير إحداثيات X وY لإجراء ذلك على جزء معين من الصورة النقطية. كما أنه قادر على إجراء تصحيح تلقائي للانحراف، بالإضافة إلى عمليات الكشف التلقائية واليدوية عن تخطيط المستندات بسرعة عالية، حيث لا يعتمد على موارد الأجهزة.

منصة مستقلة

إن واجهة برمجة التطبيقات السحابية مستقلة تمامًا عن نظام التشغيل أو نظام قاعدة البيانات أو لغة التطوير الخاصة بك ويمكنك استخدام أي لغة ومنصة تدعم HTTP للتفاعل مع واجهة برمجة التطبيقات الخاصة بنا. ومع ذلك، فإن كتابة كود العميل يدويًا قد تكون صعبة وعرضة للأخطاء وتستغرق وقتًا طويلاً. لذلك، لتسهيل استخدام عملائنا للغة Java، تم نشر مجموعة أدوات تطوير برمجيات Aspose.OCR Cloud Java الخاصة باللغة. عند استخدام مجموعة أدوات تطوير البرمجيات، فإنها تعتني بالكثير من التفاصيل منخفضة المستوى أثناء تقديم الطلبات ومعالجة الاستجابات وتمكنك من التركيز على كتابة كود خاص باحتياجات مشروعك الخاصة.

التعرف على النص من صورة URL

توفر واجهة Cloud OCR API خيارًا لإجراء عمليات التعرف على النص مباشرةً على ملفات الصور المتاحة عبر عناوين URL على الويب. ولا تحتاج إلى تحميلها حصريًا إلى تخزين سحابي معين.

مقتطف من كود جافا

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // كتلة الصيد التي تم إنشاؤها تلقائيًا TODO
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// طريقة التعرف على النص من الصورة المستضافة على عنوان URL
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

التعرف على النص من الصورة الموجودة في وحدة التخزين

مقتطف من كود جافا

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // كتلة الصيد التي تم إنشاؤها تلقائيًا TODO
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

أمر cURL

يمكن أيضًا الوصول إلى واجهات برمجة تطبيقات Cloud عبر أوامر cURL، وبالمثل، يمكن أيضًا الوصول إلى Aspose.OCR Cloud عبر أمر cURL. ومع ذلك، يرجى ملاحظة أنه من أجل الوصول إلى واجهات برمجة التطبيقات، نحتاج إلى إنشاء رمز وصول JWT استنادًا إلى بيانات اعتماد العميل المخصصة لدينا. يرجى تنفيذ الأمر التالي لإنشاء رمز وصول JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

بمجرد إنشاء رمز JWT، يرجى استخدام الأمر التالي لإجراء التعرف الضوئي على الحروف (OCR) على الصور.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

طلب عنوان URL

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

نص الاستجابة

{
  "text": "MOORE STEPHENS",
  "code": 200
}

خاتمة

في هذه المقالة، ناقشنا التفاصيل حول كيفية إجراء التعرف الضوئي على الحروف على الصور. كما استكشفنا الخيارات لإجراء عمليات التعرف الضوئي على الحروف على الصور باستخدام أوامر cURL. يرجى ملاحظة أن الكود المصدر الكامل لمجموعة أدوات تطوير البرامج متاح على GitHub. وبالمثل، نوصي أيضًا بمعرفة المزيد حول واجهة برمجة التطبيقات من خلال استكشاف المنتج الوثائق.

مقالات ذات صلة