Aspose.OCR Cloud Family

Aspose.OCR Cloud გაძლევთ საშუალებას განახორციელოთ ოპტიკური სიმბოლოების ამოცნობა და დოკუმენტების სკანირება ღრუბელში. ის მხარს უჭერს ტექსტის კითხვას და ამოცნობას ყველაზე ხშირად გამოყენებული რასტრული გამოსახულების ფორმატებიდან (BMP, JPG, GIF, PNG, TIFF).შეასრულეთ სიმბოლოების ამოცნობა სურათებზე ნაკლები კოდის ხაზებით. უბრალოდ გადასვით კონკრეტული სურათი Aspose.OCR Cloud API-ს და დააბრუნებთ პასუხს აღიარებული ტექსტით. API-ს შეუძლია ამოიცნოს ინგლისური, ფრანგული, ესპანური ტექსტი და აბრუნებს პასუხს XML ან JSON ფორმატებში. ამ სტატიაში ჩვენ განვიხილავთ სურათებზე OCR-ის შესრულების ნაბიჯებს Java SDK-ის გამოყენებით.

ამოცნობის პროცესში, შეგიძლიათ წაიკითხოთ სიმბოლოები, ასევე ასოცირებული შრიფტის ინფორმაცია. თქვენ შეგიძლიათ შეასრულოთ OCR მთელ სურათზე ან მიაწოდოთ X და Y კოორდინატები, რომ შეასრულოთ იგი რასტრული გამოსახულების კონკრეტულ ნაწილზე. მას ასევე შეუძლია შეასრულოს დახრილობის ავტომატური კორექტირება, პლუს დოკუმენტის განლაგების ავტომატური და ხელით გამოვლენის ოპერაციები მაღალი სიჩქარით, რადგან მას არ გააჩნია ტექნიკის რესურსებზე დამოკიდებულება.

პლატფორმის დამოუკიდებელი

Cloud API სრულიად დამოუკიდებელია თქვენი ოპერაციული სისტემისგან, მონაცემთა ბაზის სისტემისგან ან განვითარების ენისგან და შეგიძლიათ გამოიყენოთ ნებისმიერი ენა და პლატფორმა, რომელიც მხარს უჭერს HTTP-ს ჩვენს API-სთან ურთიერთობისთვის. თუმცა, კლიენტის კოდის ხელით დაწერა შეიძლება იყოს რთული, შეცდომებისადმი მიდრეკილი და შრომატევადი. ამიტომ, იმისათვის, რომ ხელი შევუწყოთ ჩვენს მომხმარებლებს Java ენის გამოყენებაში, გამოქვეყნებულია ენის სპეციფიკური Aspose.OCR Cloud Java SDK. SDK-ის გამოყენებისას ის ზრუნავს უამრავ დაბალი დონის დეტალზე მოთხოვნისა და პასუხების განხილვისას და საშუალებას გაძლევთ ფოკუსირება მოახდინოთ თქვენი კონკრეტული პროექტის საჭიროებებისთვის სპეციფიკური კოდის დაწერაზე.

ტექსტის ამოცნობა URL სურათიდან

Cloud OCR API იძლევა შესაძლებლობას პირდაპირ შეასრულოს ტექსტის ამოცნობის ოპერაციები გამოსახულების ფაილებზე, რომლებიც ხელმისაწვდომია ვებ URL-ებზე. თქვენ არ გჭირდებათ მისი ექსკლუზიურად ატვირთვა კონკრეტულ ღრუბლოვან საცავში.

ჯავის კოდის ნაწყვეტი

private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO ავტომატურად გენერირებული დაჭერის ბლოკი
    e.printStackTrace();
  }
  String text;

  text = recognizeByURL();
  System.out.println(text);
}

// URL-ზე განთავსებული სურათიდან ტექსტის ამოცნობის მეთოდი
private static String recognizeByURL() {
  try {
    api = new ApiClient().createService(OcrApi.class);
    Call<ResponseBody> call = api.RecognizeFromUrl(url);
    Response<ResponseBody> res = call.execute();
    ResponseBody answer = res.body();

    com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
    String text = ocrResponse.text;

    return text;
    } catch (IOException e) {
      e.printStackTrace();
      return "";
    }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

ამოიცნობთ ტექსტს გამოსახულების საცავში

ჯავის კოდის ნაწყვეტი

private static OcrApi api;

public static void main(String args[]) throws IOException {
  try {
	  		setUpConfig();
  } catch (Exception e) {
    // TODO ავტომატურად გენერირებული დაჭერის ბლოკი
    e.printStackTrace();
  }
  String text;

  text = recognizeByContent();
  System.out.println(text);
}

private static String recognizeByContent() {
  try {
      File f = new File(Configuration.getTestSrcDir(), "0.png");
      if (!f.exists()) {
      return "Error: recognizeByContentLang: file not found";
      }

      api = new ApiClient().createService(OcrApi.class);
      RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
      Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
      Response<ResponseBody> res = call.execute();

      ResponseBody answer = res.body();
      com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
      String text = ocrResponse.text;

      return text;

  } catch (IOException e) {
      e.printStackTrace();
      return "";
  }
}

private static void setUpConfig() throws Exception {
  Configuration.setAPP_SID("xxxxx");
  Configuration.setAPI_KEY("xxxxx");

  Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
  Configuration.setBasePath("https://api.aspose.cloud/v3.0");
  Configuration.setUserAgent("WebKit");
  Configuration.setTestSrcDir("sourceTest");
  Configuration.setTestDstDir("destTest");

  if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
      System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
      throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
    }
}

cURL ბრძანება

Cloud API-ებზე წვდომა ასევე შესაძლებელია cURL ბრძანებების საშუალებით და ანალოგიურად, Aspose.OCR Cloud-ზე წვდომა ასევე შესაძლებელია cURL ბრძანების საშუალებით. თუმცა, გთხოვთ, გაითვალისწინოთ, რომ API-ებზე წვდომისთვის, ჩვენ გვჭირდება JWT წვდომის ტოკენის გენერირება ჩვენი პერსონალიზებული კლიენტის სერთიფიკატების საფუძველზე. გთხოვთ, შეასრულოთ შემდეგი ბრძანება JWT წვდომის ნიშნის გენერირებისთვის.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT ჟეტონის გენერირების შემდეგ, გთხოვთ, გამოიყენოთ შემდეგი ბრძანება სურათებზე OCR-ის შესასრულებლად.

curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H  "accept: application/json" \
-H  "authorization: Bearer <jwt token>"

მოითხოვეთ URL

https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1

საპასუხო ორგანო

{
  "text": "MOORE STEPHENS",
  "code": 200
}

დასკვნა

ამ სტატიაში ჩვენ განვიხილეთ დეტალები, თუ როგორ უნდა შეასრულოთ OCR სურათებზე. ასევე, ჩვენ შევისწავლეთ ოპტიკური სიმბოლოების ამოცნობის ოპერაციების შესრულების ვარიანტები სურათებზე cURL ბრძანებების გამოყენებით. გთხოვთ, გაითვალისწინოთ, რომ SDK-ის სრული წყაროს კოდი ხელმისაწვდომია GitHub-ზე. ანალოგიურად, ჩვენ ასევე გირჩევთ, შეიტყოთ მეტი API-ს შესახებ პროდუქტის დოკუმენტაციის შესწავლით.

დაკავშირებული სტატიები