
Aspose.OCR Cloud, Cloudta Optik Karakter Tanıma ve belge tarama işlemleri yapmanızı sağlar. En sık kullanılan raster görüntü formatlarından (BMP, JPG, GIF, PNG, TIFF) metin okuma ve tanıma işlemlerini destekler. Daha az kod satırı içeren görüntülerde karakter tanıma işlemi gerçekleştirin. Aspose.OCR Cloud API’sine belirli bir görüntüyü iletin ve tanınan metinle bir yanıt döndürecektir. API, İngilizce, Fransızca, İspanyolca metinleri tanıyabilir ve yanıtı XML veya JSON formatlarında döndürebilir. Bu makalede, Java SDK kullanarak görüntülerde OCR gerçekleştirme adımlarını ele alacağız.
Tanıma işlemi sırasında, karakterleri ve ilişkili yazı tipi bilgilerini okuyabilirsiniz. Tüm görüntü üzerinde OCR gerçekleştirebilir veya raster görüntünün belirli bir bölümünde gerçekleştirmek için X ve Y koordinatları sağlayabilirsiniz. Ayrıca, donanım kaynaklarına bağımlılığı olmadığı için otomatik eğiklik düzeltmesi ve otomatik ve manuel belge düzeni algılama işlemlerini yüksek hızda gerçekleştirebilir.
Platformdan Bağımsız
Cloud API işletim sisteminizden, veritabanı sisteminizden veya geliştirme dilinizden tamamen bağımsızdır ve API’mizle etkileşim kurmak için HTTP’yi destekleyen herhangi bir dili ve platformu kullanabilirsiniz. Ancak, istemci kodunu manuel olarak yazmak zor, hataya açık ve zaman alıcı olabilir. Bu nedenle, müşterilerimizin Java dilini kullanmasını kolaylaştırmak için dil özelinde bir Aspose.OCR Cloud Java SDK’sı yayınlanmıştır. SDK kullanıldığında, isteklerde bulunurken ve yanıtları işlerken birçok düşük seviyeli ayrıntıyla ilgilenir ve belirli proje ihtiyaçlarınıza özel kod yazmaya odaklanmanızı sağlar.
URL Görüntüsünden Metni Tanı
Cloud OCR API, web URL’leri üzerinden erişilebilen görüntü dosyalarında doğrudan metin tanıma işlemleri gerçekleştirme seçeneği sunar. Bunu yalnızca belirli bir bulut depolama alanına yüklemeniz gerekmez.
Java Kod Parçacığı
private static OcrApi api;
private static final String url = "https://upload.wikimedia.org/wikipedia/commons/2/2f/Book_of_Abraham_FirstPage.png";
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Otomatik oluşturulan yakalama bloğu
e.printStackTrace();
}
String text;
text = recognizeByURL();
System.out.println(text);
}
// URL'de barındırılan Resimden metni tanıma yöntemi
private static String recognizeByURL() {
try {
api = new ApiClient().createService(OcrApi.class);
Call<ResponseBody> call = api.RecognizeFromUrl(url);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
Depolamadaki Görüntüden Metni Tanıyın
Java Kod Parçacığı
private static OcrApi api;
public static void main(String args[]) throws IOException {
try {
setUpConfig();
} catch (Exception e) {
// TODO Otomatik oluşturulan yakalama bloğu
e.printStackTrace();
}
String text;
text = recognizeByContent();
System.out.println(text);
}
private static String recognizeByContent() {
try {
File f = new File(Configuration.getTestSrcDir(), "0.png");
if (!f.exists()) {
return "Error: recognizeByContentLang: file not found";
}
api = new ApiClient().createService(OcrApi.class);
RequestBody requestBody = RequestBody.create(f,MediaType.parse("application/octet-stream"));
Call<ResponseBody> call = api.RecognizeFromContent(requestBody);
Response<ResponseBody> res = call.execute();
ResponseBody answer = res.body();
com.aspose.ocr.OCRResponse ocrResponse = com.aspose.ocr.OCRResponse.Deserialize(answer);
String text = ocrResponse.text;
return text;
} catch (IOException e) {
e.printStackTrace();
return "";
}
}
private static void setUpConfig() throws Exception {
Configuration.setAPP_SID("xxxxx");
Configuration.setAPI_KEY("xxxxx");
Configuration.setAuthPath("https://api.aspose.cloud/connect/token");
Configuration.setBasePath("https://api.aspose.cloud/v3.0");
Configuration.setUserAgent("WebKit");
Configuration.setTestSrcDir("sourceTest");
Configuration.setTestDstDir("destTest");
if (Configuration.getAPI_KEY().isEmpty() || Configuration.getAPP_SID().isEmpty()) {
System.out.println("! Error: Setup AppSID & AppKey in BaseTest Configuration");
throw new Exception("Setup AppSID & AppKey in BaseTest Configuration");
}
}
cURL komutu
Cloud API’lerine cURL komutları aracılığıyla da erişilebilir ve benzer şekilde Aspose.OCR Clouduna da cURL komutu aracılığıyla erişilebilir. Ancak, API’lere erişmek için kişiselleştirilmiş istemci kimlik bilgilerimize dayalı bir JWT erişim belirteci oluşturmamız gerektiğini lütfen unutmayın. Lütfen JWT erişim belirteci oluşturmak için aşağıdaki komutu çalıştırın.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=4ccf1790-accc-41e9-8d18-a78dbb2ed1aa&client_secret=caac6e3d4a4724b2feb53f4e460eade3" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT belirteci oluşturulduktan sonra, resimler üzerinde OCR gerçekleştirmek için lütfen aşağıdaki komutu kullanın.
curl "https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1" \
-X GET \
-H "accept: application/json" \
-H "authorization: Bearer <jwt token>"
İstek URL’si
https://api.aspose.cloud/v3.0/ocr/MyImage.png/recognize?language=1
Cevap Organı
{
"text": "MOORE STEPHENS",
"code": 200
}
Çözüm
Bu makalede, görüntülerde OCR’nin nasıl gerçekleştirileceğiyle ilgili ayrıntıları ele aldık. Ayrıca, cURL komutlarını kullanarak görüntülerde Optik Karakter Tanıma işlemleri gerçekleştirme seçeneklerini inceledik. SDK’nin tam kaynak kodunun GitHub adresinde mevcut olduğunu lütfen unutmayın. Benzer şekilde, ürün Dokümantasyon‘u inceleyerek API hakkında daha fazla bilgi edinmenizi de öneririz.