
Görüntüler, veri paylaşımı için ayrılmaz bileşenlerden biridir ve bazı uygulamalar doğrudan kaynak içeriği PDF formatında işler. Ancak bu kolaylık, belgenin içindeki belirli içerikleri aramamız gerektiğinde maliyeti artırır. Bu senaryoda, ilgili bilgileri bulmak için tüm belgeyi manuel olarak incelemek gerekir. Bu nedenle önerilen yaklaşım her zaman aranabilir ve yönetimi kolay dosyalar oluşturmaktır. Ancak, kaynakta belgelerin biçimini kontrol edemediğiniz PDF dosyaları aldıysanız, veri arşivleme ve dizinleme için bu tür belgeleri aranabilir bir biçime dönüştürmemiz gerekir. Bu makalede, çevrimiçi PDF OCR’nin nasıl gerçekleştirileceği ve taranmış / görüntü PDF dosyalarının aranabilir / metin PDF belgelerine nasıl dönüştürüleceğiyle ilgili ayrıntıları tartışacağız.
PDF işleme API’si
Aspose.PDF Cloud, ödüllü REST mimarisi tabanlı PDF oluşturma ve düzenleme API’mizdir. Aynı API’yi kullanarak EPUB’u PDF’ye Dönüştür, HTML’yi PDF’ye Dönüştür, XPS’i PDF’ye Dönüştür, DOC ve Doc X’i PDF’ye Dönüştür, XPS’i PDF’ye Dönüştür, yeni veya mevcut PDF dosyalarına resim ekleme vb. gibi çeşitli işlemler gerçekleştirebilirsiniz. Tüm bu işlemler bulutta gerçekleştirilir ve bu nedenle API’ye herhangi bir platformdan erişilebilir.
cURL komutunu kullanarak PDF OCR
cURL komutları, komut satırı terminali aracılığıyla Aspose.PDF Cloud’a erişmenin kolay bir yoludur. Ancak API’lere erişmeden önce, önce Aspose.Cloud panosunu ziyaret etmeniz ve GitHub veya Google hesabınız varsa, sadece Kaydolmanız gerekir. Aksi takdirde, Yeni Hesap Oluştur düğmesine tıklayın ve gerekli bilgileri sağlayın. Şimdi kimlik bilgilerini kullanarak panoya giriş yapın ve panodan Uygulamalar bölümünü genişletin ve İstemci Kimliği ve İstemci Gizli Bilgisi ayrıntılarını görmek için İstemci Kimlik Bilgileri bölümüne doğru aşağı kaydırın.
Şimdiki adım, API’lere komut istemi üzerinden erişilebilmesi için JSON Web Token (JWT) üretmektir.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT token’ına sahip olduğumuzda, komut satırı terminalinde aşağıdaki cURL komutunu yürütelim.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Taranan PDF’yi Java’da Aranabilir’e dönüştürün
Java programcılarımızı kolaylaştırmak için, Cloud API’nin tüm özelliklerine Java kodunda kolayca erişilebilmesi için Aspose.PDF Cloud etrafında bir sarmalayıcı oluşturuldu. Benzer şekilde, taranmış PDF’de OCR işlemini gerçekleştirmek için Aspose.PDF Cloud SDK for Java kullanmamız gerekir.
Yani ilk adım SKD’yi sisteme kurmaktır. Cloud SDK Maven ve GitHub üzerinden indirilebilir. Şimdi pom.xml dosyanıza aşağıdaki ayrıntıları ekleyerek Aspose.Pdf.jar’ı indirip Maven build projenizde kullanın.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.1.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
Daha fazla bilgi için lütfen Aspose.Cloud SDK’ları nasıl kurulur sayfasını ziyaret edin.
Aşağıda verilen adımlar, PDF görüntü dosyası üzerinde COR işleminin sürecini tanımlamaktadır.
- İlk adım, ClientID ve Client gizli ayrıntılarını (Aspose.Cloud panosunda mevcuttur) geçirirken bir PdfApi nesnesi oluşturmaktır.
- Bir Dosya örneği oluşturun ve görüntü dosyasının konumunu bir argüman olarak geçirin.
- uploadFile(…) metodunu çağırın ve PDF belgesini ve Dosya örneğini argüman olarak geçirin.
- Bir sonraki adım, bir dize örneği oluşturmak ve değerini kaynak dosyanın içerdiği dil koduna (yani “rus,eng”) ayarlamak.
- Son olarak, PdfApi’nin putSearchableDocument(…) metodunu çağırın ve giriş PDF dosya adını ve dil kodunu argüman olarak geçirin.
OCR motoru için diller. Desteklenen değerler: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra veya bunların birleşimi, örneğin eng, rus.
// ClientID ve ClientSecret'ı https://dashboard.aspose.cloud/ adresinden edinin
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
// createPdfApi örneği
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// PDF belgesini girin
String name = "ocrscan.pdf";
// Dosyayı yerel sistemden yükleyin
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// dosyayı bulut depolama alanına yükle
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// resim dosyasında kullanılan diller
String lang = "rus,eng";
// görüntü PDF belgesi üzerinde OCR gerçekleştirin
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());

Resim 1:- OCR çıktı önizlemesi.
Yukarıdaki örnekte kullanılan örnek PDF dosyaları aşağıdaki bağlantılardan indirilebilir:
Çözüm
Bu makalede, çevrimiçi PDF OCR işleminin nasıl gerçekleştirileceği ve taranan PDF belgesinin aranabilir bir PDF belgesine nasıl dönüştürüleceği konusunda bazı basit adımlar öğrendik. OCR işlemlerinin dışında, SDK oldukça güçlüdür ve çeşitli diğer işlemleri gerçekleştirebilir. Daha fazla ayrıntı için lütfen Aspose.PDF Cloud Özellikleri adresini ziyaret edin.