Günümüzün veri odaklı dünyasında PDF’ler, belgeleri depolamak ve paylaşmak için vazgeçilmez bir biçim haline geldi. Ancak, tüm PDF’ler, özellikle görüntü tabanlı olanlar, kolayca aranabilir veya düzenlenemez. Belgelerle uğraşırken, daha fazla manipülasyon için herhangi bir metin bilgisini kopyalamak/çıkarmak gerçekten zordur. Neyse ki, Optik Karakter Tanıma (OCR) teknolojisinin gücüyle, görüntü PDF’lerini kolaylıkla aranabilir PDF’lere dönüştürebilirsiniz. Bu teknik blogda, özellikle REST API’ye odaklanarak, OCR PDF’yi çeşitli teknikler kullanarak aranabilir PDF’ye nasıl dönüştüreceğimizi keşfedeceğiz. Ayrıca OCR PDF’lerinden nasıl metin çıkarılacağını tartışacağız ve size PDF belgelerinizin tüm potansiyelini ortaya çıkarmak için OCR teknolojisinden nasıl yararlanacağınız konusunda kapsamlı bir anlayış sunacağız.
- Java SDK kullanan OCR PDF
- Java kullanılarak PDF’den Aranabilir PDF’e tarandı
- cURL Komutlarını Kullanan Çevrimiçi OCR
Java SDK kullanan OCR PDF
Aspose.PDF Cloud SDK for Java, PDF belgeleriyle çalışmak için çok çeşitli özellikler ve yetenekler sunan güçlü bir bulut tabanlı API’dir. Temel işlevlerinden biri, görüntü tabanlı PDF’lerden metin ayıklama ve aranabilir PDF’ler oluşturma sürecini büyük ölçüde basitleştirebilen PDF’lerde OCR gerçekleştirme yeteneğidir. Kullanıcı dostu arayüzü ve kapsamlı belgeleriyle bu SDK, PDF’lerde OCR gerçekleştirme sürecini otomatikleştirmeyi kolaylaştırarak zamandan tasarruf sağlar ve üretkenliği artırır.
Ayrıca, bu bulut tabanlı API, çok çeşitli girdi biçimlerini işlemek üzere tasarlanmıştır ve el yazısı metinleri bile tanıyabilir, bu da onu, belge iş akışlarını düzene sokmak isteyen işletmeler ve geliştiriciler için mükemmel bir seçim haline getirir. Şimdi ilk adım, maven derleme projesinin pom.xml dosyasına aşağıdaki ayrıntıları ekleyerek Java projesine referansını eklemektir.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Mevcut bir hesabınız yoksa Aspose Cloud üzerinden ücretsiz bir hesap oluşturmanız gerekir. Yeni oluşturulan hesabı kullanarak giriş yapın ve Cloud Dashboard’ta İstemci Kimliği ve İstemci Sırrını arayın/oluşturun. Bu ayrıntılar sonraki bölümlerde gereklidir.
Java kullanılarak PDF’den Aranabilir PDF’e tarandı
Bu bölümde, taranan PDF’nin Java kod parçacığını kullanarak Aranabilir PDF’ye nasıl dönüştürüleceğiyle ilgili ayrıntılar açıklanmaktadır. Lütfen Java Cloud SDK’nın aşağıdaki dillerin tanınmasını desteklediğini unutmayın: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra veya bunların kombinasyonu, örneğin eng,rus.
- Öncelikle, ClientID ve Client gizli ayrıntılarını argüman olarak ilettiğimiz bir PdfApi nesnesi oluşturmamız gerekiyor.
- İkinci olarak, Görüntü PDF’sini yüklemek için bir File sınıfı örneği oluşturun.
- Üçüncü olarak, girdi PDF’sini bulut depolamaya yüklemek için uploadFile(…) yöntemini çağırın.
- Resim PDF’miz ingilizce metin içerdiğinden, “eng” değerine sahip bir dize nesnesi oluşturmamız gerekiyor.
- Son olarak, argüman olarak bir giriş PDF’si ve bir dil kodu gerektiren putSearchableDocument(…) yöntemini çağırın.
Kod başarıyla çalıştırıldıktan sonra aranabilir PDF, bulut depolama alanında saklanır
try
{
// https://dashboard.aspose.cloud/ adresinden ClientID ve ClientSecret'i edinin
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// createPdfApi örneği
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// giriş resmi PDF belgesi
String name = "ScannedPDF.pdf";
// Dosyayı yerel sistemden yükleyin
File file = new File(name);
// dosyayı bulut depolamaya yükleyin
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// görüntü PDF'sinde kullanılan diller
String lang = "eng";
// görüntü PDF belgesinde OCR gerçekleştirin
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// başarı mesajını yazdır
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
Yukarıdaki örnekte kullanılan taranmış PDF BusinessReport.pdf adresinden indirilebilir ve sonuçta aranabilir PDF Converted.pdf adresinden indirilebilir.
cURL Komutlarını Kullanan Çevrimiçi OCR
CURL komutları, REST API’lerini çağırmak için uygun yaklaşımlardan biridir. Dolayısıyla bu bölümde, çevrimiçi OCR için cURL komutlarını kullanacağız. Şimdi, bir ön koşul olarak, aşağıdaki komutu yürütürken önce bir JWT erişim belirteci (istemci kimlik bilgilerine dayalı) oluşturmamız gerekiyor.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT belirtecine sahip olduğumuzda, lütfen çevrimiçi OCR gerçekleştirmek ve Görüntü PDF’yi aranabilir PDF belgesine dönüştürmek için aşağıdaki komutu kullanın. Ortaya çıkan dosya daha sonra bulut depolama alanında saklanır.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Çözüm
PDF’lerde OCR gerçekleştirmek, bu belgelerin tam potansiyelini ortaya çıkarmak için kritik bir süreçtir. Aspose.PDF Cloud SDK for Java gibi bulut tabanlı OCR araçlarının yardımıyla bu süreç basitleştirilebilir ve otomatikleştirilebilir, böylece zamandan tasarruf sağlanır ve üretkenlik artırılır. İşletmeler ve geliştiriciler, OCR’nin gücünden yararlanarak görüntü tabanlı PDF’leri aranabilir PDF’lere dönüştürerek arama, düzenleme ve paylaşmalarını kolaylaştırabilir. Bu API’nin PDF’lerle çalışmak için bir dizi güçlü özellik ve yetenek sunduğu açıktır. Bu teknik blogda sağlanan adım adım kılavuzları izleyerek, PDF’lerde OCR’yi kullanmaya başlayabilir ve belge iş akışınızı bir sonraki seviyeye taşıyabilirsiniz.
Swagger arabirimini kullanarak bir web tarayıcısından API’ye erişmeyi düşünebilirsiniz. Ayrıca, SDK’larımız bir MIT lisansı altında oluşturulduğundan kaynak kodun tamamı GitHub‘dan indirilebilir. API’yi kullanırken herhangi bir sorunla karşılaşırsanız lütfen ücretsiz ürün destek forumu aracılığıyla bizimle iletişime geçmekten çekinmeyin.
İlgili Makaleler
Aşağıdakiler hakkında daha fazla bilgi edinmek için aşağıdaki bağlantıları ziyaret etmenizi önemle tavsiye ederiz: