आज के डेटा से संचालित दुनिया में, PDF दस्तावेज के संग्रहण आ साझा करे खातिर एगो अनिवार्य प्रारूप बन गइल बा। हालाँकि, सभ पीडीएफ सभ के खोज भा संपादन आसानी से ना कइल जा सके ला, खासतौर पर ऊ जे छवि आधारित होखे लें। दस्तावेज से निपटे के समय, आगे के हेरफेर खातिर कवनो पाठ्य जानकारी के कॉपी/निकासी कइल वास्तव में मुश्किल हो जाला। सौभाग्य से ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) तकनीक के ताकत से आप इमेज पीडीएफ के खोज करे लायक पीडीएफ में आसानी से बदल सकेनी। एह तकनीकी ब्लॉग में हमनी के ई खोजब जा कि विभिन्न तकनीक के इस्तेमाल से ओसीआर पीडीएफ के खोज करे लायक पीडीएफ में कइसे बदलल जा सकेला, जवना में REST API पर खास ध्यान दिहल जाई. हमनी के ओसीआर पीडीएफ से पाठ कइसे निकालल जा सकेला एह पर भी चर्चा करब जा, जवना से रउरा एह बात के व्यापक समझ मिल जाई कि कइसे ओसीआर तकनीक के लाभ उठा के अपना पीडीएफ दस्तावेजन के पूरा क्षमता के अनलॉक कइल जा सकेला.
- जावा एसडीके के इस्तेमाल से ओसीआर पीडीएफ
- जावा के इस्तेमाल से पीडीएफ से सर्च करे लायक पीडीएफ में स्कैन कइल गइल
- cURL कमांड के इस्तेमाल से ओसीआर ऑनलाइन
जावा एसडीके के इस्तेमाल से ओसीआर पीडीएफ
जावा खातिर Aspose.PDF Cloud SDK एगो शक्तिशाली क्लाउड आधारित एपीआई हवे जे पीडीएफ दस्तावेज सभ के साथ काम करे खातिर बिसाल रेंज के फीचर आ क्षमता सभ के पेशकश करे ला। एकर एगो प्रमुख कामकाज पीडीएफ पर ओसीआर करे के क्षमता बा, जवन छवि आधारित पीडीएफ से पाठ निकाले आ खोज करे लायक पीडीएफ बनावे के प्रक्रिया के बहुत सरल बना सकेला। अपना यूजर फ्रेंडली इंटरफेस अवुरी व्यापक दस्तावेजीकरण के चलते इ एसडीके पीडीएफ प ओसीआर करे के प्रक्रिया के स्वचालित कईल आसान बनावेला, जवना से समय के बचत अवुरी उत्पादकता बढ़ेला।
एकरे अलावा, ई क्लाउड आधारित एपीआई कई किसिम के इनपुट फॉर्मेट सभ के संभाले खातिर बनावल गइल बा आ हाथ से लिखल टेक्स्ट तक के पहिचान क सके ला, जेकरा चलते ई बिजनेस आ डेवलपर लोग खातिर एगो बेहतरीन विकल्प बा जे अपना दस्तावेज वर्कफ़्लो के सुव्यवस्थित करे के चाहत बाड़ें। अब पहिला कदम बा कि maven build project के pom.xml में निम्नलिखित विवरण जोड़ के जावा प्रोजेक्ट में एकर संदर्भ जोड़ल जाव।
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
अगर रउरा लगे मौजूदा खाता नइखे त Aspose Cloud पर एगो मुफ्त खाता बनावे के पड़ी. नया बनावल खाता के इस्तेमाल से लॉगिन करीं आ क्लाउड डैशबोर्ड पर क्लाइंट आईडी आ क्लाइंट सीक्रेट के लुकअप/बनाईं। बाद के खंडन में ई विवरण जरूरी बा।
जावा के इस्तेमाल से पीडीएफ से सर्च करे लायक पीडीएफ में स्कैन कइल गइल
एह खंड में जावा कोड स्निपेट के इस्तेमाल से स्कैन कइल पीडीएफ के सर्च करे लायक पीडीएफ में बदले के तरीका के बिस्तार से बतावल गइल बा। कृपया ध्यान दीं कि जावा क्लाउड एसडीके निम्नलिखित भाषा सभ के मान्यता के समर्थन करे ला: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , ना ही, पोल, पोर, रोन, रूस, स्पा, स्वे, था, तुर, उकर, वीई, चिसिम, चित्रा या उनकर संयोजन जइसे कि eng,rus।
- सबसे पहिले हमनी के PdfApi के एगो ऑब्जेक्ट बनावे के होई, जहवां हमनी के ClientID अवुरी Client के गुप्त विवरण के आर्गुमेंट के रूप में पास करेनी
- दूसरा, Image PDF लोड करे खातिर File class के इंस्टेंस बनाईं
- तीसरा, इनपुट पीडीएफ के क्लाउड स्टोरेज में अपलोड करे खातिर uploadFile(…) विधि के कॉल करीं
- जइसे कि हमनी के इमेज पीडीएफ में अंग्रेजी टेक्स्ट होला, एहसे हमनी के एगो स्ट्रिंग ऑब्जेक्ट बनावे के जरूरत बा जवना में एगो मान “eng” होखे.
- अंत में, मेथड putSearchableDocument(…) के कॉल करीं, जवना खातिर आर्गुमेंट के रूप में इनपुट पीडीएफ आ भाषा कोड के जरूरत होला।
एक बेर कोड सफलतापूर्वक निष्पादित हो गइला का बाद खोजल जा सके वाला पीडीएफ क्लाउड स्टोरेज में स्टोर हो जाला
try
{
// https://dashboard.aspose.cloud/ से क्लाइंटआईडी आ क्लाइंटसीक्रेट प्राप्त करीं।
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// पीडीएफएपीआई इंस्टेंस बनाईं
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// इनपुट छवि पीडीएफ दस्तावेज के बा
String name = "ScannedPDF.pdf";
// स्थानीय सिस्टम से फाइल लोड करीं
File file = new File(name);
// फाइल के क्लाउड स्टोरेज में अपलोड करीं
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// छवि पीडीएफ में इस्तेमाल कइल गइल भाषा सभ के बारे में बतावल गइल बा
String lang = "eng";
// छवि पीडीएफ दस्तावेज पर ओसीआर के प्रदर्शन करीं
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// सफलता के संदेश छापल जाला
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
उपर दिहल उदाहरण में इस्तेमाल कइल गइल स्कैन कइल पीडीएफ BusinessReport.pdf से आ परिणामस्वरूप खोज करे लायक पीडीएफ Converted.pdf से डाउनलोड कइल जा सके ला।
cURL कमांड के इस्तेमाल से ओसीआर ऑनलाइन
cURL कमांड REST एपीआई सभ के कॉल करे के सुविधाजनक तरीका सभ में से एक हवे। त एह खंड में हमनी के OCR खातिर cURL कमांड के ऑनलाइन इस्तेमाल करे जा रहल बानी जा। अब, एगो शर्त के रूप में, हमनी के पहिले निम्नलिखित कमांड के निष्पादित करत समय एगो JWT एक्सेस टोकन (क्लाइंट क्रेडेंशियल के आधार प) जनरेट करे के होई।
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
एक बेर हमनी के लगे जेडब्ल्यूटी टोकन हो गइल त कृपया निम्नलिखित कमांड के ऑनलाइन ओसीआर करे खातिर करीं आ इमेज पीडीएफ के खोज करे लायक पीडीएफ दस्तावेज में बदल दीं. एकरे बाद परिणामस्वरूप फाइल के क्लाउड स्टोरेज में स्टोर कइल जाला।
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
अंतिम बात
पीडीएफ पर ओसीआर कइल एह दस्तावेजन के पूरा क्षमता के अनलॉक करे खातिर एगो महत्वपूर्ण प्रक्रिया ह। जावा खातिर एस्पोज.पीडीएफ क्लाउड एसडीके नियर क्लाउड आधारित ओसीआर टूल सभ के मदद से एह प्रक्रिया के सरल आ स्वचालित कइल जा सके ला, एह से समय के बचत हो सके ला आ उत्पादकता बढ़ सके ला। ओसीआर के ताकत के फायदा उठा के बिजनेस आ डेवलपर इमेज आधारित पीडीएफ सभ के खोज करे लायक पीडीएफ में बदल सके लें, जेकरा से खोजल, संपादित कइल आ साझा कइल आसान हो सके ला। ई साफ बा कि ई एपीआई पीडीएफ के साथे काम करे खातिर कई गो शक्तिशाली फीचर आ क्षमता देला। एह तकनीकी ब्लॉग में दिहल गइल स्टेप-बाय-स्टेप गाइड के पालन करके रउआ पीडीएफ पर ओसीआर के शुरुआत कर सकेनी आ अपना दस्तावेज वर्कफ़्लो के अगिला स्तर पर ले जा सकेनी।
रउआँ swagger interface के इस्तेमाल से वेब ब्राउजर के भीतर एपीआई तक पहुँचे पर विचार कर सकत बानी। एकरा अलावा, चूंकि हमनी के एसडीके एमआईटी लाइसेंस के तहत बनल बा, एहसे पूरा स्रोत कोड GitHub से डाउनलोड कईल जा सकता। अगर एपीआई के इस्तेमाल करत घरी रउरा कवनो समस्या के सामना करे के पड़े त कृपया फ्री प्रोडक्ट सपोर्ट फोरम के माध्यम से हमनी से बेझिझक संपर्क करीं.
संबंधित लेख बा
हमनी के एह बारे में अउरी जाने खातिर निम्नलिखित लिंक सभ पर जाए के बहुत सलाह देत बानी जा: