पीडीएफ ओसीआर के बा

PDF फाइल सभ के इंटरनेट पर जानकारी आ डेटा साझा करे खातिर बहुत इस्तेमाल होला। ई काफी लोकप्रिय बाड़ें काहें से कि ई कौनों भी प्लेटफार्म पर देखला पर दस्तावेज के निष्ठा के बरकरार रखे लें। हालांकि हमनी के स्रोत प नियंत्रण नईखे अवुरी कुछ फाइल स्कैन फॉर्मेट में साझा कईल जाला। कई बेर रउरा कवनो छवि के पीडीएफ का रूप में कैप्चर कर लीं आ बाद में फाइल से सामग्री निकाले के पड़ेला. त एगो व्यवहार्य समाधान बा कि ओसीआर ऑपरेशन कर के पाठ निकालल जाव. हालांकि, ओसीआर ऑपरेशन के बाद, जदी आपके फाइल के संरक्षित करे के जरूरत बा, त पीडीएफ फॉर्मेट में बदलल एगो व्यवहार्य समाधान बा। एह लेख में हमनी के पायथन के इस्तेमाल से स्कैन कईल पीडीएफ के टेक्स्ट पीडीएफ में बदले के तरीका के बारे में चर्चा करे जा रहल बानी जा।

ओसीआर पीडीएफ एपीआई के बा

पायथन खातिर Aspose.PDF Cloud SDK Aspose.PDF Cloud के आसपास एगो रैपर हवे। इ रउआ पायथन एप्लीकेशन के भीतर सभ पीडीएफ फाइल प्रोसेसिंग क्षमता के निष्पादित करे में सक्षम बनावेला। बिना एडोब एक्रोबैट भा कवनो दोसरा एप्लीकेशन के पीडीएफ फाइल में हेरफेर करीं. त एसडीके के इस्तेमाल करे खातिर पहिला कदम एकर इंस्टॉलेशन होला, आ ई PIPGitHub रिपोजिटरी पर डाउनलोड करे खातिर उपलब्ध बा। अब सिस्टम पर SDK के नवीनतम संस्करण इंस्टॉल करे खातिर टर्मिनल/कमांड प्रॉम्प्ट पर निम्नलिखित कमांड के निष्पादित करीं।

 pip install asposepdfcloud

एमएस विजुअल स्टूडियो के बा

रउआँ सीधे विजुअल स्टूडियो प्रोजेक्ट के भीतर अपना पायथन प्रोजेक्ट में संदर्भ भी जोड़ सकत बानी। कृपया पायथन वातावरण विंडो के नीचे पैकेज के रूप में asposepdfcloud के खोज करीं। इंस्टॉलेशन प्रक्रिया पूरा करे खातिर नीचे दिहल छवि में नंबर दिहल चरण के पालन करीं।

Aspose.PDF क्लाउड पायथन के बा

छवि 1:- पायथन पैकेज खातिर Aspose.PDF क्लाउड एसडीके।

Aspose.क्लाउड डैशबोर्ड के बा

चूँकि हमनी के एपीआई खाली अधिकृत व्यक्ति लोग खातिर सुलभ बा, एहसे अगिला कदम Aspose.Cloud dashboard पर खाता बनावल बा। अगर रउरा लगे गिटहब भा गूगल खाता बा त बस साइन अप करीं भा, नया खाता बनाईं बटन पर क्लिक करीं आ जरूरी जानकारी दीं. अब क्रेडेंशियल के इस्तेमाल क के डैशबोर्ड में लॉगिन करीं अवुरी डैशबोर्ड से एप्लीकेशन सेक्शन के विस्तार करीं अवुरी नीचे क्लाइंट क्रेडेंशियल सेक्शन के ओर स्क्रॉल क के क्लाइंट आईडी अवुरी क्लाइंट सीक्रेट के विवरण देखाई दिही।

ग्राहक क्रेडेंशियल के बारे में बतावल गइल बा

छवि 2:- Aspose.Cloud डैशबोर्ड पर क्लाइंट क्रेडेंशियल।

पायथन में खोजल जाए वाला पीडीएफ से छवि पीडीएफ

कृपया नीचे दिहल चरण के पालन करीं आ स्कैन कइल पीडीएफ दस्तावेज पर ओसीआर ऑपरेशन करे आ ओकरा बाद ओकरा के खोजल जाए वाला के रूप में सेव करीं (पीडीएफ के खोज करे लायक बनाईं)। ई कदम पायथन के इस्तेमाल से मुफ्त ऑनलाइन ओसीआर विकसित करे में मदद करेला।

  • सबसे पहिले हमनी के ApiClient क्लास के इंस्टेंस बनावे के होई जबकि Client ID Client Secret के आर्गुमेंट के रूप में उपलब्ध करावे के होई
  • दूसरा, PdfApi क्लास के एगो इंस्टेंस बनाईं जवन ApiClient ऑब्जेक्ट के इनपुट आर्गुमेंट के रूप में लेवे
  • अब PdfApi क्लास के putsearchabledocument(..) मेथड के कॉल करीं जवन इनपुट पीडीएफ नाम आ ओसीआर इंजन के भाषा के इंगित करे वाला एगो वैकल्पिक पैरामीटर लेला।
def ocrPDF():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # PdfApiClient के तर्क के रूप में पास करत समय PdfApi इंस्टेंस बनाईं
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'image-based-pdf-sample.pdf'

        # ओसीआर ऑपरेशन करे खातिर एपीआई के कॉल करीं आ आउटपुट के क्लाउड स्टोरेज में सेव करीं
        response = pdf_api.put_searchable_document(name=input_file,lang='eng')

        # कंसोल में संदेश प्रिंट करीं (वैकल्पिक)
        print('Image PDF successfully converted to Text PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
पीडीएफ ओसीआर के पूर्वावलोकन कइल जाला

छवि 3:- पीडीएफ ओसीआर संचालन के पूर्वावलोकन।

ऊपर के छवि में बाईं ओर के हिस्सा इनपुट स्कैन कइल पीडीएफ फाइल के बतावे ला आ दाहिना ओर के हिस्सा में परिणामी टेक्स्ट आधारित पीडीएफ के पूर्वावलोकन देखावल गइल बा। उपर दिहल उदाहरण में इस्तेमाल कइल गइल नमूना फाइल सभ के image-based-pdf-sample.pdfOCR-Result.pdf से डाउनलोड कइल जा सके ला।

cURL कमांड के इस्तेमाल से ऑनलाइन ओसीआर

REST एपीआई के cURL कमांड के माध्यम से भी एक्सेस कइल जा सकेला आ चूंकि हमनी के क्लाउड एपीआई REST आर्किटेक्चर पर आधारित बा, एहसे हमनी के cURL कमांड के इस्तेमाल पीडीएफ ओसीआर ऑनलाइन करे खातिर भी कर सकेनी जा। हालांकि, रूपांतरण ऑपरेशन के आगे बढ़ावे से पहिले, हमनी के Aspose.Cloud डैशबोर्ड प निर्दिष्ट आपके अलग-अलग क्लाइंट क्रेडेंशियल के आधार प JSON वेब टोकन (JWT) बनावे के होई। ई अनिवार्य बा काहे कि हमनी के एपीआई खाली पंजीकृत उपयोगकर्ता लोग खातिर सुलभ बा. जेडब्ल्यूटी टोकन जनरेट करे खातिर कृपया निम्नलिखित कमांड के निष्पादित करीं।

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

एक बार जब हमनी के लगे जेडब्ल्यूटी टोकन हो जाला त कृपया ओसीआर ऑपरेशन करे खातिर निम्नलिखित कमांड के निष्पादित करीं आ आउटपुट के ओही क्लाउड स्टोरेज में सेव करीं।

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/image-based-pdf-sample.pdf/ocr" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

अंतिम बात

एह लेख में हमनी के पायथन कोड स्निपेट के इस्तेमाल से Image PDF to Searchable PDF के स्टेप के चर्चा कइले बानी जा। हमनी के cURL कमांड के इस्तेमाल से OCR Online कईसे कईल जाला, एकरा बारे में भी विस्तार से खोज कईले बानी। चूंकि हमनी के क्लाउड एसडीके एमआईटी लाइसेंस के तहत विकसित कईल गईल बा, एहसे आप GitHub से पूरा कोड स्निपेट डाउनलोड क के अपना जरूरत के मुताबिक अपडेट क सकतानी। हमनी के रउआँ के डेवलपर गाइड के खोज करे के बहुत सलाह देत बानी जा ताकि वर्तमान में क्लाउड एपीआई द्वारा पेश कइल जा रहल अन्य रोमांचक फीचर सभ के बारे में अउरी जानकारी मिल सके।

अगर रउआँ के कवनो संबंधित क्वेरी होखे भा हमनी के एपीआई के इस्तेमाल करत घरी रउआँ के कवनो समस्या के सामना करे के पड़े, कृपया मुफ्त ग्राहक समर्थन मंच के माध्यम से हमनी से संपर्क करे में बेझिझक होखीं।

संबंधित लेख बा

हमनी के इहो सुझाव बा कि एह बारे में अउरी जाने खातिर निम्नलिखित लेखन से गुजरल जाव