PDF तः पाठं निष्कासयन्तु

जावा मध्ये PDF तः पाठं निष्कासयन्तु

वयं सर्वे जानीमः यत् PDF सञ्चिकाः सॉफ्टवेयर, हार्डवेयर, अथवा ऑपरेटिंग् सिस्टम् इत्यस्मात् स्वतन्त्रतया दस्तावेजान् विश्वसनीयतया प्रस्तुत्य आदानप्रदानार्थं प्रयुक्तेषु महत्त्वपूर्णेषु व्यापकरूपेण च प्रयुक्तेषु डिजिटलस्वरूपेषु अन्यतमम् अस्ति तथापि केषुचित् परिदृश्येषु बृहत् PDF सञ्चिकाभ्यः अंशं प्राप्तुं अस्माकं रुचिः भवेत् । अथवा, अस्माकं कृते PDF इत्येतत् Text मध्ये online रक्षितुं आवश्यकता भवितुम् अर्हति । अतः अस्मिन् लेखे वयं Java REST API इत्यस्य उपयोगेन PDF to Text converter इत्यस्य विकासं कथं करणीयम् इति विवरणं अन्वेष्टुं गच्छामः ।

पीडीएफ जनरेटर एपीआई

टेम्पलेट् इत्यस्य उपयोगेन अथवा अस्माकं REST API इत्यस्य उपयोगेन शुद्धतः वा PDF दस्तावेजान् जनयितुं लाभं प्राप्नुवन्तु। तस्मिन् एव काले एपिआइ भवन्तं सम्पादयितुं अपि च PDF सञ्चिकाः अन्येषु समर्थितस्वरूपेषु परिवर्तनं कर्तुं च समर्थयति । PDF तः पाठं निष्कासयितुं, Java Cloud SDK इत्यस्य उपयोगेन PDF सञ्चिकानां विगुप्तीकरणस्य, विलयस्य च लाभं अपि भवान् ग्रहीतुं शक्नोति । अधुना, Aspose.PDF Cloud SDK for Java इत्यस्य उपयोगाय, अस्माकं Java application इत्यस्मिन् pom.xml (maven build type project) इत्यस्मिन् निम्नलिखितविवरणं समाविष्ट्य तस्य सन्दर्भं योजयितुं आवश्यकम्

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-cloud-pdf</artifactId>
        <version>21.11.0</version>
        <scope>compile</scope>
    </dependency>
</dependencies>

संस्थापनानन्तरं अस्माभिः Cloud Dashboard इत्यस्य उपरि निःशुल्कं खातं निर्मातव्यं तथा च व्यक्तिगतग्राहकप्रमाणपत्राणि प्राप्तव्यानि ।

जावा इत्यस्य उपयोगेन PDF तः Text निष्कासयन्तु

Java cloud SDK इत्यस्य उपयोगेन PDF तः पाठं निष्कासयितुं विवरणं अन्वेषयामः । अस्मिन् उदाहरणे वयं निम्नलिखितनिवेशस्य उपयोगं कर्तुं गच्छामः PdfWithTable.pdf संचिका।

pdf to text ocr

चित्रम् १:- PDF to Text निष्कर्षणार्थं सञ्चिकां निवेशयन्तु ।

pdf to text ocr

चित्रम् २:- PDF पूर्वावलोकनात् पाठं निष्कासयन्तु

// अधिकउदाहरणार्थं कृपया https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-java/tree/master/Examples/src/main/java/com/aspose/asposecloudpdf/examples इति सञ्चिकां पश्यन्तु

try
    {
    // https://dashboard.aspose.cloud/ इत्यस्मात् ClientID तथा ClientSecret प्राप्तुं शक्नुवन्ति।
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
    // PdfApi इत्यस्य एकं उदाहरणं रचयन्तु
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
    // इनपुट् PDF दस्तावेजस्य नाम
    String name = "PdfWithTable.pdf";
		        
    // इनपुट् PDF सञ्चिकायाः सामग्रीं पठन्तु
    File file = new File(name); 
    // मेघभण्डारणस्थाने PDF अपलोड् कुर्वन्तु
    pdfApi.uploadFile("input.pdf", file, null);
		        
    // निम्न - वामकोणस्य X-निर्देशाङ्कः
    Double LLX = 500.0;
    // Y - निम्न-वामकोणस्य निर्देशांकः ।
    Double LLY = 500.0;
    // X - उपरि-दक्षिणकोणस्य निर्देशांकः ।
    Double URX = 800.0;
    // Y - ऊर्ध्व-दक्षिणकोणस्य निर्देशांकः ।
    Double URY = 800.0;
			       
    // PDF इत्येतत् पाठं प्रति परिवर्तयितुं API इति आह्वयन्तु
    TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    
		    
    // व्यक्तिगत पाठ घटने के माध्यम से भ्रमण
    for(int counter=0; counter <=response.getTextOccurrences().getList().size()-1; counter++)
    {
        // कन्सोल् मध्ये पाठसामग्री लिखन्तु
        System.out.println(response.getTextOccurrences().getList().get(counter).getText());
    }
		  
    System.out.println("Extract Text from PDF successful !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

अधुना उपरि निर्दिष्टं कोडस्निपेट् अवगन्तुं प्रयतेम:

PdfApi pdfApi = new PdfApi(clientSecret,clientId);

व्यक्तिगतप्रमाणपत्राणि तर्करूपेण पारयन् PdfApi इत्यस्य उदाहरणं रचयन्तु ।

File file = new File(name); 
pdfApi.uploadFile("input.pdf", file, null);

File ऑब्जेक्ट् इत्यस्य उपयोगेन input PDF पठन्तु तथा च PdfAPi क्लास् इत्यस्य uploadFile(…) मेथड् इत्यस्य उपयोगेन क्लाउड् स्टोरेज इत्यत्र अपलोड् कुर्वन्तु । कृपया ज्ञातव्यं यत् सञ्चिका uploadFile मेथड् इत्यस्मिन् प्रयुक्तेन नामेन सह अपलोड् कृता अस्ति ।

TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    

अधुना getText(..) मेथड् इत्यस्य आह्वानं कुर्वन्तु यत्र वयं input PDF file इत्यस्य नाम, पृष्ठे आयताकाराः आयामाः निर्दिशन्ति यस्मात् अस्माकं textual content इत्येतत् निष्कासयितुं आवश्यकं भवति तथा च, extracted content इत्येतत् TextRectsResponse object इत्यत्र प्रत्यागन्तुं भवति

response.getTextOccurrences().getList().get(counter).getText()

अन्ते, निष्कासितानां पाठसामग्रीणां मुद्रणार्थं वयं सर्वेषां TextOccurances मध्ये पुनरावृत्तिं कृत्वा कन्सोल् मध्ये प्रदर्शयितुं गच्छामः ।

cURL Commands इत्यस्य उपयोगेन PDF to Text इति

Java code snippet इत्यस्य अतिरिक्तं cURL आदेशानां उपयोगेन pdftotext operation अपि कर्तुं शक्नुमः । अधुना, अस्य दृष्टिकोणस्य पूर्वापेक्षासु एकः अस्ति यत् निम्नलिखित-आदेशस्य उपयोगेन JWT-प्रवेश-टोकन् (क्लायन्ट्-प्रमाणपत्रेषु आधारितम्) जनयितुं शक्यते ।

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

एकदा JWT उत्पन्नं जातं चेत्, कृपया मेघभण्डारणस्थाने पूर्वमेव उपलब्धायाः PDF सञ्चिकायाः पाठं निष्कासयितुं निम्नलिखितम् आदेशं निष्पादयन्तु ।

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/input.pdf/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

त्वरित युक्तिः

PDF to Text free App इत्यस्य अन्वेषणं कुर्वन् अस्ति ! कृपया अस्माकं PDF Parser इत्यस्य उपयोगेन प्रयासं कुर्वन्तु ।

समापन टिप्पणियाँ

निष्कर्षतः, जावा इत्यस्य उपयोगेन PDF सञ्चिकाभ्यः पाठं निष्कासयितुं ये स्वस्य आँकडासंसाधनं विश्लेषणं च आवश्यकतां स्वचालितं कर्तुम् इच्छन्ति तेषां कृते एकं शक्तिशाली समाधानं भवितुम् अर्हति । अस्य मार्गदर्शकस्य साहाय्येन इदानीं भवतः समीपे निर्माणार्थं ठोसः आधारः अस्ति तथा च PDF दस्तावेजेभ्यः पाठनिष्कासनार्थं स्वस्य जावा-आधारितं समाधानं सहजतया कार्यान्वितुं शक्नोति । भवान् दत्तांशविश्लेषणार्थं, यन्त्रशिक्षणार्थं, अन्यस्य वा प्रयोजनार्थं पाठं निष्कासयितुं इच्छति वा, जावा भवतः आवश्यकतानां कृते लचीलं विश्वसनीयं च मञ्चं प्रदाति । अतः अग्रे गत्वा स्वस्य नवप्राप्तकौशलस्य परीक्षणं कुर्वन्तु!

यदि भवान् एपिआइ-द्वारा प्रस्तावितानां अन्येषां रोमाञ्चकारीणां विशेषतानां अन्वेषणं कर्तुं रुचिं लभते तर्हि कृपया उत्पाददस्तावेजीकरणं अन्वेष्टुम् । अन्तिमे, यदि भवान् एपिआइ-उपयोगं कुर्वन् किमपि समस्यां प्राप्नोति, अथवा भवतां किमपि सम्बद्धं प्रश्नं भवति, तर्हि कृपया निःशुल्कं उत्पादसमर्थनमञ्च मार्गेण अस्माभिः सह सम्पर्कं कर्तुं निःशङ्कं भवन्तु ।

सम्बन्धित लेख

अधिकं ज्ञातुं कृपया निम्नलिखितलिङ्कानि पश्यन्तु।