پی ڈی ایف سے متن نکالیں۔

جاوا میں پی ڈی ایف سے متن نکالیں۔

ہم سب جانتے ہیں کہ PDF فائلیں سب سے اہم اور وسیع پیمانے پر استعمال ہونے والے ڈیجیٹل فارمیٹس میں سے ایک ہیں جو دستاویزات کو قابل اعتماد طریقے سے پیش کرنے اور تبادلہ کرنے کے لیے استعمال ہوتی ہیں، جو سافٹ ویئر، ہارڈ ویئر، یا آپریٹنگ سسٹم سے آزاد ہیں۔ تاہم، کچھ منظرناموں میں، ہمیں بڑی پی ڈی ایف فائلوں سے اقتباس حاصل کرنے میں دلچسپی ہو سکتی ہے۔ یا، ہمیں پی ڈی ایف کو آن لائن ٹیکسٹ میں محفوظ کرنے کی ضرورت پڑ سکتی ہے۔ لہذا اس مضمون میں، ہم جاوا REST API کا استعمال کرتے ہوئے PDF سے ٹیکسٹ کنورٹر کو کیسے تیار کرنے کے بارے میں تفصیلات تلاش کرنے جا رہے ہیں۔

پی ڈی ایف جنریٹر API

ٹیمپلیٹس کا استعمال کرتے ہوئے یا ہمارے REST API کا استعمال کرتے ہوئے شروع سے PDF دستاویزات تیار کرنے کا فائدہ حاصل کریں۔ اسی وقت، API آپ کو ترمیم کرنے کے ساتھ ساتھ PDF فائلوں کو دوسرے [معاون شدہ فارمیٹس] میں تبدیل کرنے کے قابل بھی بناتا ہے6۔ آپ جاوا کلاؤڈ SDK کا استعمال کرتے ہوئے PDF سے متن نکالنے، پی ڈی ایف فائلوں کو ڈکرپٹ کرنے اور ان کو ضم کرنے کے فوائد بھی لے سکتے ہیں۔ اب، [Aspose.PDF Cloud SDK for Java17 استعمال کرنے کے لیے، ہمیں pom.xml (maven build type project) میں درج ذیل تفصیلات شامل کرکے اپنی جاوا ایپلیکیشن میں اس کا حوالہ شامل کرنا ہوگا۔

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-cloud-pdf</artifactId>
        <version>21.11.0</version>
        <scope>compile</scope>
    </dependency>
</dependencies>

انسٹالیشن کے بعد، ہمیں Cloud Dashboard پر ایک مفت اکاؤنٹ بنانے اور ذاتی نوعیت کے کلائنٹ کی اسناد حاصل کرنے کی ضرورت ہے۔

جاوا کا استعمال کرتے ہوئے پی ڈی ایف سے متن نکالیں۔

آئیے جاوا کلاؤڈ SDK کا استعمال کرتے ہوئے پی ڈی ایف سے متن نکالنے کے لیے تفصیلات کو دریافت کریں۔ اس مثال میں، ہم درج ذیل ان پٹ PdfWithTable.pdf استعمال کرنے جا رہے ہیں۔ فائل

پی ڈی ایف سے ٹیکسٹ او سی آر

تصویر 1:- پی ڈی ایف سے ٹیکسٹ نکالنے کے لیے ان پٹ فائل۔

پی ڈی ایف سے ٹیکسٹ او سی آر

تصویر 2:- پی ڈی ایف پیش نظارہ سے متن نکالیں۔

// مزید مثالوں کے لیے، براہ کرم https://github.com/aspose-pdf-cloud/aspose-pdf-cloud-java/tree/master/Examples/src/main/java/com/aspose/asposecloudpdf/examples ملاحظہ کریں

try
    {
    // https://dashboard.aspose.cloud/ سے ClientID اور ClientSecret حاصل کریں
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
		    
    // PdfApi کی ایک مثال بنائیں
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
    // ان پٹ پی ڈی ایف دستاویز کا نام
    String name = "PdfWithTable.pdf";
		        
    // ان پٹ پی ڈی ایف فائل کا مواد پڑھیں
    File file = new File(name); 
    // کلاؤڈ اسٹوریج پر پی ڈی ایف اپ لوڈ کریں۔
    pdfApi.uploadFile("input.pdf", file, null);
		        
    // نچلے - بائیں کونے کا ایکس کوآرڈینیٹ
    Double LLX = 500.0;
    // Y - نچلے بائیں کونے کا کوآرڈینیٹ۔
    Double LLY = 500.0;
    // X - اوپری دائیں کونے کا کوآرڈینیٹ۔
    Double URX = 800.0;
    // Y - اوپری دائیں کونے کا کوآرڈینیٹ۔
    Double URY = 800.0;
			       
    // پی ڈی ایف کو متن میں تبدیل کرنے کے لیے API کو کال کریں۔
    TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    
		    
    // انفرادی متن کی موجودگی سے گزریں۔
    for(int counter=0; counter <=response.getTextOccurrences().getList().size()-1; counter++)
    {
        // کنسول میں متن کا مواد لکھیں۔
        System.out.println(response.getTextOccurrences().getList().get(counter).getText());
    }
		  
    System.out.println("Extract Text from PDF successful !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

اب آئیے اوپر دیے گئے کوڈ کے ٹکڑوں کو سمجھنے کی کوشش کرتے ہیں:

PdfApi pdfApi = new PdfApi(clientSecret,clientId);

PdfApi کی ایک مثال تخلیق کریں جب کہ ذاتی نوعیت کی اسناد کو بطور دلیل پیش کریں۔

File file = new File(name); 
pdfApi.uploadFile("input.pdf", file, null);

فائل آبجیکٹ کا استعمال کرتے ہوئے ان پٹ پی ڈی ایف کو پڑھیں اور PdfAPi کلاس کے uploadFile(…) طریقہ استعمال کرکے اسے کلاؤڈ اسٹوریج پر اپ لوڈ کریں۔ براہ کرم نوٹ کریں کہ فائل اپ لوڈ فائل کے طریقہ کار میں استعمال ہونے والے نام کے ساتھ اپ لوڈ کی گئی ہے۔

TextRectsResponse response = pdfApi.getText("input.pdf", LLX, LLY, URX, URY, null, null, null, null, null);    

اب getText(..) طریقہ کو کال کریں جہاں ہم ان پٹ پی ڈی ایف فائل کا نام بتاتے ہیں، صفحہ پر مستطیل طول و عرض جس سے ہمیں متنی مواد نکالنا ہے اور نکالے گئے مواد کو TextRectsResponse آبجیکٹ میں واپس کرنا ہے۔

response.getTextOccurrences().getList().get(counter).getText()

آخر میں، نکالے گئے متن کے مواد کو پرنٹ کرنے کے لیے، ہم تمام TextOccurances کے ذریعے اعادہ کریں گے اور انہیں کنسول میں ڈسپلے کریں گے۔

سی آر ایل کمانڈز کا استعمال کرتے ہوئے پی ڈی ایف ٹو ٹیکسٹ

جاوا کوڈ کے ٹکڑوں کے علاوہ، ہم cURL کمانڈز کا استعمال کرتے ہوئے pdftotext آپریشن بھی کر سکتے ہیں۔ اب، اس نقطہ نظر کے لیے ایک شرط یہ ہے کہ درج ذیل کمانڈ کا استعمال کرتے ہوئے JWT رسائی ٹوکن (کلائنٹ کی اسناد پر مبنی) تیار کریں۔

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT تیار ہونے کے بعد، براہ کرم کلاؤڈ اسٹوریج میں پہلے سے موجود PDF فائل سے ٹیکسٹ نکالنے کے لیے درج ذیل کمانڈ پر عمل کریں۔

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/input.pdf/text?splitRects=true&LLX=0&LLY=0&URX=800&URY=800" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

فوری ٹپ

پی ڈی ایف ٹو ٹیکسٹ فری ایپ کی تلاش ہے! براہ کرم ہمارا PDF Parser استعمال کرنے کی کوشش کریں۔

ریمارکس اختتامی

آخر میں، جاوا کا استعمال کرتے ہوئے پی ڈی ایف فائلوں سے متن نکالنا ان لوگوں کے لیے ایک طاقتور حل ہو سکتا ہے جو اپنی ڈیٹا پروسیسنگ اور تجزیہ کی ضروریات کو خودکار بنانا چاہتے ہیں۔ اس گائیڈ کی مدد سے، اب آپ کے پاس مضبوط بنیاد ہے اور آپ PDF دستاویزات سے متن نکالنے کے لیے اپنے جاوا پر مبنی حل کو آسانی سے نافذ کر سکتے ہیں۔ چاہے آپ ڈیٹا کے تجزیہ، مشین لرننگ، یا کسی اور مقصد کے لیے متن نکالنا چاہتے ہوں، جاوا آپ کی ضروریات کے لیے ایک لچکدار اور قابل اعتماد پلیٹ فارم فراہم کرتا ہے۔ تو آگے بڑھیں اور اپنی نئی حاصل کردہ مہارتوں کو آزمائیں!

اگر آپ API کی طرف سے پیش کی جانے والی دیگر دلچسپ خصوصیات کو دریافت کرنے میں دلچسپی رکھتے ہیں، تو براہ کرم [پروڈکٹ ڈاکومینٹیشن11 کو تلاش کریں۔ آخر میں، اگر آپ کو API کا استعمال کرتے ہوئے کوئی مسئلہ درپیش ہے، یا آپ سے کوئی متعلقہ سوال ہے، تو براہ کرم ہم سے بلا جھجھک رابطہ کریں بذریعہ مفت [پروڈکٹ سپورٹ فورم9۔

متعلقہ مضامین

کے بارے میں مزید جاننے کے لیے براہ کرم درج ذیل لنکس پر جائیں: