დღევანდელ მონაცემებზე ორიენტირებულ სამყაროში PDF გახდა დოკუმენტების შენახვისა და გაზიარების შეუცვლელი ფორმატი. თუმცა, ყველა PDF არ არის ადვილად საძიებო ან რედაქტირებადი, განსაკუთრებით ის, რაც სურათზეა დაფუძნებული. დოკუმენტებთან ურთიერთობისას მართლაც რთულია ნებისმიერი ტექსტური ინფორმაციის კოპირება/ამოღება შემდგომი მანიპულირებისთვის. საბედნიეროდ, ოპტიკური სიმბოლოების ამოცნობის (OCR) ტექნოლოგიის წყალობით, თქვენ შეგიძლიათ მარტივად გადაიყვანოთ სურათების PDF ფაილები საძიებელ PDF-ებად. ამ ტექნიკურ ბლოგში ჩვენ განვიხილავთ, თუ როგორ უნდა გადავიტანოთ OCR PDF საძიებო PDF-ად სხვადასხვა ტექნიკის გამოყენებით, განსაკუთრებული აქცენტით REST API-ზე. ჩვენ ასევე განვიხილავთ, თუ როგორ უნდა ამოიღოთ ტექსტი OCR PDF-ებიდან, გაწვდით სრულყოფილ გაგებას, თუ როგორ გამოიყენოთ OCR ტექნოლოგია თქვენი PDF დოკუმენტების სრული პოტენციალის განსაბლოკად.
- OCR PDF Java SDK-ის გამოყენებით
- სკანირებული PDF-ზე საძიებო PDF-ში Java-ს გამოყენებით
- OCR ონლაინ cURL ბრძანებების გამოყენებით
OCR PDF Java SDK-ის გამოყენებით
Aspose.PDF Cloud SDK for Java არის ღრუბელზე დაფუძნებული ძლიერი API, რომელიც გთავაზობთ ფუნქციების და შესაძლებლობების ფართო სპექტრს PDF დოკუმენტებთან მუშაობისთვის. მისი ერთ-ერთი ძირითადი ფუნქციაა PDF-ებზე OCR-ის შესრულების შესაძლებლობა, რაც მნიშვნელოვნად გაამარტივებს სურათზე დაფუძნებული PDF-ებიდან ტექსტის ამოღების პროცესს და საძიებო PDF-ების შექმნას. მისი მოსახერხებელი ინტერფეისით და ყოვლისმომცველი დოკუმენტაციით, ეს SDK აადვილებს PDF-ებზე OCR-ის შესრულების პროცესის ავტომატიზაციას, დაზოგავს დროს და ზრდის პროდუქტიულობას.
გარდა ამისა, ღრუბელზე დაფუძნებული ეს API შექმნილია შეყვანის მრავალფეროვან ფორმატებში და შეუძლია ხელნაწერი ტექსტის ამოცნობაც კი, რაც მას შესანიშნავ არჩევანს აქცევს ბიზნესისა და დეველოპერებისთვის, რომლებიც ცდილობენ გაამარტივონ თავიანთი დოკუმენტების სამუშაო ნაკადი. ახლა პირველი ნაბიჯი არის მისი მითითების დამატება Java პროექტში შემდეგი დეტალების დამატებით maven build პროექტის pom.xml-ში.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
თუ არ გაქვთ არსებული ანგარიში, თქვენ უნდა შექმნათ უფასო ანგარიში Aspose Cloud-ზე. შედით ახლად შექმნილი ანგარიშის გამოყენებით და მოძებნეთ/შექმენით კლიენტის ID და კლიენტის საიდუმლო Cloud Dashboard-ზე. ეს დეტალები საჭიროა მომდევნო განყოფილებებში.
სკანირებული PDF-ზე საძიებო PDF-ში Java-ს გამოყენებით
ეს განყოფილება განმარტავს დეტალებს, თუ როგორ უნდა გადაიყვანოთ სკანირებული PDF საძიებო PDF-ად Java კოდის ფრაგმენტის გამოყენებით. გთხოვთ გაითვალისწინოთ, რომ Java Cloud SDK მხარს უჭერს შემდეგი ენების ამოცნობას: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra ან მათი კომბინაცია მაგ. eng,rus.
- ჯერ უნდა შევქმნათ PdfApi-ს ობიექტი, სადაც არგუმენტებად გადავცემთ ClientID და კლიენტის საიდუმლო დეტალებს.
- მეორეც, შექმენით File კლასის ინსტანცია გამოსახულების PDF-ის ჩასატვირთად
- მესამე, გამოიძახეთ მეთოდი uploadFile(…), რათა ატვირთოთ შეყვანილი PDF ღრუბლოვან საცავში
- ვინაიდან ჩვენი სურათი PDF შეიცავს ინგლისურ ტექსტს, ამიტომ ჩვენ უნდა შევქმნათ სიმებიანი ობიექტი, რომელსაც აქვს მნიშვნელობა “eng”
- და ბოლოს, მოვუწოდებთ მეთოდს putSearchableDocument(…), რომელიც არგუმენტად მოითხოვს შეყვანილ PDF-ს და ენის კოდს.
კოდის წარმატებით შესრულების შემდეგ, საძიებელი PDF ინახება ღრუბლოვან საცავში
try
{
// მიიღეთ ClientID და ClientSecret https://dashboard.aspose.cloud/-დან
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// createPdfApi მაგალითი
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// შეიყვანეთ სურათი PDF დოკუმენტი
String name = "ScannedPDF.pdf";
// ჩატვირთეთ ფაილი ადგილობრივი სისტემიდან
File file = new File(name);
// ატვირთეთ ფაილი ღრუბლოვან საცავში
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// გამოსახულების PDF-ში გამოყენებული ენები
String lang = "eng";
// შეასრულეთ OCR გამოსახულების PDF დოკუმენტზე
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// წარმატების დაბეჭდვის შეტყობინება
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
ზემოთ მოყვანილ მაგალითში გამოყენებული დასკანერებული PDF შეიძლება ჩამოიტვირთოს BusinessReport.pdf-დან და შედეგიანი საძიებელი PDF-დან Converted.pdf
OCR ონლაინ cURL ბრძანებების გამოყენებით
cURL ბრძანებები ერთ-ერთი მოსახერხებელი მიდგომაა REST API-ების გამოსაძახებლად. ასე რომ, ამ განყოფილებაში ჩვენ ვაპირებთ გამოვიყენოთ cURL ბრძანებები OCR-ისთვის ონლაინ. ახლა, როგორც წინაპირობა, ჩვენ ჯერ უნდა გამოვმუშაოთ JWT წვდომის ნიშანი (კლიენტის რწმუნებათა სიგელების საფუძველზე) შემდეგი ბრძანების შესრულებისას.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
მას შემდეგ რაც გვექნება JWT ჟეტონი, გთხოვთ, შემდეგი ბრძანება შეასრულოთ OCR ონლაინ და გადაიყვანოთ სურათი PDF საძიებლად PDF დოკუმენტად. შედეგად მიღებული ფაილი შემდეგ ინახება ღრუბლოვან საცავში.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
დასკვნა
OCR-ის შესრულება PDF-ებზე გადამწყვეტი პროცესია ამ დოკუმენტების სრული პოტენციალის გასახსნელად. ღრუბელზე დაფუძნებული OCR ხელსაწყოების დახმარებით, როგორიცაა Aspose.PDF Cloud SDK Java-სთვის, ამ პროცესის გამარტივება და ავტომატიზაცია შესაძლებელია, რაც დაზოგავს დროს და გაზრდის პროდუქტიულობას. OCR-ის სიმძლავრის გამოყენებით, ბიზნესს და დეველოპერებს შეუძლიათ სურათზე დაფუძნებული PDF-ების გარდაქმნა საძიებლად PDF-ებად, რაც აადვილებს მათ ძიებას, რედაქტირებას და გაზიარებას. ნათელია, რომ ეს API გთავაზობთ უამრავ მძლავრ ფუნქციებსა და შესაძლებლობებს PDF-ებთან მუშაობისთვის. ამ ტექნიკურ ბლოგში მოცემული ნაბიჯ-ნაბიჯ სახელმძღვანელოების მიყოლებით, შეგიძლიათ დაიწყოთ OCR-ის გამოყენება PDF-ებზე და გადაიტანოთ თქვენი დოკუმენტის სამუშაო პროცესი შემდეგ დონეზე.
თქვენ შეგიძლიათ განიხილოთ API-ზე წვდომა ვებ ბრაუზერში swagger ინტერფეისის გამოყენებით. გარდა ამისა, რადგან ჩვენი SDK-ები აგებულია MIT ლიცენზიით, ამიტომ სრული კოდის ჩამოტვირთვა შესაძლებელია GitHub-დან. თუ API-ის გამოყენებისას რაიმე პრობლემას წააწყდებით, გთხოვთ, მოგერიდებათ დაგვიკავშირდეთ [პროდუქტის მხარდაჭერის უფასო ფორუმის] მეშვეობით 9.
დაკავშირებული სტატიები
ჩვენ გირჩევთ ეწვიოთ შემდეგ ბმულებს მეტის გასაგებად: