Σαρωμένο PDF για αναζήτηση

Οι εικόνες είναι ένα από τα αναπόσπαστα στοιχεία για την κοινή χρήση δεδομένων και ορισμένες εφαρμογές αποδίδουν απευθείας το περιεχόμενο προέλευσης σε μορφή PDF. Αλλά αυτή η ευκολία αυξάνει το κόστος όταν πρέπει να αναζητήσουμε συγκεκριμένο περιεχόμενο μέσα στο έγγραφο. Σε αυτό το σενάριο, κάποιος πρέπει να διαβάσει ολόκληρο το έγγραφο με μη αυτόματο τρόπο για να βρει τις σχετικές πληροφορίες. Επομένως, η συνιστώμενη προσέγγιση είναι πάντα να δημιουργείτε αρχεία με δυνατότητα αναζήτησης και εύκολης διαχείρισης. Ωστόσο, εάν έχετε λάβει τα αρχεία PDF όπου δεν μπορείτε να ελέγξετε τη μορφή των εγγράφων στην πηγή, επομένως για την αρχειοθέτηση δεδομένων και την ευρετηρίαση, πρέπει να μετατρέψουμε αυτά τα έγγραφα σε μορφή με δυνατότητα αναζήτησης. Σε αυτό το άρθρο, θα συζητήσουμε τις λεπτομέρειες σχετικά με τον τρόπο εκτέλεσης online PDF OCR και τη μετατροπή σαρωμένων αρχείων PDF/εικόνων σε έγγραφα PDF με δυνατότητα αναζήτησης/κειμένου.

API επεξεργασίας PDF

Το Aspose.PDF Cloud είναι το βραβευμένο μας API δημιουργίας και χειρισμού PDF που βασίζεται σε αρχιτεκτονική REST. Χρησιμοποιώντας το ίδιο API, μπορείτε να εκτελέσετε μια ποικιλία λειτουργιών όπως Μετατροπή EPUB σε PDF, Μετατροπή HTML σε PDF, Μετατροπή XPS σε PDF, Μετατροπή DOC and Doc X σε PDF, Μετατροπή XPS σε PDF, εισαγωγή εικόνων σε νέα ή υπάρχοντα αρχεία, επομένως, μπορούν να εκτελεστούν εικόνες σε νέα ή υπάρχοντα αρχεία PDF. πρόσβαση από οποιαδήποτε πλατφόρμα.

PDF OCR χρησιμοποιώντας την εντολή cURL

Οι εντολές cURL είναι ένας εύκολος τρόπος πρόσβασης στο Aspose.PDF Cloud μέσω του τερματικού της γραμμής εντολών. Ωστόσο, πριν αποκτήσετε πρόσβαση στα API, πρέπει πρώτα να επισκεφτείτε το Aspose.Cloud dashboard και εάν έχετε λογαριασμό GitHub ή Google, απλώς Εγγραφείτε. Διαφορετικά, κάντε κλικ στο κουμπί Δημιουργία νέου λογαριασμού και δώστε τις απαιτούμενες πληροφορίες. Τώρα συνδεθείτε στον πίνακα εργαλείων χρησιμοποιώντας διαπιστευτήρια και αναπτύξτε την ενότητα Εφαρμογές από τον πίνακα εργαλείων και μετακινηθείτε προς τα κάτω προς την ενότητα Διαπιστευτήρια πελάτη για να δείτε στοιχεία Client ID και Client Secret.

Τώρα το επόμενο βήμα είναι να δημιουργήσετε JSON Web Token (JWT) έτσι ώστε τα API να είναι προσβάσιμα μέσω της γραμμής εντολών.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Μόλις έχουμε το διακριτικό JWT, εκτελέστε την ακόλουθη εντολή cURL στο τερματικό της γραμμής εντολών.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Μετατροπή σαρωμένου PDF σε δυνατότητα αναζήτησης σε Java

Προκειμένου να διευκολύνουμε τους προγραμματιστές Java μας, έχει δημιουργηθεί ένα περιτύλιγμα γύρω από το Aspose.PDF Cloud, έτσι ώστε όλες οι δυνατότητες του Cloud API να είναι εύκολα προσβάσιμες σε κώδικα Java. Ομοίως, για να εκτελέσουμε τη λειτουργία OCR σε σαρωμένο PDF, πρέπει να χρησιμοποιήσουμε το Aspose.PDF Cloud SDK για Java.

Έτσι, το πρώτο βήμα είναι να εγκαταστήσετε το SKD στο σύστημα. Το Cloud SDK είναι διαθέσιμο για λήψη μέσω Maven και GitHub. Τώρα προσθέστε τις ακόλουθες λεπτομέρειες στο αρχείο pom.xml για λήψη και χρήση του Aspose.Pdf.jar στο έργο κατασκευής Maven.

<repositories>
 <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>
<dependencies>
 <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.1.0</version>
        <scope>compile</scope>
    </dependency>
 </dependencies>

Για περισσότερες πληροφορίες, επισκεφτείτε το How to install Aspose.Cloud SDKs.

Τα παρακάτω βήματα ορίζουν τη διαδικασία λειτουργίας COR σε αρχείο PDF εικόνας.

  • Το πρώτο βήμα είναι να δημιουργήσετε ένα αντικείμενο PdfApi κατά τη διαβίβαση των μυστικών στοιχείων ClientID και Client (διαθέσιμα στο Aspose.Cloud dashboard).
  • Δημιουργήστε μια παρουσία αρχείου και περάστε τη θέση του αρχείου εικόνας ως όρισμα.
  • Καλέστε τη μέθοδο uploadFile(…) και περάστε το έγγραφο PDF και την παρουσία αρχείου ως ορίσματα.
  • Το επόμενο βήμα είναι να δημιουργήσετε μια παρουσία συμβολοσειράς και να ορίσετε την τιμή της στον κώδικα γλώσσας που περιέχει το αρχείο προέλευσης, π.χ. “rus,eng”.
  • Τέλος, καλέστε τη μέθοδο putSearchableDocument(…) του PdfApi και περάστε το όνομα αρχείου PDF εισόδου και περάστε τον κωδικό γλώσσας ως ορίσματα.

γλώσσες για τη μηχανή OCR. υποστηριζόμενες τιμές: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, viechi, eng orrus, συνδυασμός τους.

// Λάβετε ClientID και ClientSecret από https://dashboard.aspose.cloud/
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
				
// στιγμιότυπο δημιουργίαςPdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
				
// εισαγωγή εγγράφου PDF
String name = "ocrscan.pdf";	        
			    
// Φορτώστε το αρχείο από το τοπικό σύστημα
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// μεταφορτώστε το αρχείο στο χώρο αποθήκευσης cloud
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
				
// τις γλώσσες που χρησιμοποιούνται στο αρχείο εικόνας
String lang = "rus,eng";
				
//  εκτελέστε το OCR σε έγγραφο PDF εικόνας
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());
Προεπισκόπηση αποτελεσμάτων OCR

Εικόνα 1: - Προεπισκόπηση εξόδου OCR.

Τα δείγματα αρχείων PDF που χρησιμοποιούνται στο παραπάνω παράδειγμα μπορούν να ληφθούν από τους ακόλουθους συνδέσμους:

Σύναψη

Σε αυτό το άρθρο, μάθαμε μερικά απλά βήματα σχετικά με τον τρόπο εκτέλεσης της ηλεκτρονικής λειτουργίας PDF OCR και τη μετατροπή του σαρωμένου εγγράφου PDF σε έγγραφο PDF με δυνατότητα αναζήτησης. Εκτός από τις λειτουργίες OCR, το SDK είναι αρκετά ισχυρό και μπορεί να εκτελέσει μια ποικιλία άλλων λειτουργιών. Για περισσότερες λεπτομέρειες, επισκεφτείτε το Aspose.PDF Cloud Features.