Gescanntes PDF in durchsuchbares

Bilder sind eine der integralen Komponenten für den Datenaustausch und einige Anwendungen rendern den Quellinhalt direkt im PDF-Format. Dieser Komfort erhöht jedoch den Aufwand, wenn wir nach bestimmten Inhalten im Dokument suchen müssen. In diesem Szenario muss man das gesamte Dokument manuell durchgehen, um die relevanten Informationen zu finden. Der empfohlene Ansatz besteht daher immer darin, Dateien zu generieren, die durchsuchbar und einfach zu verwalten sind. Wenn Sie jedoch PDF Dateien erhalten haben, bei denen Sie das Format der Dokumente an der Quelle nicht kontrollieren können, müssen wir solche Dokumente zur Datenarchivierung und -indizierung in ein durchsuchbares Format konvertieren. In diesem Artikel besprechen wir die Details, wie Sie online PDF OCR durchführen und gescannte/Bild-PDF Dateien in durchsuchbare/Text-PDF Dokumente konvertieren.

PDF-Verarbeitungs-API

Aspose.PDF Cloud ist unsere preisgekrönte API zur Erstellung und Bearbeitung von PDF Dateien auf Basis der REST-Architektur. Mit derselben API können Sie eine Vielzahl von Vorgängen ausführen, z. B. EPUB in PDF konvertieren, HTML in PDF konvertieren, XPS in PDF konvertieren, DOC und Doc X in PDF konvertieren, XPS in PDF konvertieren, Bilder in neue oder vorhandene PDF Dateien einfügen usw. Alle diese Vorgänge werden in der Cloud ausgeführt und daher kann auf die API von jeder Plattform aus zugegriffen werden.

PDF OCR mit dem cURL-Befehl

Die cURL-Befehle sind eine einfache Möglichkeit, über das Befehlszeilenterminal auf Aspose.PDF Cloud zuzugreifen. Bevor Sie jedoch auf die APIs zugreifen können, müssen Sie zunächst das Aspose.Cloud-Dashboard besuchen und sich einfach anmelden, wenn Sie ein GitHub oder Google-Konto haben. Andernfalls klicken Sie auf die Schaltfläche Neues Konto erstellen und geben Sie die erforderlichen Informationen ein. Melden Sie sich nun mit Ihren Anmeldeinformationen beim Dashboard an, erweitern Sie den Abschnitt „Anwendungen“ im Dashboard und scrollen Sie nach unten zum Abschnitt „Client-Anmeldeinformationen“, um die Details zu Client-ID und Client-Geheimnis anzuzeigen.

Der nächste Schritt besteht nun darin, JSON Web Token (JWT) zu generieren, damit die APIs über die Eingabeaufforderung zugänglich sind.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Sobald wir das JWT-Token haben, führen Sie den folgenden cURL-Befehl im Befehlszeilenterminal aus.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Gescannte PDF Dateien in Java in durchsuchbare Dateien konvertieren

Um unseren Java-Programmierern die Arbeit zu erleichtern, wurde ein Wrapper um Aspose.PDF Cloud erstellt, sodass alle Funktionen der Cloud-API problemlos in Java-Code aufgerufen werden können. Um den OCR-Vorgang für gescannte PDFs auszuführen, müssen wir Aspose.PDF Cloud SDK für Java verwenden.

Der erste Schritt besteht also darin, das SKD auf dem System zu installieren. Das Cloud SDK steht zum Download über Maven und GitHub zur Verfügung. Fügen Sie nun die folgenden Details in Ihre pom.xml-Datei ein, um Aspose.Pdf.jar herunterzuladen und in Ihrem Maven-Build-Projekt zu verwenden.

<repositories>
 <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>
<dependencies>
 <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.1.0</version>
        <scope>compile</scope>
    </dependency>
 </dependencies>

Weitere Informationen finden Sie unter So installieren Sie Aspose.Cloud SDKs.

Die unten angegebenen Schritte definieren den Vorgang des COR-Vorgangs an einer PDF bilddatei.

  • Der erste Schritt besteht darin, ein PdfApi Objekt zu erstellen und dabei die ClientID und die geheimen Client-Details zu übergeben (verfügbar im Aspose.Cloud-Dashboard).
  • Erstellen Sie eine Dateiinstanz und übergeben Sie den Speicherort der Bilddatei als Argument.
  • Rufen Sie die Methode uploadFile(…) auf und übergeben Sie das PDF Dokument und die Dateiinstanz als Argumente.
  • Der nächste Schritt besteht darin, eine Zeichenfolgeninstanz zu erstellen und ihren Wert auf den Sprachcode festzulegen, der in der Quelldatei enthalten ist, z. B. „rus,eng“.
  • Rufen Sie abschließend die Methode putSearchableDocument(…) von PdfApi auf und übergeben Sie den Namen der eingegebenen PDF-Datei und den Sprachcode als Argumente.

Sprachen für OCR-Engine. Unterstützte Werte: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra oder deren Kombination, z. B. eng, rus.

// Holen Sie sich ClientID und ClientSecret von https://dashboard.aspose.cloud/
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
				
// createPdfApi-Instanz
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
				
// PDF Dokument eingeben
String name = "ocrscan.pdf";	        
			    
// Laden Sie die Datei vom lokalen System
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// Laden Sie die Datei in den Cloud-Speicher hoch
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
				
// die in der Bilddatei verwendeten Sprachen
String lang = "rus,eng";
				
//  Führen Sie die OCR funktion am PDF bilddokument durch
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());
OCR-Ergebnisvorschau

Bild 1: – OCR-Ausgabevorschau.

Die im obigen Beispiel verwendeten Beispiel-PDF Dateien können von den folgenden Links heruntergeladen werden:

Abschluss

In diesem Artikel haben wir einige einfache Schritte gelernt, wie man einen Online-PDF-OCR-Vorgang durchführt und das gescannte PDF Dokument in ein durchsuchbares PDF Dokument konvertiert. Abgesehen von OCR-Vorgängen ist das SDK recht leistungsstark und kann eine Vielzahl anderer Vorgänge ausführen. Weitere Einzelheiten finden Sie unter Aspose.PDF Cloud funktionen.