
圖像是資料共享的重要組成部分之一,一些應用程式直接以 PDF 格式呈現來源內容。但當我們需要在文件中搜尋某些內容時,這種便利性會增加成本。在這種情況下,人們必須手動瀏覽整個文件才能找到相關資訊。因此,建議的方法始終是產生可搜尋且易於管理的文件。但是,如果您收到了 PDF 文件,而您無法在來源處控製文檔的格式,那麼為了進行資料存檔和索引,我們需要將此類文件轉換為可搜尋的格式。在本文中,我們將詳細討論如何執行線上 PDF OCR 以及如何將掃描/圖像 PDF 文件轉換為可搜尋/文字 PDF 文件。
PDF處理API
Aspose.PDF Cloud 是我們屢獲殊榮的基於 REST 架構的 PDF 建立和操作 API。使用相同的 API,您可以執行各種操作,例如 將 EPUB 轉換為 PDF、將 HTML 轉換為 PDF、將 XPS 轉換為 PDF、將 DOC 和 Doc X 轉換為 PDF、將 XPS 轉換為 PDF、在新的平台或現有的 PDF 文件中執行任何功能。
使用 cURL 指令進行 PDF OCR
cURL 命令是透過命令列終端存取 Aspose.PDF Cloud 的簡單方法。但在存取 API 之前,您需要先造訪 Aspose.Cloud 儀表板,如果您有 GitHub 或 Google 帳戶,只需註冊即可。否則,請點擊建立新帳戶按鈕並提供所需資訊。現在使用憑證登入儀表板並從儀表板展開應用程式部分並向下捲動至用戶端憑證部分以查看用戶端 ID 和用戶端金鑰詳細資訊。
現在下一步是產生 JSON Web Token (JWT),以便可以透過命令提示字元存取 API。
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
一旦我們有了 JWT 令牌,請在命令列終端中執行以下 cURL 命令。
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
使用 Java 將掃描的 PDF 轉換為可搜尋的版本
為了方便我們的 Java 程式設計師,我們創建了 Aspose.PDF Cloud 的包裝器,以便可以透過 Java 程式碼輕鬆存取 Cloud API 的所有功能。類似地,為了對掃描的PDF執行OCR操作,我們需要使用Aspose.PDF Cloud SDK for Java。
因此第一步是在系統上安裝 SKD。可以透過 Maven 和 GitHub 下載 Cloud SDK。現在在您的 pom.xml 檔案中添加以下詳細信息,以便在您的 Maven 建置專案中下載並使用 Aspose.Pdf.jar。
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.1.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
欲了解更多信息,請訪問如何安裝 Aspose.Cloud SDKs。
以下步驟定義了對影像 PDF 檔案進行 COR 操作的流程。
- 第一步是建立一個 PdfApi 對象,同時傳遞 ClientID 和客戶端機密詳細資訊(可在 Aspose.Cloud 儀表板 上找到)。
- 建立一個檔案實例並將圖像檔案的位置作為參數傳遞。
- 呼叫 uploadFile(…) 方法並傳遞 PDF 文件和 File 實例作為參數。
- 下一步是建立一個字串實例並將其值設定為原始檔案包含的語言代碼,即“rus,eng”。
- 最後,呼叫 PdfApi 的 putSearchableDocument(…) 方法並傳遞輸入的 PDF 檔案名稱和語言代碼作為參數。
OCR 引擎的語言。支援的值:eng、ara、bel、ben、bul、ces、dan、deu、ell、fin、fra、heb、hin、ind、isl、ita、jpn、kor、nld、nor、pol、por、ron、rus、spa、swe、tha、tur、ukr、vie、chisim、chitra 或它們的組合,例如 eng、rus。
// 從 https://dashboard.aspose.cloud/ 取得 ClientID 和 ClientSecret
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
// createPdfApi 實例
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// 輸入PDF文檔
String name = "ocrscan.pdf";
// 從本機系統載入文件
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// 將文件上傳至雲端存儲
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// 圖像檔案中使用的語言
String lang = "rus,eng";
// 對影像 PDF 文件執行 OCR
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());

圖 1:- OCR 輸出預覽。
上述範例中使用的範例 PDF 檔案可以從以下連結下載:
結論
在本文中,我們學習瞭如何執行線上 PDF OCR 操作並將掃描的 PDF 文件轉換為可搜尋的 PDF 文件的一些簡單步驟。除了OCR操作之外,SDK還非常強大,可以執行各種其他操作。如欲了解更多詳情,請造訪Aspose.PDF Cloud Features。