
Hình ảnh là một trong những thành phần không thể thiếu để chia sẻ dữ liệu và một số ứng dụng trực tiếp hiển thị nội dung nguồn ở định dạng PDF. Nhưng sự tiện lợi này làm tăng chi phí khi chúng ta phải tìm kiếm một số nội dung nhất định bên trong tài liệu. Trong trường hợp đó, người ta phải xem toàn bộ tài liệu theo cách thủ công để tìm thông tin có liên quan. Vì vậy, cách tiếp cận được khuyến nghị luôn là tạo các tệp có thể tìm kiếm được và dễ quản lý. Tuy nhiên, nếu bạn đã nhận được các tệp PDF mà bạn không thể kiểm soát định dạng của tài liệu tại nguồn, vì vậy để lưu trữ và lập chỉ mục dữ liệu, chúng ta cần chuyển đổi các tài liệu đó sang định dạng có thể tìm kiếm được. Trong bài viết này, chúng ta sẽ thảo luận về chi tiết về cách thực hiện OCR PDF trực tuyến và chuyển đổi các tệp PDF được quét/hình ảnh thành các tài liệu PDF có thể tìm kiếm/văn bản.
API xử lý PDF
Aspose.PDF Cloud là API tạo và thao tác PDF dựa trên kiến trúc REST từng đoạt giải thưởng của chúng tôi. Sử dụng cùng một API, bạn có thể thực hiện nhiều thao tác khác nhau như Chuyển đổi EPUB sang PDF, Chuyển đổi HTML sang PDF, Chuyển đổi XPS sang PDF, Chuyển đổi DOC và Doc X sang PDF, Chuyển đổi XPS sang PDF, chèn hình ảnh vào tệp PDF mới hoặc hiện có, v.v. Tất cả các thao tác này đều được thực hiện trên đám mây và do đó, API có thể được truy cập từ bất kỳ nền tảng nào.
PDF OCR sử dụng lệnh cURL
Các lệnh cURL là một cách dễ dàng để truy cập Aspose.PDF Cloud thông qua thiết bị đầu cuối dòng lệnh. Nhưng trước khi truy cập API, trước tiên bạn cần truy cập Bảng điều khiển Aspose.Cloud và nếu bạn có tài khoản GitHub hoặc Google, chỉ cần Đăng ký. Nếu không, hãy nhấp vào nút Tạo tài khoản mới và cung cấp thông tin bắt buộc. Bây giờ hãy đăng nhập vào bảng điều khiển bằng thông tin xác thực và mở rộng phần Ứng dụng từ bảng điều khiển và cuộn xuống phần Thông tin xác thực của khách hàng để xem thông tin chi tiết về ID khách hàng và Bí mật khách hàng.
Bây giờ, bước tiếp theo là tạo JSON Web Token (JWT) để API có thể truy cập được thông qua dấu nhắc lệnh.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Khi đã có mã thông báo JWT, hãy thực hiện lệnh cURL sau trong terminal dòng lệnh.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Chuyển đổi PDF được quét sang Searchable trong Java
Để tạo điều kiện thuận lợi cho các lập trình viên Java của chúng tôi, một wrapper xung quanh Aspose.PDF Cloud đã được tạo ra để tất cả các tính năng của Cloud API có thể dễ dàng truy cập trong mã Java. Tương tự như vậy, để thực hiện thao tác OCR trên PDF được quét, chúng tôi cần sử dụng Aspose.PDF Cloud SDK cho Java.
Vì vậy, bước đầu tiên là cài đặt SKD trên hệ thống. Cloud SDK có sẵn để tải xuống qua Maven và GitHub. Bây giờ hãy thêm các chi tiết sau vào tệp pom.xml của bạn để tải xuống và sử dụng Aspose.Pdf.jar trong dự án xây dựng Maven của bạn.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.1.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
Để biết thêm thông tin, vui lòng truy cập Cách cài đặt Aspose.Cloud SDK.
Các bước dưới đây xác định quy trình hoạt động COR trên tệp hình ảnh PDF.
- Bước đầu tiên là tạo một đối tượng PdfApi trong khi truyền thông tin chi tiết về ClientID và bí mật của Khách hàng (có tại bảng điều khiển Aspose.Cloud).
- Tạo một thể hiện File và truyền vị trí của tệp hình ảnh làm đối số.
- Gọi phương thức uploadFile(…) và truyền tài liệu PDF và thể hiện File làm đối số.
- Bước tiếp theo là tạo một thể hiện chuỗi và đặt giá trị của nó thành mã ngôn ngữ có trong tệp nguồn, ví dụ như “rus,eng”.
- Cuối cùng, gọi phương thức putSearchableDocument(…) của PdfApi và truyền tên tệp PDF đầu vào và truyền mã ngôn ngữ làm đối số.
ngôn ngữ cho công cụ OCR. Các giá trị được hỗ trợ: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra hoặc tổ hợp của chúng ví dụ như eng,rus.
// Nhận ClientID và ClientSecret từ https://dashboard.aspose.cloud/
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
// thể hiện createPdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// nhập tài liệu PDF
String name = "ocrscan.pdf";
// Tải tập tin từ hệ thống cục bộ
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// tải tập tin lên bộ nhớ đám mây
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// ngôn ngữ được sử dụng trong tập tin hình ảnh
String lang = "rus,eng";
// thực hiện OCR trên hình ảnh tài liệu PDF
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());

Hình ảnh 1:- Xem trước đầu ra OCR.
Các tệp PDF mẫu được sử dụng trong ví dụ trên có thể được tải xuống từ các liên kết sau:
Phần kết luận
Trong bài viết này, chúng ta đã tìm hiểu một số bước đơn giản về cách thực hiện thao tác OCR PDF trực tuyến và chuyển đổi tài liệu PDF đã quét thành tài liệu PDF có thể tìm kiếm. Ngoài các thao tác OCR, SDK khá mạnh mẽ và có thể thực hiện nhiều thao tác khác. Để biết thêm chi tiết, vui lòng truy cập Tính năng của Aspose.PDF Cloud.