Trong thế giới dựa trên dữ liệu ngày nay, PDF đã trở thành một định dạng không thể thiếu để lưu trữ và chia sẻ tài liệu. Tuy nhiên, không phải tất cả các tệp PDF đều có thể tìm kiếm hoặc chỉnh sửa dễ dàng, đặc biệt là những tệp dựa trên hình ảnh. Khi xử lý các tài liệu, thật khó để sao chép/trích xuất bất kỳ thông tin văn bản nào để thao tác thêm. May mắn thay, với sức mạnh của công nghệ Nhận dạng Ký tự Quang học (OCR), bạn có thể chuyển đổi các tệp PDF hình ảnh thành các tệp PDF có thể tìm kiếm một cách dễ dàng. Trong blog kỹ thuật này, chúng ta sẽ khám phá cách chuyển đổi PDF OCR thành PDF có thể tìm kiếm bằng nhiều kỹ thuật khác nhau, với trọng tâm cụ thể là API REST. Chúng tôi cũng sẽ thảo luận về cách trích xuất văn bản từ các tệp PDF OCR, giúp bạn hiểu toàn diện về cách tận dụng công nghệ OCR để khai thác toàn bộ tiềm năng của tài liệu PDF của bạn.
- OCR PDF sử dụng Java SDK
- Đã quét PDF thành PDF có thể tìm kiếm bằng Java
- OCR trực tuyến bằng các lệnh cURL
OCR PDF sử dụng Java SDK
Aspose.PDF Cloud SDK for Java là một API dựa trên đám mây mạnh mẽ cung cấp nhiều tính năng và khả năng để làm việc với các tài liệu PDF. Một trong những chức năng chính của nó là khả năng thực hiện OCR trên các tệp PDF, có thể đơn giản hóa rất nhiều quá trình trích xuất văn bản từ các tệp PDF dựa trên hình ảnh và tạo các tệp PDF có thể tìm kiếm. Với giao diện thân thiện với người dùng và tài liệu toàn diện, SDK này giúp dễ dàng tự động hóa quy trình thực hiện OCR trên PDF, tiết kiệm thời gian và tăng năng suất.
Hơn nữa, API dựa trên đám mây này được thiết kế để xử lý nhiều định dạng đầu vào và thậm chí có thể nhận dạng văn bản viết tay, làm cho nó trở thành lựa chọn tuyệt vời cho các doanh nghiệp và nhà phát triển muốn hợp lý hóa quy trình làm việc tài liệu của họ. Bây giờ, bước đầu tiên là thêm tham chiếu của nó vào dự án Java bằng cách thêm các chi tiết sau vào tệp pom.xml của dự án xây dựng maven.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Nếu chưa có tài khoản, bạn cần tạo một tài khoản miễn phí trên Aspose Cloud. Đăng nhập bằng tài khoản mới tạo và tra cứu/tạo Client ID và Client Secret tại Cloud Dashboard. Những chi tiết này được yêu cầu trong các phần tiếp theo.
Đã quét PDF thành PDF có thể tìm kiếm bằng Java
Phần này giải thích chi tiết về cách chuyển đổi PDF được quét thành PDF có thể tìm kiếm bằng cách sử dụng đoạn mã Java. Xin lưu ý rằng Java Cloud SDK hỗ trợ nhận dạng các ngôn ngữ sau: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra hoặc sự kết hợp của chúng, ví dụ như eng,rus.
- Trước tiên, chúng ta cần tạo một đối tượng của PdfApi, nơi chúng ta chuyển các chi tiết bí mật của ClientID và Client làm đối số
- Thứ hai, tạo một thể hiện của lớp File để tải Image PDF
- Thứ ba, gọi phương thức uploadFile(…) để tải tệp PDF đầu vào lên bộ nhớ đám mây
- Vì PDF hình ảnh của chúng tôi chứa văn bản tiếng Anh, vì vậy chúng tôi cần tạo một đối tượng chuỗi chứa giá trị “eng”
- Cuối cùng, gọi phương thức putSearchableDocument(…), phương thức này yêu cầu tệp PDF đầu vào và mã ngôn ngữ làm đối số.
Sau khi mã được thực thi thành công, tệp PDF có thể tìm kiếm được lưu trữ trong bộ lưu trữ đám mây
try
{
// Nhận ClientID và ClientSecret từ https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// dụ tạoPdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// hình ảnh đầu vào tài liệu PDF
String name = "ScannedPDF.pdf";
// Tải tệp từ hệ thống cục bộ
File file = new File(name);
// tải tệp lên bộ nhớ đám mây
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// các ngôn ngữ được sử dụng trong hình ảnh PDF
String lang = "eng";
// thực hiện OCR trên tài liệu PDF hình ảnh
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// in thông báo thành công
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
Có thể tải xuống tệp PDF được quét được sử dụng trong ví dụ trên từ BusinessReport.pdf và tệp PDF có thể tìm kiếm kết quả từ Converted.pdf
OCR trực tuyến bằng các lệnh cURL
Các lệnh cURL là một trong những cách tiếp cận thuận tiện để gọi các API REST. Vì vậy, trong phần này, chúng ta sẽ sử dụng các lệnh cURL cho OCR trực tuyến. Bây giờ, như một điều kiện tiên quyết, trước tiên chúng ta cần tạo mã thông báo truy cập JWT (dựa trên thông tin đăng nhập của khách hàng) trong khi thực hiện lệnh sau.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Khi chúng tôi có mã thông báo JWT, vui lòng thực hiện lệnh sau để thực hiện OCR trực tuyến và chuyển đổi Image PDF thành tài liệu PDF có thể tìm kiếm. Tệp kết quả sau đó được lưu trữ trong bộ nhớ đám mây.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Phần kết luận
Thực hiện OCR trên các tệp PDF là một quy trình quan trọng để mở khóa toàn bộ tiềm năng của các tài liệu này. Với sự trợ giúp của các công cụ OCR dựa trên đám mây như Aspose.PDF Cloud SDK dành cho Java, quy trình này có thể được đơn giản hóa và tự động hóa, tiết kiệm thời gian và tăng năng suất. Bằng cách tận dụng sức mạnh của OCR, các doanh nghiệp và nhà phát triển có thể chuyển đổi các tệp PDF dựa trên hình ảnh thành các tệp PDF có thể tìm kiếm, giúp chúng dễ dàng tìm kiếm, chỉnh sửa và chia sẻ hơn. Rõ ràng là API này cung cấp một loạt các tính năng và khả năng mạnh mẽ để làm việc với các tệp PDF. Bằng cách làm theo hướng dẫn từng bước được cung cấp trong blog kỹ thuật này, bạn có thể bắt đầu với OCR trên PDF và đưa quy trình xử lý tài liệu của bạn lên một tầm cao mới.
Bạn có thể xem xét việc truy cập API trong trình duyệt web bằng giao diện vênh vang. Hơn nữa, vì SDK của chúng tôi được xây dựng theo giấy phép MIT, nên bạn có thể tải xuống toàn bộ mã nguồn từ GitHub. Trong trường hợp bạn gặp phải bất kỳ sự cố nào khi sử dụng API, vui lòng liên hệ với chúng tôi qua diễn đàn hỗ trợ sản phẩm miễn phí.
Những bài viết liên quan
Chúng tôi thực sự khuyên bạn nên truy cập các liên kết sau để tìm hiểu thêm về: