
Зображення є одним із невід’ємних компонентів обміну даними, і деякі програми безпосередньо відтворюють вихідний вміст у форматі PDF. Але ця зручність збільшує вартість, коли нам доводиться шукати певний вміст у документі. У такому випадку потрібно вручну переглянути весь документ, щоб знайти відповідну інформацію. Тому рекомендованим підходом завжди є створення файлів, доступних для пошуку та легких у керуванні. Однак, якщо ви отримали файли PDF, у яких ви не можете контролювати формат документів у джерелі, тож для архівування та індексування даних нам потрібно перетворити такі документи у формат, доступний для пошуку. У цій статті ми збираємося обговорити деталі того, як виконати оптичне розпізнавання символів у PDF-файлах онлайн і перетворити відскановані PDF-файли/файли зображень у PDF-документи з можливістю пошуку/текстові PDF-документи.
- API обробки PDF
- PDF OCR за допомогою команди cURL
- Перетворіть відсканований PDF-файл у доступний для пошуку в Java
API обробки PDF
Aspose.PDF Cloud — це наш відзначений нагородами API для створення та обробки PDF-файлів на основі архітектури REST. Використовуючи той самий API, ви можете виконувати різноманітні операції, як-от Конвертувати EPUB у PDF, Конвертувати HTML у PDF, Конвертувати XPS до PDF, Конвертувати DOC і Doc X у PDF, Конвертувати XPS до PDF, вставляти зображення в нові чи наявні PDF-файли тощо. Усі ці операції виконуються в хмарі, тому до API можна отримати доступ із будь-якої платформи.
PDF OCR за допомогою команди cURL
Команди cURL — це простий спосіб отримати доступ до Aspose.PDF Cloud через термінал командного рядка. Але перш ніж отримати доступ до API, вам потрібно спочатку відвідати інформаційну панель Aspose.Cloud і, якщо у вас є обліковий запис GitHub або Google, просто зареєструватися. В іншому випадку натисніть кнопку Створити новий обліковий запис і надайте необхідну інформацію. Тепер увійдіть на інформаційну панель, використовуючи облікові дані, розгорніть розділ «Програми» на інформаційній панелі та прокрутіть униз до розділу «Облікові дані клієнта», щоб переглянути дані про ідентифікатор клієнта та секрет клієнта.
Тепер наступним кроком є створення JSON Web Token (JWT), щоб API були доступні через командний рядок.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Отримавши маркер JWT, виконайте наступну команду cURL у терміналі командного рядка.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Перетворіть відсканований PDF-файл у доступний для пошуку в Java
Щоб полегшити роботу наших Java-програмістів, було створено оболонку Aspose.PDF Cloud, щоб усі функції Cloud API можна було легко отримати в коді Java. Подібним чином, щоб виконати операцію OCR на відсканованому PDF-файлі, нам потрібно використовувати Aspose.PDF Cloud SDK для Java.
Отже, першим кроком є встановлення SKD у систему. Cloud SDK доступний для завантаження через Maven і GitHub. Тепер додайте наступні відомості у свій файл pom.xml, щоб завантажити та використовувати Aspose.Pdf.jar у вашому проекті збірки Maven.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.1.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
Для отримання додаткової інформації відвідайте сторінку Як інсталювати Aspose.Cloud SDKs.
Наведені нижче кроки визначають процес роботи COR над PDF-файлом зображення.
- Першим кроком є створення об’єкта PdfApi, передаючи ідентифікатор клієнта та секретні дані клієнта (доступні на інформаційній панелі Aspose.Cloud).
- Створіть екземпляр File і передайте розташування файлу зображення як аргумент.
- Викличте метод uploadFile(…) і передайте PDF-документ і екземпляр File як аргументи.
- Наступним кроком є створення екземпляра рядка та встановлення його значення коду мови, який містить вихідний файл, тобто «rus,eng».
- Нарешті, викличте метод putSearchableDocument(…) PdfApi та передайте ім’я вхідного PDF-файлу та код мови як аргументи.
мови для двигуна OCR. підтримувані значення: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra або їх комбінація, наприклад eng, rus.
// Отримайте ClientID і ClientSecret з https://dashboard.aspose.cloud/
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
// екземпляр createPdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// вхідний документ PDF
String name = "ocrscan.pdf";
// Завантажте файл з локальної системи
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// завантажити файл у хмарне сховище
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// мови, які використовуються у файлі зображення
String lang = "rus,eng";
// виконайте оптичне розпізнавання PDF-документа зображення
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());

Зображення 1: - Попередній перегляд вихідних даних OCR.
Зразки PDF-файлів, використаних у наведеному вище прикладі, можна завантажити за такими посиланнями:
Висновок
У цій статті ми ознайомилися з деякими простими кроками, як виконати онлайн-операцію оптичного розпізнавання символів PDF і перетворити відсканований PDF-документ на PDF-документ із можливістю пошуку. Окрім операцій OCR, SDK є досить потужним і може виконувати низку інших операцій. Для отримання додаткової інформації відвідайте Aspose.PDF Cloud Features.