Зображення PDF у PDF із можливістю пошуку

Перетворюйте зображення PDF у PDF із можливістю пошуку

У сучасному світі, що керується даними, PDF стали незамінним форматом для зберігання та обміну документами. Однак не всі PDF-файли можна легко шукати або редагувати, особливо ті, які базуються на зображеннях. Під час роботи з документами дуже важко скопіювати/витягнути будь-яку текстову інформацію для подальших маніпуляцій. На щастя, завдяки потужності технології оптичного розпізнавання символів (OCR) ви можете легко конвертувати PDF-файли зображень у PDF-файли з можливістю пошуку. У цьому технічному блозі ми розглянемо, як конвертувати OCR PDF у PDF із можливістю пошуку за допомогою різних методів, зосередивши особливу увагу на REST API. Ми також обговоримо, як витягти текст із OCR PDF-файлів, даючи вам повне розуміння того, як використовувати технологію OCR, щоб розкрити весь потенціал ваших PDF-документів.

OCR PDF за допомогою Java SDK

Aspose.PDF Cloud SDK для Java — це потужний хмарний API, який пропонує широкий спектр функцій і можливостей для роботи з документами PDF. Однією з його ключових функцій є можливість розпізнавання PDF-файлів, що може значно спростити процес вилучення тексту з PDF-файлів із зображеннями та створення PDF-файлів із можливістю пошуку. Завдяки зручному інтерфейсу та вичерпній документації цей SDK дозволяє легко автоматизувати процес розпізнавання PDF-файлів, заощаджуючи час і підвищуючи продуктивність.

Крім того, цей хмарний API розроблено для обробки широкого спектру форматів введення та може навіть розпізнавати рукописний текст, що робить його чудовим вибором для компаній і розробників, які прагнуть оптимізувати робочий процес із документами. Тепер першим кроком буде додати його посилання в проект Java, додавши наступні деталі в pom.xml проекту збірки maven.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

Якщо у вас немає облікового запису, вам потрібно створити безкоштовний обліковий запис у Aspose Cloud. Увійдіть за допомогою щойно створеного облікового запису та знайдіть/створіть ідентифікатор клієнта та секрет клієнта на Cloud Dashboard. Ці деталі є обов’язковими в наступних розділах.

Відсканований PDF-файл у формат PDF із можливістю пошуку за допомогою Java

У цьому розділі пояснюється, як перетворити відсканований PDF-файл у PDF-файл із можливістю пошуку за допомогою фрагмента коду Java. Зверніть увагу, що Java Cloud SDK підтримує розпізнавання таких мов: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra або їх комбінація, наприклад eng,rus.

  • Спочатку нам потрібно створити об’єкт PdfApi, де ми передаємо ClientID і Client Secret як аргументи
  • По-друге, створіть екземпляр класу File для завантаження зображення PDF
  • По-третє, викличте метод uploadFile(…), щоб завантажити вхідний PDF у хмарне сховище
  • Оскільки наш PDF-файл із зображенням містить англійський текст, тому нам потрібно створити рядковий об’єкт зі значенням «eng»
  • Нарешті, викличте метод putSearchableDocument(…), для якого в якості аргументів потрібен вхідний PDF і код мови.

Після успішного виконання коду PDF-файл з можливістю пошуку зберігається в хмарному сховищі

try
    {
    // Отримайте ClientID і ClientSecret з https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // екземпляр createPdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);
	    				
    // вхідне зображення документ PDF
    String name = "ScannedPDF.pdf";	        
	    			    
    // Завантажте файл з локальної системи
    File file = new File(name);
    // завантажити файл у хмарне сховище
    FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
	    				
    // мови, які використовуються в зображенні PDF
    String lang = "eng";
	    				
    //  виконайте оптичне розпізнавання PDF-документа зображення
    AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
	    
    // повідомлення про успішний друк
    System.out.println("OCR PDF successfull !");
    }catch(Exception ex)
    {
        System.out.println(ex.getMessage());
    }
Зображення PDF у PDF із можливістю пошуку

Image1: - Попередній перегляд PDF із можливістю пошуку

Відсканований PDF-файл, використаний у наведеному вище прикладі, можна завантажити з BusinessReport.pdf, а отриманий PDF-файл із можливістю пошуку з Converted.pdf

OCR онлайн за допомогою команд cURL

Команди cURL є одним із зручних підходів для виклику REST API. Тому в цьому розділі ми збираємося використовувати команди cURL для OCR онлайн. Тепер, як передумова, нам потрібно спочатку згенерувати маркер доступу JWT (на основі облікових даних клієнта) під час виконання наступної команди.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

Коли у нас буде маркер JWT, виконайте наступну команду, щоб виконати оптичне розпізнавання тексту в Інтернеті та перетворити зображення PDF у PDF-документ із можливістю пошуку. Потім отриманий файл зберігається в хмарному сховищі.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

Висновок

Виконання OCR у PDF-файлах є критично важливим процесом для розкриття повного потенціалу цих документів. За допомогою хмарних інструментів OCR, таких як Aspose.PDF Cloud SDK для Java, цей процес можна спростити й автоматизувати, заощаджуючи час і підвищуючи продуктивність. Використовуючи потужність OCR, компанії та розробники можуть перетворювати PDF-файли на основі зображень у PDF-файли з можливістю пошуку, полегшуючи їх пошук, редагування та спільний доступ. Зрозуміло, що цей API пропонує низку потужних функцій і можливостей для роботи з PDF-файлами. Дотримуючись покрокових інструкцій, наданих у цьому технічному блозі, ви зможете розпочати роботу з оптичним розпізнаванням символів у PDF-файлах і вивести процес роботи з документами на новий рівень.

Ви можете отримати доступ до API у веб-браузері за допомогою інтерфейсу swagger. Крім того, оскільки наші SDK створено за ліцензією MIT, повний вихідний код можна завантажити з GitHub. Якщо у вас виникнуть проблеми під час використання API, будь ласка, зв’яжіться з нами через безкоштовний форум підтримки продуктів.

Схожі статті

Ми наполегливо рекомендуємо відвідати такі посилання, щоб дізнатися більше про: