PDF OCR

PDF файлове се използват широко в интернет за информация и споделяне на данни. Те са доста популярни, защото поддържат верността на документите при преглед на всяка платформа. Ние обаче нямаме контрол върху източника и някои файлове се споделят в сканиран формат. Понякога заснемате изображение като PDF и по-късно трябва да извлечете съдържанието от файла. Така че жизнеспособно решение е да извършите OCR операция и да извлечете текста. Въпреки това, след OCR операцията, ако трябва да запазите файла, тогава конвертирането в PDF формат е жизнеспособно решение. В тази статия ще обсъдим стъпките за това как да конвертирате сканиран PDF в текстов PDF с помощта на Python.

OCR PDF API

Aspose.PDF Cloud SDK за Python е обвивка около Aspose.PDF Cloud. Той ви позволява да изпълнявате всички възможности за обработка на PDF файлове в приложението Python. Манипулирайте PDF файлове без Adobe Acrobat или друго приложение. Така че, за да използвате SDK, първата стъпка е неговото инсталиране и той е достъпен за изтегляне от PIP и GitHub хранилище. Сега изпълнете следната команда на терминала/командния ред, за да инсталирате най-новата версия на SDK в системата.

 pip install asposepdfcloud

MS Visual Studio

Можете също така директно да добавите препратката във вашия проект на Python в проекта на Visual Studio. Моля, потърсете asposepdfcloud като пакет под прозореца на средата на Python. Моля, следвайте стъпките, номерирани на изображението по-долу, за да завършите процеса на инсталиране.

Aspose.PDF Cloud Python

Изображение 1:- Aspose.PDF Cloud SDK за Python пакет.

Табло за управление на Aspose.Cloud

Тъй като нашите API са достъпни само за упълномощени лица, следващата стъпка е да създадете акаунт на Aspose.Cloud dashboard. Ако имате акаунт в GitHub или Google, просто се регистрирайте или щракнете върху бутона Създаване на нов акаунт и предоставете необходимата информация. Сега влезте в таблото за управление с помощта на идентификационни данни и разгънете раздела „Приложения“ от таблото за управление и превъртете надолу към раздела „Идентификационни данни на клиента“, за да видите подробности за ИД на клиента и тайната на клиента.

Идентификационни данни на клиента

Изображение 2: - Клиентски идентификационни данни на таблото за управление на Aspose.Cloud.

Изображение от PDF към PDF с възможност за търсене в Python

Моля, следвайте стъпките, дадени по-долу, за да извършите OCR операция върху сканиран PDF документ и след това да го запишете като достъпен за търсене (направете pdf файл за търсене). Тези стъпки ни помагат да разработим безплатно онлайн OCR с помощта на Python.

  • Първо, трябва да създадем екземпляр на клас ApiClient, като същевременно предоставим Client ID Client Secret като аргументи
  • Второ, създайте екземпляр на клас PdfApi, който приема обект ApiClient като входен аргумент
  • Сега извикайте метода putsearchabledocument(..) на класа PdfApi, който приема въведено PDF име и незадължителен параметър, указващ езика на OCR двигателя.
def ocrPDF():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # създайте PdfApi екземпляр, докато предавате PdfApiClient като аргумент
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'image-based-pdf-sample.pdf'

        # извикване на API за извършване на OCR операция и запазване на изхода в облачно хранилище
        response = pdf_api.put_searchable_document(name=input_file,lang='eng')

        # отпечатайте съобщение в конзолата (по избор)
        print('Image PDF successfully converted to Text PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
PDF OCR визуализация

Изображение 3: - Визуализация на PDF OCR операция.

В изображението по-горе лявата част обозначава входящия сканиран PDF файл, а частта от дясната страна показва визуализация на резултантния текстов PDF файл. Примерните файлове, използвани в горния пример, могат да бъдат изтеглени от image-based-pdf-sample.pdf и OCR-Result.pdf.

OCR онлайн с помощта на cURL команди

REST API може да бъде достъпен и чрез cURL команди и тъй като нашите облачни API са базирани на REST архитектура, така че можем също да използваме командата cURL за извършване на PDF OCR онлайн. Въпреки това, преди да продължим с операцията по преобразуване, трябва да генерираме JSON уеб токен (JWT) въз основа на вашите индивидуални клиентски идентификационни данни, посочени в таблото за управление на Aspose.Cloud. Това е задължително, тъй като нашите API са достъпни само за регистрирани потребители. Моля, изпълнете следната команда, за да генерирате JWT токена.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

След като имаме JWT токена, моля, изпълнете следната команда, за да извършите OCR операцията и да запазите изхода в същото облачно хранилище.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/image-based-pdf-sample.pdf/ocr" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

Заключение

В тази статия обсъдихме стъпките за Image PDF към PDF с възможност за търсене с помощта на кодов фрагмент на Python. Също така проучихме подробностите за това как да извършваме OCR онлайн с помощта на командите cURL. Тъй като нашите облачни SDK са разработени под лиценз на MIT, можете да изтеглите пълния кодов фрагмент от GitHub и да го актуализирате според вашите изисквания. Горещо ви препоръчваме да разгледате Ръководството за разработчици, за да научите повече за други вълнуващи функции, които в момента се предлагат от Cloud API.

В случай, че имате някакви свързани запитвания или срещнете някакви проблеми, докато използвате нашите API, не се колебайте да се свържете с нас чрез безплатния форум за поддръжка на клиенти.

Свързани статии

Също така предлагаме да прегледате следните статии, за да научите повече за