PDF файлове се използват широко в интернет за информация и споделяне на данни. Те са доста популярни, защото поддържат верността на документите при преглед на всяка платформа. Ние обаче нямаме контрол върху източника и някои файлове се споделят в сканиран формат. Понякога заснемате изображение като PDF и по-късно трябва да извлечете съдържанието от файла. Така че жизнеспособно решение е да извършите OCR операция и да извлечете текста. Въпреки това, след OCR операцията, ако трябва да запазите файла, тогава конвертирането в PDF формат е жизнеспособно решение. В тази статия ще обсъдим стъпките за това как да конвертирате сканиран PDF в текстов PDF с помощта на Python.
- OCR PDF API
- Изображение от PDF към PDF с възможност за търсене в Python
- OCR онлайн с помощта на cURL команди
OCR PDF API
Aspose.PDF Cloud SDK за Python е обвивка около Aspose.PDF Cloud. Той ви позволява да изпълнявате всички възможности за обработка на PDF файлове в приложението Python. Манипулирайте PDF файлове без Adobe Acrobat или друго приложение. Така че, за да използвате SDK, първата стъпка е неговото инсталиране и той е достъпен за изтегляне от PIP и GitHub хранилище. Сега изпълнете следната команда на терминала/командния ред, за да инсталирате най-новата версия на SDK в системата.
pip install asposepdfcloud
MS Visual Studio
Можете също така директно да добавите препратката във вашия проект на Python в проекта на Visual Studio. Моля, потърсете asposepdfcloud като пакет под прозореца на средата на Python. Моля, следвайте стъпките, номерирани на изображението по-долу, за да завършите процеса на инсталиране.
Табло за управление на Aspose.Cloud
Тъй като нашите API са достъпни само за упълномощени лица, следващата стъпка е да създадете акаунт на Aspose.Cloud dashboard. Ако имате акаунт в GitHub или Google, просто се регистрирайте или щракнете върху бутона Създаване на нов акаунт и предоставете необходимата информация. Сега влезте в таблото за управление с помощта на идентификационни данни и разгънете раздела „Приложения“ от таблото за управление и превъртете надолу към раздела „Идентификационни данни на клиента“, за да видите подробности за ИД на клиента и тайната на клиента.
Изображение от PDF към PDF с възможност за търсене в Python
Моля, следвайте стъпките, дадени по-долу, за да извършите OCR операция върху сканиран PDF документ и след това да го запишете като достъпен за търсене (направете pdf файл за търсене). Тези стъпки ни помагат да разработим безплатно онлайн OCR с помощта на Python.
- Първо, трябва да създадем екземпляр на клас ApiClient, като същевременно предоставим Client ID Client Secret като аргументи
- Второ, създайте екземпляр на клас PdfApi, който приема обект ApiClient като входен аргумент
- Сега извикайте метода putsearchabledocument(..) на класа PdfApi, който приема въведено PDF име и незадължителен параметър, указващ езика на OCR двигателя.
def ocrPDF():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# създайте PdfApi екземпляр, докато предавате PdfApiClient като аргумент
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'image-based-pdf-sample.pdf'
# извикване на API за извършване на OCR операция и запазване на изхода в облачно хранилище
response = pdf_api.put_searchable_document(name=input_file,lang='eng')
# отпечатайте съобщение в конзолата (по избор)
print('Image PDF successfully converted to Text PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
В изображението по-горе лявата част обозначава входящия сканиран PDF файл, а частта от дясната страна показва визуализация на резултантния текстов PDF файл. Примерните файлове, използвани в горния пример, могат да бъдат изтеглени от image-based-pdf-sample.pdf и OCR-Result.pdf.
OCR онлайн с помощта на cURL команди
REST API може да бъде достъпен и чрез cURL команди и тъй като нашите облачни API са базирани на REST архитектура, така че можем също да използваме командата cURL за извършване на PDF OCR онлайн. Въпреки това, преди да продължим с операцията по преобразуване, трябва да генерираме JSON уеб токен (JWT) въз основа на вашите индивидуални клиентски идентификационни данни, посочени в таблото за управление на Aspose.Cloud. Това е задължително, тъй като нашите API са достъпни само за регистрирани потребители. Моля, изпълнете следната команда, за да генерирате JWT токена.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
След като имаме JWT токена, моля, изпълнете следната команда, за да извършите OCR операцията и да запазите изхода в същото облачно хранилище.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/image-based-pdf-sample.pdf/ocr" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
Заключение
В тази статия обсъдихме стъпките за Image PDF към PDF с възможност за търсене с помощта на кодов фрагмент на Python. Също така проучихме подробностите за това как да извършваме OCR онлайн с помощта на командите cURL. Тъй като нашите облачни SDK са разработени под лиценз на MIT, можете да изтеглите пълния кодов фрагмент от GitHub и да го актуализирате според вашите изисквания. Горещо ви препоръчваме да разгледате Ръководството за разработчици, за да научите повече за други вълнуващи функции, които в момента се предлагат от Cloud API.
В случай, че имате някакви свързани запитвания или срещнете някакви проблеми, докато използвате нашите API, не се колебайте да се свържете с нас чрез безплатния форум за поддръжка на клиенти.
Свързани статии
Също така предлагаме да прегледате следните статии, за да научите повече за