No mundo orientado a dados de hoje, os PDFs tornaram-se um formato indispensável para armazenar e compartilhar documentos. No entanto, nem todos os PDFs são facilmente pesquisáveis ou editáveis, especialmente aqueles baseados em imagens. Ao lidar com documentos, é realmente difícil copiar/extrair qualquer informação textual para posterior manipulação. Felizmente, com o poder da tecnologia de reconhecimento óptico de caracteres (OCR), você pode converter PDFs de imagem em PDFs pesquisáveis com facilidade. Neste blog técnico, exploraremos como converter PDF OCR em PDF pesquisável usando várias técnicas, com foco específico na API REST. Também discutiremos como extrair texto de PDFs OCR, dando a você uma compreensão abrangente de como aproveitar a tecnologia OCR para liberar todo o potencial de seus documentos PDF.
- OCR PDF usando Java SDK
- PDF digitalizado para PDF pesquisável usando Java
- OCR on-line usando comandos cURL
OCR PDF usando Java SDK
Aspose.PDF Cloud SDK for Java é uma poderosa API baseada em nuvem que oferece uma ampla variedade de recursos e capacidades para trabalhar com documentos PDF. Uma de suas principais funcionalidades é a capacidade de realizar OCR em PDFs, o que pode simplificar bastante o processo de extração de texto de PDFs baseados em imagem e criação de PDFs pesquisáveis. Com sua interface amigável e documentação abrangente, este SDK facilita a automatização do processo de execução de OCR em PDFs, economizando tempo e aumentando a produtividade.
Além disso, esta API baseada em nuvem foi projetada para lidar com uma ampla variedade de formatos de entrada e pode até mesmo reconhecer texto manuscrito, tornando-a uma excelente opção para empresas e desenvolvedores que buscam otimizar o fluxo de trabalho de seus documentos. Agora, a primeira etapa é adicionar sua referência no projeto Java, adicionando os seguintes detalhes no pom.xml do projeto de construção maven.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>http://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
Se você não tiver uma conta existente, precisará criar uma conta gratuita no Aspose Cloud. Faça login usando a conta recém-criada e procure/crie ID do cliente e Segredo do cliente em Cloud Dashboard. Esses detalhes são necessários nas seções subsequentes.
PDF digitalizado para PDF pesquisável usando Java
Esta seção explica os detalhes sobre como converter PDF digitalizado em PDF pesquisável usando o trecho de código Java. Observe que o Java Cloud SDK suporta o reconhecimento dos seguintes idiomas: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld , nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra ou sua combinação, por exemplo, eng,rus.
- Primeiro precisamos criar um objeto de PdfApi, onde passamos o ClientID e os detalhes do segredo do cliente como argumentos
- Em segundo lugar, crie uma instância da classe File para carregar o PDF da imagem
- Em terceiro lugar, chame o método uploadFile(…) para carregar o PDF de entrada para o armazenamento em nuvem
- Como nossa imagem PDF contém texto em inglês, precisamos criar um objeto string contendo um valor “eng”
- Finalmente, chame o método putSearchableDocument(…), que requer um PDF de entrada e um código de idioma como argumentos.
Depois que o código é executado com sucesso, o PDF pesquisável é armazenado na nuvem
try
{
// Obtenha ClientID e ClientSecret em https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// instância createPdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// imagem de entrada documento PDF
String name = "ScannedPDF.pdf";
// Carregar o arquivo do sistema local
File file = new File(name);
// fazer upload do arquivo para armazenamento em nuvem
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// os idiomas usados na imagem PDF
String lang = "eng";
// execute o OCR no documento PDF da imagem
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
// imprimir mensagem de sucesso
System.out.println("OCR PDF successfull !");
}catch(Exception ex)
{
System.out.println(ex.getMessage());
}
O PDF digitalizado usado no exemplo acima pode ser baixado de BusinessReport.pdf e o PDF pesquisável resultante de Converted.pdf
OCR on-line usando comandos cURL
Os comandos cURL são uma das abordagens convenientes para chamar as APIs REST. Portanto, nesta seção, usaremos os comandos cURL para OCR online. Agora, como pré-requisito, precisamos primeiro gerar um token de acesso JWT (com base nas credenciais do cliente) ao executar o seguinte comando.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Assim que tivermos o token JWT, execute o seguinte comando para executar o OCR online e converter o PDF de imagem em um documento PDF pesquisável. O arquivo resultante é armazenado em armazenamento em nuvem.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Resultant.docx?format=TIFF&outPath=converted.tiff" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Conclusão
Executar o OCR em PDFs é um processo crítico para liberar todo o potencial desses documentos. Com a ajuda de ferramentas de OCR baseadas em nuvem, como Aspose.PDF Cloud SDK para Java, esse processo pode ser simplificado e automatizado, economizando tempo e aumentando a produtividade. Aproveitando o poder do OCR, empresas e desenvolvedores podem transformar PDFs baseados em imagens em PDFs pesquisáveis, tornando-os mais fáceis de pesquisar, editar e compartilhar. É claro que esta API oferece uma variedade de recursos e capacidades poderosas para trabalhar com PDFs. Seguindo os guias passo a passo fornecidos neste blog técnico, você pode começar a usar o OCR em PDFs e levar seu fluxo de trabalho de documentos para o próximo nível.
Você pode considerar acessar a API em um navegador da Web usando a interface elegante. Além disso, como nossos SDKs são construídos sob uma licença MIT, o código-fonte completo pode ser baixado do GitHub. Caso encontre algum problema ao usar a API, sinta-se à vontade para nos contatar através do fórum de suporte gratuito ao produto.
Artigos relacionados
É altamente recomendável visitar os links a seguir para saber mais sobre: