검색 가능한 스캔된 PDF

이미지는 데이터 공유를 위한 필수 구성 요소 중 하나이며 일부 애플리케이션은 PDF 형식으로 원본 콘텐츠를 직접 렌더링합니다. 그러나 이러한 편의성은 문서 내에서 특정 콘텐츠를 검색해야 할 때 비용을 증가시킵니다. 그러한 시나리오에서는 관련 정보를 찾기 위해 전체 문서를 수동으로 살펴봐야 합니다. 따라서 권장되는 접근 방식은 항상 검색 가능하고 관리하기 쉬운 파일을 생성하는 것입니다. 그러나 원본에서 문서 형식을 제어할 수 없는 PDF 파일을 받은 경우 데이터 보관 및 인덱싱을 위해 이러한 문서를 검색 가능한 형식으로 변환해야 합니다. 이 문서에서는 온라인 PDF OCR을 수행하고 스캔/이미지 PDF 파일을 검색 가능한/텍스트 PDF 문서로 변환하는 방법에 대한 세부 정보를 설명합니다.

PDF 처리 API

Aspose.PDF Cloud는 수상 경력에 빛나는 REST 아키텍처 기반 PDF 생성 및 조작 API입니다. 동일한 API를 사용하면 EPUB를 PDF로 변환, HTML을 PDF로 변환, XPS를 PDF로 변환, DOC 및 Doc X를 PDF로 변환, XPS를 PDF로 변환, 새 PDF 파일이나 기존 PDF 파일에 이미지 삽입 등 다양한 작업을 수행할 수 있습니다. 이러한 모든 작업은 클라우드에서 수행되므로 모든 플랫폼에서 API에 액세스할 수 있습니다.

cURL 명령을 사용한 PDF OCR

cURL 명령은 명령줄 터미널을 통해 Aspose.PDF Cloud에 액세스하는 쉬운 방법입니다. 하지만 API에 액세스하기 전에 먼저 Aspose.Cloud 대시보드를 방문해야 하며 GitHub 또는 Google 계정이 있는 경우 간단히 가입하세요. 그렇지 않은 경우 새 계정 만들기 버튼을 클릭하고 필요한 정보를 제공하세요. 이제 자격 증명을 사용하여 대시보드에 로그인하고 대시보드에서 애플리케이션 섹션을 확장하고 클라이언트 자격 증명 섹션으로 스크롤하여 클라이언트 ID 및 클라이언트 비밀 세부 정보를 확인하세요.

다음 단계는 명령 프롬프트를 통해 API에 접근할 수 있도록 JSON 웹 토큰(JWT)을 생성하는 것입니다.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

JWT 토큰을 받으면 명령줄 터미널에서 다음 cURL 명령을 실행하세요.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

스캔한 PDF를 Java에서 검색 가능한 PDF로 변환

Java 프로그래머의 편의를 위해 Aspose.PDF Cloud를 둘러싼 래퍼가 생성되어 Cloud API의 모든 기능을 Java 코드에서 쉽게 액세스할 수 있습니다. 마찬가지로 스캔된 PDF에서 OCR 작업을 수행하려면 Aspose.PDF Cloud SDK for Java를 사용해야 합니다.

따라서 첫 번째 단계는 시스템에 SKD를 설치하는 것입니다. Cloud SDK는 MavenGitHub에서 다운로드할 수 있습니다. 이제 pom.xml 파일에 다음 세부 정보를 추가하여 Maven 빌드 프로젝트에서 Aspose.Pdf.jar를 다운로드하고 사용합니다.

<repositories>
 <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>https://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>
<dependencies>
 <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.1.0</version>
        <scope>compile</scope>
    </dependency>
 </dependencies>

자세한 내용은 Aspose.Cloud SDK 설치 방법을 참조하세요.

아래 단계는 이미지 PDF 파일에 대한 COR 작업 프로세스를 정의합니다.

  • 첫 번째 단계는 ClientID 및 클라이언트 비밀번호 세부 정보(Aspose.Cloud 대시보드에서 사용 가능)를 전달하는 동안 PdfApi 객체를 만드는 것입니다.
  • File 인스턴스를 생성하고 이미지 파일의 위치를 인수로 전달합니다.
  • uploadFile(…) 메서드를 호출하고 PDF 문서와 파일 인스턴스를 인수로 전달합니다.
  • 다음 단계는 문자열 인스턴스를 생성하고 해당 값을 소스 파일에 포함된 언어 코드(예: “rus,eng”)로 설정하는 것입니다.
  • 마지막으로 PdfApi의 putSearchableDocument(…) 메서드를 호출하고 입력 PDF 파일 이름과 언어 코드를 인수로 전달합니다.

OCR 엔진 언어. 지원되는 값: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra 또는 이들의 조합(예: eng, rus).

// https://dashboard.aspose.cloud/에서 ClientID와 ClientSecret을 가져옵니다.
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
				
// createPdfApi 인스턴스
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
				
// PDF 문서 입력
String name = "ocrscan.pdf";	        
			    
// 로컬 시스템에서 파일을 로드합니다
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// 파일을 클라우드 스토리지에 업로드하다
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
				
// 이미지 파일에 사용된 언어
String lang = "rus,eng";
				
//  이미지 PDF 문서에서 OCR 수행
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());
OCR 결과 미리보기

이미지 1: OCR 출력 미리보기.

위의 예에서 사용된 샘플 PDF 파일은 다음 링크에서 다운로드할 수 있습니다.

결론

이 글에서는 온라인 PDF OCR 작업을 수행하고 스캔한 PDF 문서를 검색 가능한 PDF 문서로 변환하는 방법에 대한 몇 가지 간단한 단계를 알아보았습니다. OCR 작업 외에도 SDK는 매우 강력하여 다양한 다른 작업을 수행할 수 있습니다. 자세한 내용은 Aspose.PDF Cloud Features를 방문하세요.