Aspose.OMR Cloud SDK for Java은 개발자가 Java 애플리케이션에서 직접 Optical Mark Recognition (OMR) 기능을 사용할 수 있도록 합니다. 이 가이드는 Java에서 PDFJSON 로 변환하는 방법을 보여주며, 설정, 코드 구현, 성능 튜닝 및 문제 해결을 다룹니다.

PDF를 JSON으로 변환 - 전제 조건 및 설정

시작하기 전에 다음을 확인하십시오:

  • Java Development Kit (JDK) 8 이상이(가) 머신에 설치되어 있어야 합니다.
  • Maven을(를) 사용한 종속성 관리.
  • Aspose Cloud account와 클라이언트 ID 및 클라이언트 시크릿이 필요합니다.

최신 버전을 이 페이지에서 다운로드하십시오.

Maven을 통해 SDK를 설치하십시오:

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-omr-cloud</artifactId>
    <version>23.12</version>
</dependency>

또는 명령줄을 사용하십시오:

mvn install com.aspose:aspose-omr-cloud

Java 프로젝트에 다음 import 문을 추가하십시오:

import com.aspose.omr.cloud.ApiClient;
import com.aspose.omr.cloud.Configuration;
import com.aspose.omr.cloud.api.OMRApi;
import com.aspose.omr.cloud.model.*;

또한 인증을 구성해야 합니다:

Configuration.getDefaultApiClient().setBasePath("https://api.aspose.cloud");
Configuration.getDefaultApiClient().setClientId("YOUR_CLIENT_ID");
Configuration.getDefaultApiClient().setClientSecret("YOUR_CLIENT_SECRET");

Java에서 PDF를 JSON으로 변환

핵심 작업은 PDF 파일을 OMR 서비스에 전송하고 추출된 데이터의 JSON 표현을 받는 것입니다. SDK는 HTTP 호출을 추상화하여 비즈니스 로직에 집중할 수 있게 해줍니다.

Aspose.OMR Cloud SDK for Java의 주요 기능

  • High‑accuracy OMR processing 스캔된 답안지를 위한 고정밀 OMR 처리.
  • Batch processing 다중 PDF에 대한 배치 처리 지원.
  • Direct JSON output 다운스트림 서비스에 적합한 직접 JSON 출력.
  • Built‑in memory optimization 대용량 문서를 위한 내장 메모리 최적화.

PDF를 JSON으로 변환하기 위한 Aspose.OMR Cloud SDK 성능 튜닝

많은 PDF를 변환하거나 매우 큰 파일을 변환할 때는 다음 사항을 고려하십시오:

  • streaming mode를 활성화하여 전체 PDF를 메모리에 로드하는 것을 방지합니다.
  • 무거운 작업 부하에 대비해 JVM heap size (-Xmx2g 이상)를 늘립니다.
  • 파일을 동시에 처리하기 위해 parallel streams를 사용합니다.

Aspose.OMR Cloud SDK를 사용한 대용량 PDF 변환을 위한 메모리 관리

큰 PDF 파일은 OutOfMemoryError를 발생시킬 수 있습니다. 이를 완화하려면:

  • extractPageRange 매개변수를 사용하여 페이지를 청크 단위로 처리합니다.
  • 사용 후 OMRTask 객체를 즉시 해제하십시오.
  • VisualVM과 같은 도구로 메모리 사용량을 모니터링합니다.

PDF를 JSON으로 변환할 때 흔히 발생하는 문제 해결

오류 메시지 가능한 원인 해결 방법
401 Unauthorized 잘못된 클라이언트 자격 증명 클라이언트 ID/시크릿을 확인하고 토큰을 재생성하십시오
InvalidFileFormat 업로드된 파일이 PDF가 아닙니다 파일에 .pdf 확장자가 있고 올바른 MIME 유형인지 확인하십시오
ConversionTimeout 대용량 파일이 기본 제한 시간을 초과했습니다 ApiClient 구성에서 제한 시간을 늘리십시오

Java에서 PDF를 JSON으로 변환하는 단계

  1. OMR 클라이언트 초기화: 구성된 ApiClient를 사용하여 OMRApi 인스턴스를 생성합니다.

    OMRApi omrApi = new OMRApi();
    
  2. PDF 파일 업로드: omrApi.uploadFile을 사용하여 PDF를 클라우드에 전송합니다.
    Documentation: official documentation.
    API reference: API reference.

  3. 변환 작업 생성: 업로드된 파일 ID와 JSON 출력 요청을 사용하여 omrApi.createTask를 호출합니다.

    OMRTaskRequest request = new OMRTaskRequest();
    request.setFileId(uploadedFileId);
    request.setOutputFormat("json");
    OMRTaskResponse task = omrApi.createTask(request);
    
  4. 작업 완료 여부 확인: 상태가 Completed가 될 때까지 omrApi.getTaskStatus(task.getId())를 반복적으로 확인합니다.

    while (!omrApi.getTaskStatus(task.getId()).getStatus().equals("Completed")) {
        Thread.sleep(2000);
    }
    
  5. JSON 결과 다운로드: omrApi.downloadResult(task.getResultFileId())를 사용하여 JSON 파일을 가져옵니다.

    byte[] jsonData = omrApi.downloadResult(task.getResultFileId());
    Files.write(Paths.get("output.json"), jsonData);
    

Java에서 PDF를 JSON으로 변환 - 전체 코드 예제

다음 예제는 로컬 PDF 파일을 JSON 문서로 완전하게 변환하는 과정을 Aspose.OMR Cloud SDK for Java를 사용하여 보여줍니다.

Note: 이 코드 예제는 핵심 기능을 보여줍니다. 프로젝트에서 사용하기 전에 파일 경로(sample.pdf, output.json)를 실제 파일 위치에 맞게 업데이트하고, 모든 필수 종속성이 올바르게 설치되었는지 확인하며, 개발 환경에서 충분히 테스트하십시오. 문제가 발생하면 공식 문서를 참조하거나 지원 팀에 문의하십시오.

cURL을 사용한 REST API를 통한 클라우드 기반 문서 변환

Aspose.OMR Cloud SDK는 cURL을 사용하여 직접 호출할 수 있는 REST API도 제공합니다. 아래는 일반적인 단계입니다.

1. 인증하고 액세스 토큰을 얻으세요

curl -X POST "https://api.aspose.cloud/connect/token" \
     -H "Content-Type: application/x-www-form-urlencoded" \
     -d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET"

2. 소스 PDF 업로드

curl -X POST "https://api.aspose.cloud/v4.0/omr/files" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -F "file=@sample.pdf"

3. 요청 JSON 변환

curl -X POST "https://api.aspose.cloud/v4.0/omr/tasks" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -H "Content-Type: application/json" \
     -d '{"fileId":"UPLOADED_FILE_ID","outputFormat":"json"}'

4. 결과 JSON 파일 다운로드

curl -X GET "https://api.aspose.cloud/v4.0/omr/files/RESULT_FILE_ID/content" \
     -H "Authorization: Bearer YOUR_ACCESS_TOKEN" \
     -o output.json

자세한 내용은 공식 API 문서를 참조하십시오.

결론

Java에서 PDF를 JSON으로 변환하는 작업은 Aspose.OMR Cloud SDK for Java를 사용하면 간단해집니다. 이 라이브러리는 파일 업로드, OMR 처리 및 JSON 생성을 처리하여 개발자가 출력 결과를 애플리케이션에 통합하는 데 집중할 수 있게 합니다. 프로덕션 사용을 위해 적절한 라이선스를 확보해야 함을 기억하세요; 임시 라이선스는 temporary license page에서 얻을 수 있으며, 제품 페이지에서 전체 가격 옵션을 확인할 수 있습니다. SDK가 설치되고 성능 최적화된 코드와 명확한 오류 처리가 갖춰지면 대규모로 PDF에서 구조화된 데이터를 안정적으로 추출할 수 있습니다.

자주 묻는 질문

Java에서 PDF를 JSON으로 변환하는 라이브러리는 복잡한 양식 레이아웃을 어떻게 처리하나요?
SDK는 PDF의 시각적 요소를 파싱하고 계층 구조를 유지하는 JSON 스키마로 매핑합니다. 복잡한 레이아웃의 경우 OMR 템플릿을 조정하거나 JSON을 후처리해야 할 수 있습니다. 템플릿 사용자 정의에 대해서는 공식 문서를 참조하세요.

Java에서 형식을 잃지 않고 PDF를 JSON으로 변환할 수 있나요?
예. 변환은 양식 필드의 논리적 구조를 유지합니다. 시각적 스타일링은 JSON에 포함되지 않지만, 위치 데이터는 필요에 따라 레이아웃을 재구성할 수 있도록 보장합니다. 최고의 실천 방법은 Java에서 형식을 잃지 않고 PDF를 JSON으로 변환 섹션을 참조하십시오.

Java에서 PDF를 JSON으로 변환하는 배치 처리가 지원되나요?
물론입니다. SDK의 배치 API를 사용하면 단일 요청으로 여러 PDF 파일을 제출할 수 있어 효율적인 Java에서 PDF를 JSON으로 변환하는 배치 처리가 가능합니다. 반환된 작업 ID를 관리하여 각 JSON 결과를 가져오세요.

자세히 보기