PDF를 TXT로

Java에서 온라인으로 PDF를 TXT로 변환

PDF 파일은 인터넷을 통한 데이터 및 정보 공유에 널리 사용되는 형식 중 하나입니다. 그러나 때로는 사용자 지정 글꼴을 사용하여 콘텐츠를 콘텐츠로 만들고 결과 파일의 크기가 커질 수 있습니다. 또한 추가 처리를 위해 텍스트 콘텐츠를 추출해야 하는 요구 사항이 있을 수 있으므로 이 시나리오에서는 PDF를 텍스트로 변환하는 것이 실행 가능한 솔루션 중 하나입니다. 이 기사에서는 PDF를 TXT 형식으로 변환하는 방법에 대해 자세히 설명합니다.

PDF를 텍스트로 변환 API

Aspose.Words Cloud SDK for Java는 Word 문서 처리를 위한 선도적인 솔루션입니다. 다양한 파일을 DOC, HTML, JPEG 및 기타 다양한 지원 형식으로 생성, 편집 및 변환하는 기능을 제공하는 놀라운 솔루션입니다. Word 문서 외에도 PDF 파일을 로드하고 출력을 TXT, HTML, XPS, TIFF 등에 저장하는 지원도 제공합니다. SDK를 사용하려면 maven 빌드 유형의 pom.xml에 다음 세부 정보를 추가하십시오.

<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.cloud/repo/</url>
    </repository>
</repositories>

<dependencies>
    <dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words-cloud</artifactId>
		<version>22.5.0</version>
	</dependency>
</dependencies>

이제 Aspose.Cloud 대시보드를 방문하여 무료 계정을 만들어야 합니다. 기존 GitHub 또는 Google 계정을 사용하여 가입하거나 새 계정 만들기 버튼을 클릭하기만 하면 됩니다.

Java에서 PDF를 TXT로 변환

Java 코드 조각을 사용하여 요구 사항을 충족하려면 아래 지침을 따르십시오.

  • 먼저 Client ID와 Client Secret을 파라미터로 사용하여 WordsApi 객체를 생성합니다.
  • 둘째, 파일 개체를 사용하여 로컬 드라이브에서 PDF 파일 내용을 읽습니다.
  • 셋째, UploadFileRequest 인스턴스를 사용하여 PDF 파일의 내용을 읽습니다.
  • 다음 단계는 uploadFile(…) 메서드를 호출하여 PDF를 클라우드 저장소에 업로드하는 것입니다.
  • 이제 출력 형식을 TXT 형식으로 지정하는 GetDocumentWithFormatRequest(…) 객체를 생성합니다.
  • 마지막으로 getDocumentWithFormat(…) 메서드를 호출하여 PDF를 텍스트로 변환하고 출력을 클라우드 스토리지에 저장합니다.
// 더 많은 예제를 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 방문하십시오.

try
    {
    // https://dashboard.aspose.cloud/에서 ClientID 및 ClientSecret 가져오기
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // WordsApi 객체 생성
    // baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

    // 로컬 드라이브에서 PDF 내용 읽기
    File file = new File("c://input.pdf");
    
    // 파일 업로드 요청 생성
    UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
    
    // 클라우드 저장소에 파일 업로드
    wordsApi.uploadFile(uploadRequest);
        
    // 문서 변환 요청 객체 생성
    GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
        
    // 온라인에서 PDF를 텍스트로 변환하는 API 호출
    wordsApi.getDocumentWithFormat(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }

다음 코드 스니펫을 사용하여 로컬 드라이브에서 PDF를 로드하고 TXT 형식으로 저장하십시오. 변환 후 결과 파일은 클라우드 저장소에 저장됩니다.

  • 먼저 Client ID와 Client Secret을 파라미터로 사용하여 WordsApi 객체를 생성합니다.
  • 둘째, 파일 개체를 사용하여 로컬 드라이브에서 PDF 파일 내용을 읽습니다.
  • 셋째, 결과 형식으로 File 개체, TXT의 인수를 제공하고 결과 TXT 파일의 출력 경로를 제공하는 ConvertDocumentRequest(…) 개체를 만듭니다.
  • 마지막으로 convertDocument(…) 메서드를 호출하여 PDF를 텍스트로 변환하고 출력을 클라우드 스토리지에 저장합니다.
// 더 많은 예제를 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 방문하십시오.

try
    {
    // https://dashboard.aspose.cloud/에서 ClientID 및 ClientSecret 가져오기
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // WordsApi 객체 생성
    // baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);

    // 로컬 드라이브에서 PDF 내용 읽기
    File file = new File("c://input.pdf");
           
    // 문서 변환 요청 객체 생성
    ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
        
    // PDF를 텍스트 형식으로 변환하는 API 호출
    wordsApi.convertDocument(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
PDF를 텍스트로

이미지 1:- 클라우드 저장소에서 PDF를 텍스트로 변환하는 미리보기

cURL 명령을 사용하여 PDF에서 TXT로

이 섹션에서는 cURL 명령을 사용하여 PDF를 텍스트로 변환하는 작업을 수행합니다. 이제 전제 조건으로 다음 명령을 사용하여 클라이언트 자격 증명을 기반으로 JWT 액세스 토큰을 생성해야 합니다.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

이제 다음 명령을 실행하여 PDF 파일을 클라우드 스토리지에 업로드하십시오.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>" \
-H  "Content-Type: multipart/form-data" \
-d {"fileContent":{}}

마지막으로 다음 명령을 실행하여 PDF를 텍스트 형식으로 변환합니다.

curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"

결론

이 문서에서는 Java 코드 조각을 사용하여 PDF를 텍스트로 변환하는 방법에 대해 자세히 설명했습니다. 마찬가지로 cURL 명령을 사용하여 PDF를 TXT로 변환하는 단계도 배웠습니다. 더 나은 학습을 위해 웹 브라우저 내에서 Swagger UI를 사용하여 API를 탐색할 수 있습니다.

관련 질문이 있거나 문제가 발생하면 무료 기술 지원 포럼을 통해 언제든지 문의하십시오.

관련 기사

자세한 내용은 다음 문서를 참조하는 것이 좋습니다.