PDF 파일은 인터넷을 통한 데이터 및 정보 공유에 널리 사용되는 형식 중 하나입니다. 그러나 때로는 사용자 지정 글꼴을 사용하여 콘텐츠를 콘텐츠로 만들고 결과 파일의 크기가 커질 수 있습니다. 또한 추가 처리를 위해 텍스트 콘텐츠를 추출해야 하는 요구 사항이 있을 수 있으므로 이 시나리오에서는 PDF를 텍스트로 변환하는 것이 실행 가능한 솔루션 중 하나입니다. 이 기사에서는 PDF를 TXT 형식으로 변환하는 방법에 대해 자세히 설명합니다.
PDF를 텍스트로 변환 API
Aspose.Words Cloud SDK for Java는 Word 문서 처리를 위한 선도적인 솔루션입니다. 다양한 파일을 DOC, HTML, JPEG 및 기타 다양한 지원 형식으로 생성, 편집 및 변환하는 기능을 제공하는 놀라운 솔루션입니다. Word 문서 외에도 PDF 파일을 로드하고 출력을 TXT, HTML, XPS, TIFF 등에 저장하는 지원도 제공합니다. SDK를 사용하려면 maven 빌드 유형의 pom.xml에 다음 세부 정보를 추가하십시오.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.cloud/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.5.0</version>
</dependency>
</dependencies>
이제 Aspose.Cloud 대시보드를 방문하여 무료 계정을 만들어야 합니다. 기존 GitHub 또는 Google 계정을 사용하여 가입하거나 새 계정 만들기 버튼을 클릭하기만 하면 됩니다.
Java에서 PDF를 TXT로 변환
Java 코드 조각을 사용하여 요구 사항을 충족하려면 아래 지침을 따르십시오.
- 먼저 Client ID와 Client Secret을 파라미터로 사용하여 WordsApi 객체를 생성합니다.
- 둘째, 파일 개체를 사용하여 로컬 드라이브에서 PDF 파일 내용을 읽습니다.
- 셋째, UploadFileRequest 인스턴스를 사용하여 PDF 파일의 내용을 읽습니다.
- 다음 단계는 uploadFile(…) 메서드를 호출하여 PDF를 클라우드 저장소에 업로드하는 것입니다.
- 이제 출력 형식을 TXT 형식으로 지정하는 GetDocumentWithFormatRequest(…) 객체를 생성합니다.
- 마지막으로 getDocumentWithFormat(…) 메서드를 호출하여 PDF를 텍스트로 변환하고 출력을 클라우드 스토리지에 저장합니다.
// 더 많은 예제를 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 방문하십시오.
try
{
// https://dashboard.aspose.cloud/에서 ClientID 및 ClientSecret 가져오기
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// WordsApi 객체 생성
// baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// 로컬 드라이브에서 PDF 내용 읽기
File file = new File("c://input.pdf");
// 파일 업로드 요청 생성
UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
// 클라우드 저장소에 파일 업로드
wordsApi.uploadFile(uploadRequest);
// 문서 변환 요청 객체 생성
GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
// 온라인에서 PDF를 텍스트로 변환하는 API 호출
wordsApi.getDocumentWithFormat(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
다음 코드 스니펫을 사용하여 로컬 드라이브에서 PDF를 로드하고 TXT 형식으로 저장하십시오. 변환 후 결과 파일은 클라우드 저장소에 저장됩니다.
- 먼저 Client ID와 Client Secret을 파라미터로 사용하여 WordsApi 객체를 생성합니다.
- 둘째, 파일 개체를 사용하여 로컬 드라이브에서 PDF 파일 내용을 읽습니다.
- 셋째, 결과 형식으로 File 개체, TXT의 인수를 제공하고 결과 TXT 파일의 출력 경로를 제공하는 ConvertDocumentRequest(…) 개체를 만듭니다.
- 마지막으로 convertDocument(…) 메서드를 호출하여 PDF를 텍스트로 변환하고 출력을 클라우드 스토리지에 저장합니다.
// 더 많은 예제를 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 방문하십시오.
try
{
// https://dashboard.aspose.cloud/에서 ClientID 및 ClientSecret 가져오기
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// WordsApi 객체 생성
// baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// 로컬 드라이브에서 PDF 내용 읽기
File file = new File("c://input.pdf");
// 문서 변환 요청 객체 생성
ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
// PDF를 텍스트 형식으로 변환하는 API 호출
wordsApi.convertDocument(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
cURL 명령을 사용하여 PDF에서 TXT로
이 섹션에서는 cURL 명령을 사용하여 PDF를 텍스트로 변환하는 작업을 수행합니다. 이제 전제 조건으로 다음 명령을 사용하여 클라이언트 자격 증명을 기반으로 JWT 액세스 토큰을 생성해야 합니다.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
이제 다음 명령을 실행하여 PDF 파일을 클라우드 스토리지에 업로드하십시오.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>" \
-H "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
마지막으로 다음 명령을 실행하여 PDF를 텍스트 형식으로 변환합니다.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
결론
이 문서에서는 Java 코드 조각을 사용하여 PDF를 텍스트로 변환하는 방법에 대해 자세히 설명했습니다. 마찬가지로 cURL 명령을 사용하여 PDF를 TXT로 변환하는 단계도 배웠습니다. 더 나은 학습을 위해 웹 브라우저 내에서 Swagger UI를 사용하여 API를 탐색할 수 있습니다.
관련 질문이 있거나 문제가 발생하면 무료 기술 지원 포럼을 통해 언제든지 문의하십시오.
관련 기사
자세한 내용은 다음 문서를 참조하는 것이 좋습니다.