Microsoft Word는 Word 문서(DOC/DOCX)를 다양한 형식으로 생성, 편집 및 변환하는 데 널리 사용됩니다. 마찬가지로 Markdown은 일반 텍스트 문서에 서식 요소를 추가하는 데 사용할 수 있는 경량 마크업 언어입니다. 모든 것을 뒤덮는 태그 없이 읽을 수 있는 일반 텍스트 문서이지만 목록, 볼드체, 이탤릭체 등과 같은 텍스트 수정자를 추가하는 방법이 있어야 합니다. 따라서 Word 문서가 있고 동등한 파일을 만들어야 하는 경우 Markdown 구문에서는 수동으로 생성하기가 어려워집니다. 그러나 프로그래밍 방식의 솔루션으로 문제를 해결할 수 있습니다. 이 기사에서는 Java Cloud SDK를 사용하여 Word to Markdown 변환기를 개발하는 방법에 대한 모든 세부 정보를 설명합니다.
Word to Markdown 변환 API
Aspose.Words Cloud라는 REST 기반 API는 MS Word 문서 생성, 조작 및 다양한 지원 형식으로의 변환 작업을 구현하는 놀라운 솔루션입니다. 이제 Java 애플리케이션에서 동일한 문서 변환 및 처리 기능을 구현하려면 REST API를 둘러싼 래퍼인 Aspose.Words Cloud SDK for Java를 사용해야 합니다. 따라서 SDK 활용의 첫 번째 단계에서 pom.xml(maven 빌드형 프로젝트)에 다음 정보를 포함하여 Java 프로젝트에 해당 참조를 추가해야 합니다.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.12.0</version>
</dependency>
</dependencies>
SDK 참조가 프로젝트에 추가되면 다음으로 중요한 단계는 클라우드 대시보드에서 클라이언트 자격 증명을 얻는 것입니다. 그렇지 않으면 먼저 유효한 이메일 주소를 사용하면서 무료 계정을 등록해야 합니다.
Java에서 MD로의 단어
이 섹션에서는 Java 코드 조각을 사용하여 Word를 MD 형식으로 변환하는 방법에 대한 단계 및 관련 세부 정보를 설명합니다. 입력 Word 문서를 로드하는 데 두 가지 옵션, 즉 클라우드 스토리지 또는 로컬 드라이브를 사용한 다음 Markdown 형식으로 변환할 것입니다.
로컬 드라이브에서 Word 문서 로드
- 먼저 WordsApi 인스턴스를 만들고 개인화된 자격 증명을 인수로 전달합니다.
- 둘째, Files.readAllBytes(…) 메서드를 사용하여 입력된 Word 문서의 내용을 읽고 byte[] 배열에서 반환된 값을 가져옵니다.
- 셋째, 입력 Word 파일, MD 형식 및 결과 Markdown 파일의 이름을 인수로 사용하는 ConvertDocumentRequest 개체를 만듭니다.
- 이제 Word에서 MD로의 변환을 위해 convertDocument(…) 메서드를 호출합니다. 결과 Markdown은 응답 스트림으로 반환되어 byte[] 인스턴스에 저장됩니다.
- 마지막으로 결과 Markdown을 로컬 드라이브에 저장하기 위해 FileOutputStream 객체를 만들고 write(…) 메서드를 사용합니다.
// 더 많은 코드 조각을 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 참조하십시오.
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// 로컬 시스템에서 워드 문서 로드
File file1 = new File("sample_EmbeddedOLE.docx");
// 입력된 워드 문서의 내용 읽기
byte[] documentStream = Files.readAllBytes(file1.toPath());
// 결과 파일 형식
String format = "md";
// 결과 파일 이름을 제공하는 문서 변환 요청 생성
ConvertDocumentRequest convertRequest = new ConvertDocumentRequest(documentStream,format, null,null, null, null);
// 단어를 마크다운으로 변환하고 출력을 바이트 배열로 저장
byte[] resultantFile = wordsApi.convertDocument(convertRequest);
// 결과 마크다운 문서를 로컬 드라이브에 저장
FileOutputStream fos = new FileOutputStream("/Users/nayyer/Documents/" + "resultant.md");
fos.write(resultantFile);
fos.close();
}catch(Exception ex)
{
System.out.println(ex);
}
sampleEmbeddedOLE.docx에서 입력 Word 문서를 다운로드하는 것을 고려할 수 있습니다.
Cloud Storage에서 Word 문서 로드
- 마찬가지로 먼저 개인화된 자격 증명을 인수로 전달하면서 WordsApi의 인스턴스를 생성해야 합니다.
- 둘째, 입력 Word 파일 이름, MD 형식 및 결과 Markdown 파일 이름을 인수로 사용하는 GetDocumentWithFormatRequest 개체를 만듭니다.
- 마지막으로 Word에서 Markdown으로의 변환 작업을 트리거하는 getDocumentWithFormat(..) 메서드를 호출합니다. 결과 MD 파일은 클라우드 스토리지에 저장됩니다.
// 더 많은 코드 조각을 보려면 https://github.com/aspose-words-cloud/aspose-words-cloud-java를 참조하십시오.
try
{
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// baseUrl이 null이면 WordsApi는 기본 https://api.aspose.cloud를 사용합니다.
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
String format = "md";
// 이제 GetDocumentWithFormatRequest의 새 개체를 만듭니다.
GetDocumentWithFormatRequest convertRequest = new GetDocumentWithFormatRequest("sample_EmbeddedOLE.docx",format,null, null, null,null,null,"Converted.md",null);
// 이제 메서드를 호출하여 변환 작업을 시작합니다.
// 결과 파일은 클라우드 스토리지에 저장됩니다.
wordsApi.getDocumentWithFormat(convertRequest);
}catch(Exception ex)
{
System.out.println(ex);
}
cURL 명령을 사용하여 DOC에서 Markdown으로
REST API는 또한 cURL 명령의 도움으로 모든 플랫폼에서 액세스할 수 있는 유연성을 제공합니다. 따라서 이 섹션에서는 클라우드 저장소에서 Word 문서를 로드하고 DOCX를 Markdown으로 변환하고 결과 MD 파일을 로컬 드라이브에 저장하는 방법에 대해 자세히 설명합니다. 이제 먼저 다음 명령을 사용하여 JWT 액세스 토큰(클라이언트 자격 증명 기반)을 생성한 다음 DOCX에서 Markdown으로 변환해야 합니다.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
JWT가 생성되면 다음 명령을 실행하여 클라우드 저장소에서 Word 문서를 로드하고 Word to Markdown 변환을 수행하십시오. 결과 MD 파일은 로컬 드라이브에 저장됩니다.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/sample_EmbeddedOLE.docx?format=md" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>" \
-o "newOutput.md"
결론
Java를 사용하여 프로그래밍 방식으로 Word를 Markdown으로 변환하는 방법에 대한 세부 정보를 배웠습니다. 마찬가지로 cURL 명령을 통해 DOCX를 Markdown으로 변환하는 단계도 살펴보았습니다.
API 기능을 탐색하는 또 다른 옵션은 웹 브라우저 내에서 SwaggerUI를 사용하는 것입니다. 또한 다른 흥미로운 기능에 대해 배울 수 있는 놀라운 정보 소스인 제품 설명서를 탐색하는 것이 좋습니다. Cloud SDK의 소스 코드를 다운로드하여 수정해야 하는 경우 GitHub(MIT 라이선스로 게시됨)에서 사용할 수 있습니다. 마지막으로, API를 사용하는 동안 문제가 발생하는 경우 무료 제품 지원 포럼을 통해 빠른 해결을 위해 저희에게 연락하는 것을 고려할 수 있습니다.
관련 기사
자세한 내용은 다음 링크를 참조하십시오.