Python SDK를 사용하여 Word 문서에서 페이지를 추출하는 빠르고 쉬운 방법입니다.

워드 문서 분할

Word 문서 분할 | Word 문서에서 페이지를 별도 파일로 추출

문서 관리 분야에서는 Word 문서에서 특정 섹션을 나누거나 분리하거나 추출해야 할 필요성이 종종 발생합니다. 방대한 연구 논문, 포괄적인 보고서 또는 긴 원고를 다루고 있든, 이를 더 관리하기 쉬운 부분으로 나누는 작업은 시간이 많이 걸리고 어려울 수 있습니다. 이 문서에서는 Python Cloud SDK로 이 요구 사항을 달성하는 단계를 살펴보겠습니다. 이를 통해 문서 관리 작업을 간소화하고 더 효율적으로 작업할 수 있습니다.

워드 프로세싱 API

Aspose.Words Cloud는 MS Word(DOCX, DOC, DOT, RTF, DOCM) 또는 OpenDocument(ODT, OTT) 처리를 위한 전담 솔루션입니다. Word 문서를 처리하는 데 타사 소프트웨어나 MS Office 자동화가 필요하지 않습니다. REST API를 호출하기만 하면 요구 사항을 충족할 수 있습니다. API는 REST 기반이므로 데스크톱, 웹, 모바일 앱 등 모든 플랫폼에서 액세스할 수 있습니다. 이제 이 문서의 범위에 따라 Word 파일의 페이지를 개별 Word 문서로 분할하는 방법에 대한 세부 정보를 설명합니다. 이 API는 또한 모든 페이지를 홀수, 짝수, 페이지 수, 페이지 범위별로 분할하는 분할 작업을 사용자 정의할 수 있는 유연성을 제공합니다.

고객의 편의를 위해, Cloud API를 감싸는 Aspose.Words Cloud SDK for Python을 만들었습니다. 이를 통해 선호하는 프로그래밍 언어에서 Word 문서 처리의 모든 이점을 활용할 수 있습니다. 따라서 더 진행하기 전에 첫 번째 단계는 로컬 시스템에 SDK를 설치하는 것입니다. PIPGitHub에서 다운로드할 수 있습니다. 명령줄 터미널에서 다음 명령을 실행하여 SDK를 설치합니다.

pip install aspose-words-cloud

Visual Studio를 IDE로 사용하는 경우 프로젝트에 SDK 참조를 직접 추가할 수 있습니다.

보기 ->다른 창 ->Python 환경 옵션을 클릭합니다. 아래에 표시된 대로.

Python 환경 메뉴 옵션.

이미지 1: Python 환경 메뉴 옵션.

Python Environments 창의 Packages 필드에 aspose-word-cloud를 입력합니다. 그런 다음 Install aspose-word-cloud (21.11.0) 링크를 클릭합니다. 버전 번호는 최신/현재 릴리스 버전에 따라 변경될 수 있습니다. 아래 이미지를 참조하세요.

aspose-words-cloud 파이썬 패키지

이미지 2: aspose-words-cloud 파이썬 패키지.

Python을 사용하여 Word 문서의 페이지 분할

클라우드 저장소에 있는 Word 문서의 모든 페이지를 분할하려면 아래 지침을 따르세요.

  • 먼저, 클라이언트 ID와 클라이언트 비밀번호를 인수로 전달하면서 WordsApi의 객체를 초기화해야 합니다.
  • 둘째, 입력 Word 파일의 이름, 결과 출력 형식, 결과 파일의 이름, 출력을 압축하여 보관하기 위한 매개변수를 지정합니다.
  • UploadFileRequest 객체를 사용하여 입력된 Word 문서를 클라우드 저장소에 업로드합니다.
  • 두 번째 단계에서 정의한 세부 정보를 전달하면서 SplitDocumentRequest의 인스턴스를 생성합니다.
  • 마지막으로 WordsApi 클래스의 splitdocument(…) 메서드를 호출하여 Word 문서를 분할합니다. 결과 파일은 매핑된 클라우드 스토리지에 저장됩니다.
try:
        # WordsApi 인스턴스를 생성합니다
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # 입력 워드 문서의 이름
        inputFileName = 'source.doc'
        # 결과 파일 형식
        resultantFormat = 'DOCX'
        # 작업 후 결과 문서의 이름입니다. 이 매개변수가 생략된 경우
        # 그러면 결과 파일은 입력 문서의 이름으로 저장됩니다.
        resultantFile = 'Split-File'
        # 출력을 ZIP으로 압축할지 여부를 나타내는 플래그입니다.
        zipOutput = 'false'

        # 소스 Word 문서를 클라우드 스토리지에 업로드
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # 문서를 분할할 객체를 만듭니다.
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,None, None, zipOutput, None)
        # 단어 분할 작업 시작
        result = words_api.split_document(request)
        
        # 콘솔에 메시지 출력 (선택 사항)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
문서 분할 작업 미리보기

이미지 3: 문서 분할 작업 미리보기.

선택한 페이지를 기준으로 문서 분할

이 섹션에서는 선택한 페이지를 기준으로 문서를 분할하고 출력을 ZIP 아카이브로 저장하는 방법에 대한 세부 정보를 논의합니다. 코드 조각은 위에서 공유한 것과 거의 동일하지만 출력을 보관하려면 Page From, Page To 및 True 값을 지정해야 합니다.

try:
        # WordsApi 인스턴스를 생성합니다
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # 입력 워드 문서의 이름
        inputFileName = 'source.doc'
        # 결과 파일 형식
        resultantFormat = 'DOCX'
        # 작업 후 결과 문서의 이름입니다. 이 매개변수가 생략된 경우
        # 그러면 결과 파일은 입력 문서의 이름으로 저장됩니다.
        resultantFile = 'SplitOutput'
        # 출력을 나타내는 플래그는 ZIP 아카이브 형식이어야 합니다.
        zipOutput = 'false'

        # 소스 Word 문서를 클라우드 스토리지에 업로드
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # 문서를 분할할 객체를 만듭니다.
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,pageFrom, pageTo, zipOutput, None)
        # 단어 분할 작업 시작
        result = words_api.split_document(request)
        
        # 콘솔에 메시지 출력 (선택 사항)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
문서 분할 출력

이미지 4: 선택한 페이지에 대한 문서 분할 작업 미리보기.

cURL 명령을 사용하여 Word 문서에서 페이지 추출

다른 REST API와 마찬가지로 Aspose.Words Cloud도 명령줄 터미널 내의 cURL 명령을 통해 액세스할 수 있습니다. 그러나 더 진행하기 전에 먼저 클라이언트 자격 증명을 기반으로 JWT 액세스 토큰을 생성해야 합니다.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

토큰이 생성되면 다음 명령을 실행하여 Word 문서에서 페이지를 추출하고 출력 결과를 클라우드 저장소에 저장하세요.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>"

결론

이 글에서는 Python SDK를 사용하여 Word 문서를 개별 페이지 파일로 분할할 수 있는 문서 분할기를 만드는 가능성을 살펴보았습니다. 또한 요구 사항에 따라 Python SDK를 사용하거나 cURL 명령을 사용하여 Word 문서에서 페이지를 추출할 수 있습니다. 당사는 집단적 성장과 협업을 믿습니다. 따라서 당사 SDK는 MIT 라이선스에 따라 개발되었으며 전체 소스 코드는 Github에서 다운로드할 수 있습니다. 필요한 경우 요구 사항에 따라 코드를 다운로드하여 수정할 수 있습니다. 문제가 발생하거나 추가 질문이 있는 경우 무료 제품 지원 포럼을 통해 언제든지 문의해 주십시오.

관련기사

자세한 내용을 알아보려면 다음 링크를 방문하세요.