วิธีการที่รวดเร็วและง่ายดายในการแยกหน้าจากเอกสาร Word โดยใช้ Python SDK

เอกสารคำแยก

แยกเอกสาร Word | แยกหน้าจากเอกสาร Word เป็นไฟล์แยกต่างหาก

ในแวดวงการจัดการเอกสาร มักมีความจำเป็นต้องแบ่ง แยก หรือแยกส่วนเฉพาะออกจากเอกสาร Word ไม่ว่าคุณจะกำลังจัดการกับเอกสารวิจัยจำนวนมาก รายงานที่ครอบคลุม หรือต้นฉบับที่ยาว งานในการแบ่งเอกสารเหล่านี้ออกเป็นส่วนๆ ที่จัดการได้ง่ายขึ้นอาจใช้เวลานานและท้าทาย ในบทความนี้ เราจะมาสำรวจขั้นตอนในการบรรลุข้อกำหนดนี้ด้วย Python Cloud SDK ซึ่งจะช่วยให้คุณปรับกระบวนการจัดการเอกสารให้มีประสิทธิภาพมากขึ้นและทำงานได้อย่างมีประสิทธิภาพมากขึ้น

API การประมวลผลคำ

Aspose.Words Cloud เป็นโซลูชันเฉพาะของเราสำหรับการประมวลผล MS Word (DOCX, DOC, DOT, RTF, DOCM) หรือ OpenDocument (ODT, OTT) ไม่จำเป็นต้องใช้ซอฟต์แวร์ของบุคคลที่สามหรือระบบอัตโนมัติของ MS Office ในการประมวลผลเอกสาร Word เพียงแค่เรียกใช้ REST API เพื่อตอบสนองความต้องการของคุณ เนื่องจาก API นั้นใช้ REST ดังนั้นคุณจึงสามารถเข้าถึงได้บนแพลตฟอร์มใดก็ได้ รวมถึงเดสก์ท็อป เว็บ แอปมือถือ ฯลฯ ขณะนี้ ตามขอบเขตของบทความนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการแบ่งหน้าในไฟล์ Word เป็นเอกสาร Word แยกกัน API ยังให้ความยืดหยุ่นในการปรับแต่งการดำเนินการแบ่ง เช่น แบ่งทุกหน้า คี่และคู่ ตามจำนวนหน้า ตามช่วงหน้า

เพื่ออำนวยความสะดวกแก่ลูกค้ามากขึ้น เราจึงได้สร้าง Aspose.Words Cloud SDK for Python ซึ่งเป็นโปรแกรมที่ห่อหุ้ม Cloud API เพื่อให้คุณได้รับประโยชน์ทั้งหมดของการประมวลผลเอกสาร Word ในภาษาโปรแกรมที่คุณชื่นชอบ ดังนั้น ก่อนจะดำเนินการต่อ ขั้นตอนแรกคือการติดตั้ง SDK บนระบบภายในเครื่อง ดาวน์โหลดได้ที่ PIP และ GitHub เรียกใช้คำสั่งต่อไปนี้บนเทอร์มินัลบรรทัดคำสั่งเพื่อติดตั้ง SDK:

pip install aspose-words-cloud

ในกรณีที่คุณใช้ Visual Studio เป็น IDE คุณสามารถเพิ่มการอ้างอิงของ SDK ลงในโครงการได้โดยตรง

คลิกตัวเลือก View ->Other Windows ->Python Environments ดังแสดงด้านล่าง

ตัวเลือกเมนูสภาพแวดล้อม Python

ภาพที่ 1: ตัวเลือกเมนูสภาพแวดล้อม Python

ป้อน aspose-word-cloud ในช่อง Packages ในหน้าต่าง Python Environments จากนั้นคลิกลิงก์ Install aspose-word-cloud (21.11.0) หมายเลขเวอร์ชันอาจเปลี่ยนแปลงได้ขึ้นอยู่กับเวอร์ชันล่าสุด/รุ่นปัจจุบัน ดูภาพด้านล่าง

แพ็คเกจ python aspose-words-cloud

รูปภาพ 2:- แพ็กเกจ python aspose-words-cloud

แบ่งหน้าในเอกสาร Word โดยใช้ Python

โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อแบ่งหน้าทั้งหมดในเอกสาร Word ที่มีอยู่บนระบบจัดเก็บข้อมูลบนคลาวด์อยู่แล้ว

  • ประการแรก เราต้องเริ่มต้นวัตถุของ WordsApi ในขณะที่ส่ง Client ID และ Client Secret เป็นอาร์กิวเมนต์
  • ประการที่สอง ระบุชื่อไฟล์ Word อินพุต รูปแบบเอาต์พุตผลลัพธ์ ชื่อไฟล์ผลลัพธ์ และพารามิเตอร์ในการบีบอัดไฟล์เอาต์พุต
  • อัปโหลดเอกสารอินพุต Word ไปยังที่เก็บข้อมูลบนคลาวด์โดยใช้วัตถุ UploadFileRequest
  • ตอนนี้ให้สร้างอินสแตนซ์ของ SplitDocumentRequest ขณะส่งรายละเอียดที่กำหนดไว้ในขั้นตอนที่สอง
  • สุดท้าย ให้เรียกใช้เมธอด splitdocument(…) ของคลาส WordsApi เพื่อแยกเอกสาร Word ไฟล์ที่ได้จะถูกบันทึกไว้ในที่เก็บข้อมูลบนคลาวด์ที่แมปไว้
try:
        # สร้างอินสแตนซ์ของ WordsApi
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # ชื่อเอกสารคำอินพุต
        inputFileName = 'source.doc'
        # รูปแบบไฟล์ผลลัพธ์
        resultantFormat = 'DOCX'
        # ชื่อของเอกสารผลลัพธ์หลังจากการดำเนินการ หากละเว้นพารามิเตอร์นี้
        # จากนั้นไฟล์ผลลัพธ์จะถูกบันทึกโดยใช้ชื่อเอกสารอินพุต
        resultantFile = 'Split-File'
        # แฟล็กที่ระบุว่าจะ ZIP เอาท์พุตหรือไม่
        zipOutput = 'false'

        # อัปโหลดเอกสาร Word ต้นฉบับไปยังที่เก็บข้อมูลบนคลาวด์
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # สร้างวัตถุเพื่อแยกเอกสาร
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,None, None, zipOutput, None)
        # เริ่มการดำเนินการแยกคำ
        result = words_api.split_document(request)
        
        # พิมพ์ข้อความในคอนโซล (ทางเลือก)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
ตัวอย่างการดำเนินการแยกเอกสาร

ภาพที่ 3:- ตัวอย่างการดำเนินการแยกเอกสาร

แยกเอกสารตามหน้าที่เลือก

ในส่วนนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการแบ่งเอกสารตามหน้าที่เลือกและบันทึกผลลัพธ์เป็นไฟล์ ZIP สไนปเป็ตโค้ดจะเหมือนกับที่แชร์ไว้ข้างต้นเกือบทั้งหมด เพียงแต่เราต้องระบุค่า Page From, Page To และ True สำหรับผลลัพธ์ที่จะเก็บถาวร

try:
        # สร้างอินสแตนซ์ของ WordsApi
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # ชื่อเอกสารคำอินพุต
        inputFileName = 'source.doc'
        # รูปแบบไฟล์ผลลัพธ์
        resultantFormat = 'DOCX'
        # ชื่อของเอกสารผลลัพธ์หลังจากการดำเนินการ หากละเว้นพารามิเตอร์นี้
        # จากนั้นไฟล์ผลลัพธ์จะถูกบันทึกโดยใช้ชื่อเอกสารอินพุต
        resultantFile = 'SplitOutput'
        # ธงที่ระบุเอาท์พุตจะต้องอยู่ในไฟล์ ZIP
        zipOutput = 'false'

        # อัปโหลดเอกสาร Word ต้นฉบับไปยังที่เก็บข้อมูลบนคลาวด์
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # สร้างวัตถุเพื่อแยกเอกสาร
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,pageFrom, pageTo, zipOutput, None)
        # เริ่มการดำเนินการแยกคำ
        result = words_api.split_document(request)
        
        # พิมพ์ข้อความในคอนโซล (ทางเลือก)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
การแยกเอกสารออก

ภาพที่ 4:- การแสดงตัวอย่างการดำเนินการแยกเอกสารสำหรับหน้าที่เลือก

แยกหน้าจากเอกสาร Word โดยใช้คำสั่ง cURL

เช่นเดียวกับ REST API อื่นๆ สามารถเข้าถึง Aspose.Words Cloud ได้โดยใช้คำสั่ง cURL ในเทอร์มินัลบรรทัดคำสั่ง อย่างไรก็ตาม ก่อนที่จะดำเนินการต่อ เราต้องสร้างโทเค็นการเข้าถึง JWT ตามข้อมูลประจำตัวไคลเอนต์เสียก่อน

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

หลังจากที่สร้างโทเค็นแล้ว โปรดดำเนินการคำสั่งต่อไปนี้เพื่อแยกหน้าออกจากเอกสาร Word และบันทึกเอาต์พุตในที่จัดเก็บข้อมูลบนคลาวด์

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>"

บทสรุป

ในบทความนี้ เราได้สำรวจความเป็นไปได้ในการสร้างตัวแยกเอกสารที่สามารถแยกเอกสาร Word ออกเป็นไฟล์หน้าแต่ละหน้าโดยใช้ Python SDK นอกจากนี้ ตามความต้องการของคุณ คุณสามารถใช้ Python SDK หรือแยกหน้าจากเอกสาร Word โดยใช้คำสั่ง cURL โปรดทราบว่าเราเชื่อในการเติบโตและการทำงานร่วมกัน ดังนั้น SDK ของเราจึงได้รับการพัฒนาตามใบอนุญาต MIT และสามารถดาวน์โหลดโค้ดต้นฉบับทั้งหมดได้ที่ Github หากคุณต้องการ คุณสามารถดาวน์โหลดและปรับเปลี่ยนโค้ดตามความต้องการของคุณ หากคุณพบปัญหาหรือมีคำถามเพิ่มเติม โปรดติดต่อเราผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ฟรี

บทความที่เกี่ยวข้อง

เราขอแนะนำให้คุณเยี่ยมชมลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: