วิธีการที่รวดเร็วและง่ายดายในการแยกหน้าจากเอกสาร Word โดยใช้ Python SDK

แยกเอกสาร Word | แยกหน้าจากเอกสาร Word เป็นไฟล์แยกต่างหาก
ในแวดวงการจัดการเอกสาร มักมีความจำเป็นต้องแบ่ง แยก หรือแยกส่วนเฉพาะออกจากเอกสาร Word ไม่ว่าคุณจะกำลังจัดการกับเอกสารวิจัยจำนวนมาก รายงานที่ครอบคลุม หรือต้นฉบับที่ยาว งานในการแบ่งเอกสารเหล่านี้ออกเป็นส่วนๆ ที่จัดการได้ง่ายขึ้นอาจใช้เวลานานและท้าทาย ในบทความนี้ เราจะมาสำรวจขั้นตอนในการบรรลุข้อกำหนดนี้ด้วย Python Cloud SDK ซึ่งจะช่วยให้คุณปรับกระบวนการจัดการเอกสารให้มีประสิทธิภาพมากขึ้นและทำงานได้อย่างมีประสิทธิภาพมากขึ้น
- API การประมวลผลคำ
- แบ่งหน้าในเอกสาร Word โดยใช้ Python
- แยกเอกสารตามหน้าที่เลือก
- แยกหน้าจากเอกสาร Word โดยใช้คำสั่ง cURL
API การประมวลผลคำ
Aspose.Words Cloud เป็นโซลูชันเฉพาะของเราสำหรับการประมวลผล MS Word (DOCX, DOC, DOT, RTF, DOCM) หรือ OpenDocument (ODT, OTT) ไม่จำเป็นต้องใช้ซอฟต์แวร์ของบุคคลที่สามหรือระบบอัตโนมัติของ MS Office ในการประมวลผลเอกสาร Word เพียงแค่เรียกใช้ REST API เพื่อตอบสนองความต้องการของคุณ เนื่องจาก API นั้นใช้ REST ดังนั้นคุณจึงสามารถเข้าถึงได้บนแพลตฟอร์มใดก็ได้ รวมถึงเดสก์ท็อป เว็บ แอปมือถือ ฯลฯ ขณะนี้ ตามขอบเขตของบทความนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการแบ่งหน้าในไฟล์ Word เป็นเอกสาร Word แยกกัน API ยังให้ความยืดหยุ่นในการปรับแต่งการดำเนินการแบ่ง เช่น แบ่งทุกหน้า คี่และคู่ ตามจำนวนหน้า ตามช่วงหน้า
เพื่ออำนวยความสะดวกแก่ลูกค้ามากขึ้น เราจึงได้สร้าง Aspose.Words Cloud SDK for Python ซึ่งเป็นโปรแกรมที่ห่อหุ้ม Cloud API เพื่อให้คุณได้รับประโยชน์ทั้งหมดของการประมวลผลเอกสาร Word ในภาษาโปรแกรมที่คุณชื่นชอบ ดังนั้น ก่อนจะดำเนินการต่อ ขั้นตอนแรกคือการติดตั้ง SDK บนระบบภายในเครื่อง ดาวน์โหลดได้ที่ PIP และ GitHub เรียกใช้คำสั่งต่อไปนี้บนเทอร์มินัลบรรทัดคำสั่งเพื่อติดตั้ง SDK:
pip install aspose-words-cloud
ในกรณีที่คุณใช้ Visual Studio เป็น IDE คุณสามารถเพิ่มการอ้างอิงของ SDK ลงในโครงการได้โดยตรง
คลิกตัวเลือก View ->Other Windows ->Python Environments ดังแสดงด้านล่าง

ภาพที่ 1: ตัวเลือกเมนูสภาพแวดล้อม Python
ป้อน aspose-word-cloud ในช่อง Packages ในหน้าต่าง Python Environments จากนั้นคลิกลิงก์ Install aspose-word-cloud (21.11.0) หมายเลขเวอร์ชันอาจเปลี่ยนแปลงได้ขึ้นอยู่กับเวอร์ชันล่าสุด/รุ่นปัจจุบัน ดูภาพด้านล่าง

รูปภาพ 2:- แพ็กเกจ python aspose-words-cloud
แบ่งหน้าในเอกสาร Word โดยใช้ Python
โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อแบ่งหน้าทั้งหมดในเอกสาร Word ที่มีอยู่บนระบบจัดเก็บข้อมูลบนคลาวด์อยู่แล้ว
- ประการแรก เราต้องเริ่มต้นวัตถุของ WordsApi ในขณะที่ส่ง Client ID และ Client Secret เป็นอาร์กิวเมนต์
- ประการที่สอง ระบุชื่อไฟล์ Word อินพุต รูปแบบเอาต์พุตผลลัพธ์ ชื่อไฟล์ผลลัพธ์ และพารามิเตอร์ในการบีบอัดไฟล์เอาต์พุต
- อัปโหลดเอกสารอินพุต Word ไปยังที่เก็บข้อมูลบนคลาวด์โดยใช้วัตถุ UploadFileRequest
- ตอนนี้ให้สร้างอินสแตนซ์ของ SplitDocumentRequest ขณะส่งรายละเอียดที่กำหนดไว้ในขั้นตอนที่สอง
- สุดท้าย ให้เรียกใช้เมธอด splitdocument(…) ของคลาส WordsApi เพื่อแยกเอกสาร Word ไฟล์ที่ได้จะถูกบันทึกไว้ในที่เก็บข้อมูลบนคลาวด์ที่แมปไว้
try:
# สร้างอินสแตนซ์ของ WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# ชื่อเอกสารคำอินพุต
inputFileName = 'source.doc'
# รูปแบบไฟล์ผลลัพธ์
resultantFormat = 'DOCX'
# ชื่อของเอกสารผลลัพธ์หลังจากการดำเนินการ หากละเว้นพารามิเตอร์นี้
# จากนั้นไฟล์ผลลัพธ์จะถูกบันทึกโดยใช้ชื่อเอกสารอินพุต
resultantFile = 'Split-File'
# แฟล็กที่ระบุว่าจะ ZIP เอาท์พุตหรือไม่
zipOutput = 'false'
# อัปโหลดเอกสาร Word ต้นฉบับไปยังที่เก็บข้อมูลบนคลาวด์
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# สร้างวัตถุเพื่อแยกเอกสาร
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,None, None, zipOutput, None)
# เริ่มการดำเนินการแยกคำ
result = words_api.split_document(request)
# พิมพ์ข้อความในคอนโซล (ทางเลือก)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

ภาพที่ 3:- ตัวอย่างการดำเนินการแยกเอกสาร
แยกเอกสารตามหน้าที่เลือก
ในส่วนนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการแบ่งเอกสารตามหน้าที่เลือกและบันทึกผลลัพธ์เป็นไฟล์ ZIP สไนปเป็ตโค้ดจะเหมือนกับที่แชร์ไว้ข้างต้นเกือบทั้งหมด เพียงแต่เราต้องระบุค่า Page From, Page To และ True สำหรับผลลัพธ์ที่จะเก็บถาวร
try:
# สร้างอินสแตนซ์ของ WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# ชื่อเอกสารคำอินพุต
inputFileName = 'source.doc'
# รูปแบบไฟล์ผลลัพธ์
resultantFormat = 'DOCX'
# ชื่อของเอกสารผลลัพธ์หลังจากการดำเนินการ หากละเว้นพารามิเตอร์นี้
# จากนั้นไฟล์ผลลัพธ์จะถูกบันทึกโดยใช้ชื่อเอกสารอินพุต
resultantFile = 'SplitOutput'
# ธงที่ระบุเอาท์พุตจะต้องอยู่ในไฟล์ ZIP
zipOutput = 'false'
# อัปโหลดเอกสาร Word ต้นฉบับไปยังที่เก็บข้อมูลบนคลาวด์
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# สร้างวัตถุเพื่อแยกเอกสาร
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,pageFrom, pageTo, zipOutput, None)
# เริ่มการดำเนินการแยกคำ
result = words_api.split_document(request)
# พิมพ์ข้อความในคอนโซล (ทางเลือก)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

ภาพที่ 4:- การแสดงตัวอย่างการดำเนินการแยกเอกสารสำหรับหน้าที่เลือก
แยกหน้าจากเอกสาร Word โดยใช้คำสั่ง cURL
เช่นเดียวกับ REST API อื่นๆ สามารถเข้าถึง Aspose.Words Cloud ได้โดยใช้คำสั่ง cURL ในเทอร์มินัลบรรทัดคำสั่ง อย่างไรก็ตาม ก่อนที่จะดำเนินการต่อ เราต้องสร้างโทเค็นการเข้าถึง JWT ตามข้อมูลประจำตัวไคลเอนต์เสียก่อน
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
หลังจากที่สร้างโทเค็นแล้ว โปรดดำเนินการคำสั่งต่อไปนี้เพื่อแยกหน้าออกจากเอกสาร Word และบันทึกเอาต์พุตในที่จัดเก็บข้อมูลบนคลาวด์
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>"
บทสรุป
ในบทความนี้ เราได้สำรวจความเป็นไปได้ในการสร้างตัวแยกเอกสารที่สามารถแยกเอกสาร Word ออกเป็นไฟล์หน้าแต่ละหน้าโดยใช้ Python SDK นอกจากนี้ ตามความต้องการของคุณ คุณสามารถใช้ Python SDK หรือแยกหน้าจากเอกสาร Word โดยใช้คำสั่ง cURL โปรดทราบว่าเราเชื่อในการเติบโตและการทำงานร่วมกัน ดังนั้น SDK ของเราจึงได้รับการพัฒนาตามใบอนุญาต MIT และสามารถดาวน์โหลดโค้ดต้นฉบับทั้งหมดได้ที่ Github หากคุณต้องการ คุณสามารถดาวน์โหลดและปรับเปลี่ยนโค้ดตามความต้องการของคุณ หากคุณพบปัญหาหรือมีคำถามเพิ่มเติม โปรดติดต่อเราผ่าน ฟอรัมสนับสนุนผลิตภัณฑ์ฟรี
บทความที่เกี่ยวข้อง
เราขอแนะนำให้คุณเยี่ยมชมลิงก์ต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: