یک روش سریع و آسان برای استخراج صفحات از اسناد word با استفاده از Python SDK.

سند کلمه تقسیم | صفحات را از سند Word به عنوان یک فایل جداگانه استخراج کنید
در حوزه مدیریت اسناد، اغلب نیاز به تقسیم، جداسازی یا استخراج بخش های خاصی از یک سند Word وجود دارد. چه با مقالات تحقیقاتی گسترده، گزارشهای جامع یا دستنوشتههای طولانی سروکار داشته باشید، وظیفه تقسیم آنها به بخشهای قابل مدیریتتر میتواند زمانبر و چالشبرانگیز باشد. در این مقاله، ما مراحل دستیابی به این نیاز را با Python Cloud SDK بررسی خواهیم کرد، که به شما امکان می دهد وظایف مدیریت اسناد خود را ساده کنید و کارآمدتر کار کنید.
- API پردازش کلمه
- تقسیم صفحات در سند ورد با استفاده از پایتون
- تقسیم سند بر اساس صفحات انتخاب شده
- استخراج صفحات از سند Word با استفاده از دستورات cURL
API پردازش کلمه
Aspose.Words Cloud راه حل اختصاصی ما برای پردازش MS Word (DOCX، DOC، DOT، RTF، DOCM) یا OpenDocument (ODT، OTT) است. هیچ نرم افزار شخص ثالث یا اتوماسیون MS Office برای پردازش اسناد Word لازم نیست. به سادگی با REST APIها تماس بگیرید تا نیازهای خود را برآورده کنید. از آنجایی که APIها مبتنی بر REST هستند، بنابراین میتوانید در هر پلتفرمی از جمله دسکتاپ، وب، اپلیکیشن موبایل و غیره به آنها دسترسی داشته باشید. اکنون طبق محدوده این مقاله، میخواهیم جزئیات نحوه تقسیم صفحات در یک فایل word را به عنوان یک سند word جداگانه مورد بحث قرار دهیم. API همچنین انعطاف پذیری برای سفارشی کردن عملیات تقسیم را فراهم می کند، یعنی هر صفحه را، فرد و زوج، بر اساس تعداد صفحات، بر اساس محدوده صفحه تقسیم کنید.
به منظور تسهیل بیشتر مشتریان خود، Aspose.Words Cloud SDK for Python را ایجاد کردهایم که یک پوشش در اطراف Cloud API است، بنابراین میتوانید از تمام مزایای پردازش اسناد Word در زبان برنامهنویسی مورد علاقه خود بهره ببرید. بنابراین قبل از ادامه، اولین مرحله نصب SDK در سیستم محلی است. برای دانلود در PIP و GitHub در دسترس است. برای نصب SDK دستور زیر را در ترمینال خط فرمان اجرا کنید:
pip install aspose-words-cloud
در صورتی که از ویژوال استودیو به عنوان IDE استفاده می کنید، می توانید مستقیماً مرجع SDK را به پروژه اضافه کنید.
روی گزینه View ->Other Windows ->Python Environments کلیک کنید. همانطور که در زیر نشان داده شده است.

تصویر 1: - گزینه منوی Python Environment.
aspose-word-cloud را در قسمت Packages در پنجره Python Environments وارد کنید. سپس روی پیوند Install aspose-word-cloud (21.11.0) کلیک کنید. شماره نسخه ممکن است بسته به آخرین/نسخه نسخه فعلی تغییر کند. تصویر زیر را ببینید.

تصویر 2: - بسته aspose-words-cloud python.
تقسیم صفحات در سند ورد با استفاده از پایتون
لطفاً دستورالعملهای زیر را دنبال کنید تا همه صفحات را در یک سند word تقسیم کنید که از قبل در فضای ذخیرهسازی ابری موجود است.
- ابتدا، ما باید یک شی از WordsApi را مقداردهی اولیه کنیم، در حالی که Client ID و Client Secret را به عنوان آرگومان ارسال می کنیم.
- در مرحله دوم، نام فایل ورد ورودی، فرمت خروجی حاصل، نام فایل حاصل و پارامتر را مشخص کنید تا خروجی بایگانی شود.
- با استفاده از شی UploadFileRequest، سند Word ورودی را در فضای ذخیره سازی ابری آپلود کنید.
- حال یک نمونه از SplitDocumentRequest را در حین انتقال جزئیات تعریف شده در مرحله دوم ایجاد کنید.
- در نهایت متد splitdocument(…) کلاس WordsApi را برای تقسیم اسناد word فراخوانی کنید. فایل های حاصل در فضای ذخیره سازی ابری نقشه برداری شده ذخیره می شوند.
try:
# یک نمونه از WordsApi ایجاد کنید
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# نام سند word ورودی
inputFileName = 'source.doc'
# فرمت فایل حاصل
resultantFormat = 'DOCX'
# نام سند حاصل پس از عمل. اگر این پارامتر حذف شود
# سپس فایل حاصل با نام سند ورودی ذخیره می شود
resultantFile = 'Split-File'
# پرچمی که نشان می دهد خروجی فشرده شود یا خیر.
zipOutput = 'false'
# سند ورد منبع را در فضای ذخیرهسازی ابری بارگذاری کنید
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# یک شی برای Split Document ایجاد کنید
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,None, None, zipOutput, None)
# عملیات تقسیم Word را آغاز کنید
result = words_api.split_document(request)
# چاپ پیام در کنسول (اختیاری)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

تصویر 3: - پیش نمایش عملیات تقسیم اسناد.
تقسیم سند بر اساس صفحات انتخاب شده
در این بخش، ما قصد داریم در مورد نحوه تقسیم یک سند بر اساس صفحات انتخاب شده و ذخیره خروجی به عنوان یک آرشیو ZIP صحبت کنیم. قطعه کد تقریباً همان چیزی است که در بالا به اشتراک گذاشته شده است، به جز اینکه ما باید مقدار Page From، Page To و True را برای خروجی بایگانی مشخص کنیم.
try:
# یک نمونه از WordsApi ایجاد کنید
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# نام سند word ورودی
inputFileName = 'source.doc'
# فرمت فایل حاصل
resultantFormat = 'DOCX'
# نام سند حاصل پس از عمل. اگر این پارامتر حذف شود
# سپس فایل حاصل با نام سند ورودی ذخیره می شود
resultantFile = 'SplitOutput'
# پرچم نشان دهنده خروجی باید در آرشیو ZIP باشد.
zipOutput = 'false'
# سند ورد منبع را در فضای ذخیرهسازی ابری بارگذاری کنید
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# یک شی برای Split Document ایجاد کنید
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,pageFrom, pageTo, zipOutput, None)
# عملیات تقسیم Word را آغاز کنید
result = words_api.split_document(request)
# چاپ پیام در کنسول (اختیاری)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

تصویر 4: - پیش نمایش عملیات تقسیم اسناد برای صفحات انتخاب شده.
استخراج صفحات از سند Word با استفاده از دستورات cURL
مانند سایر APIهای REST، Aspose.Words Cloud نیز از طریق دستورات cURL در ترمینال خط فرمان قابل دسترسی است. با این حال، قبل از ادامه، ابتدا باید یک توکن دسترسی JWT بر اساس اعتبار مشتری ایجاد کنیم.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
پس از تولید توکن، لطفاً دستور زیر را برای استخراج صفحات از سند word و ذخیره خروجی در فضای ذخیره سازی ابری اجرا کنید.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>"
نتیجه گیری
در این مقاله، امکان ایجاد یک تقسیمکننده اسناد را بررسی کردهایم که میتواند سند Word را با استفاده از Python SDK به فایلهای صفحه جداگانه تقسیم کند. علاوه بر این، طبق نیاز خود، میتوانید از Python SDK یا استخراج صفحات از سند Word با استفاده از دستورات cURL استفاده کنید. لطفا توجه داشته باشید که ما به رشد و همکاری جمعی اعتقاد داریم. بنابراین، SDK های ما طبق مجوز MIT توسعه یافته اند و کد منبع کامل آنها برای دانلود از طریق Github در دسترس است. در صورت نیاز، می توانید کد را بر اساس نیاز خود دانلود و تغییر دهید. در صورتی که با مشکلی مواجه شدید یا سؤال دیگری دارید، لطفاً از طریق [تالار گفتمان پشتیبانی رایگان محصول12 با ما تماس بگیرید.
مقالات مرتبط
توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: