طريقة سريعة وسهلة لاستخراج الصفحات من مستندات Word باستخدام Python SDK.

تقسيم مستند Word | استخراج الصفحات من مستند Word كملف منفصل
في مجال إدارة المستندات، غالبًا ما تنشأ الحاجة إلى تقسيم أو فصل أو استخراج أقسام معينة من مستند Word. سواء كنت تتعامل مع أوراق بحثية مطولة أو تقارير شاملة أو مخطوطات طويلة، فإن مهمة تقسيمها إلى أجزاء أكثر قابلية للإدارة يمكن أن تكون مستهلكة للوقت وتشكل تحديًا. في هذه المقالة، سنستكشف الخطوات اللازمة لتحقيق هذا المطلب باستخدام Python Cloud SDK، مما يسمح لك بتبسيط مهام إدارة المستندات والعمل بكفاءة أكبر.
- واجهة برمجة تطبيقات معالجة الكلمات
- تقسيم الصفحات في مستند Word باستخدام Python
- تقسيم المستند بناءً على الصفحات المحددة
- استخراج الصفحات من مستند Word باستخدام أوامر cURL
واجهة برمجة تطبيقات معالجة الكلمات
Aspose.Words Cloud هو الحل المخصص لدينا لمعالجة MS Word (DOCX، DOC، DOT، RTF، DOCM) أو OpenDocument (ODT، OTT).لا يلزم وجود برنامج تابع لجهة خارجية أو أتمتة MS Office لمعالجة مستندات Word. ما عليك سوى استدعاء واجهات برمجة تطبيقات REST لإنجاز متطلباتك. نظرًا لأن واجهات برمجة التطبيقات تعتمد على REST، فيمكنك الوصول إليها على أي منصة بما في ذلك سطح المكتب والويب وتطبيق الهاتف المحمول وما إلى ذلك. الآن وفقًا لنطاق هذه المقالة، سنناقش تفاصيل كيفية تقسيم الصفحات في ملف Word كمستند Word فردي. توفر واجهة برمجة التطبيقات أيضًا المرونة لتخصيص عملية التقسيم أي تقسيم كل صفحة، فردية وزوجية، حسب عدد الصفحات، حسب نطاق الصفحات.
من أجل تسهيل الأمور على عملائنا، قمنا بإنشاء Aspose.Words Cloud SDK for Python، وهو عبارة عن غلاف حول Cloud API، حتى تتمكن من الاستفادة من جميع مزايا معالجة مستندات Word ضمن لغة البرمجة المفضلة لديك. لذا قبل المتابعة، فإن الخطوة الأولى هي تثبيت SDK على النظام المحلي. وهي متاحة للتنزيل على PIP وGitHub. قم بتنفيذ الأمر التالي على محطة سطر الأوامر لتثبيت SDK:
pip install aspose-words-cloud
في حالة استخدام Visual Studio كـ IDE، يمكنك إضافة مرجع SDK مباشرة في المشروع.
انقر فوق عرض ->نوافذ أخرى ->خيار بيئات بايثون. كما هو موضح أدناه.

الصورة 1:- خيار قائمة بيئة Python.
أدخل aspose-word-cloud ضمن حقل الحزم في نافذة بيئات Python. ثم انقر فوق رابط تثبيت aspose-word-cloud (21.11.0).قد يتغير رقم الإصدار وفقًا لأحدث إصدار/إصدار حالي. انظر الصورة أدناه.

الصورة 2:- حزمة aspose-words-cloud python.
تقسيم الصفحات في مستند Word باستخدام Python
يرجى اتباع التعليمات أدناه لتقسيم جميع الصفحات في مستند Word المتوفر بالفعل في التخزين السحابي.
- أولاً، نحتاج إلى تهيئة كائن WordsApi أثناء تمرير معرف العميل والسر الخاص بالعميل كوسائط.
- ثانياً، قم بتحديد اسم ملف Word المدخل، وتنسيق الإخراج الناتج، واسم الملف الناتج، والمعلمة لضغط الإخراج.
- قم بتحميل مستند Word المدخل إلى التخزين السحابي باستخدام كائن UploadFileRequest.
- الآن قم بإنشاء مثيل لـ SplitDocumentRequest أثناء تمرير التفاصيل المحددة في الخطوة الثانية.
- أخيرًا، قم باستدعاء طريقة splitdocument(…) من فئة WordsApi لتقسيم مستندات Word. يتم حفظ الملفات الناتجة في تخزين سحابي مُخصص.
try:
# إنشاء مثيل لـ WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# اسم مستند الوورد المدخل
inputFileName = 'source.doc'
# تنسيق الملف الناتج
resultantFormat = 'DOCX'
# اسم المستند الناتج بعد العملية. إذا تم حذف هذه المعلمة
# ثم سيتم حفظ الملف الناتج باسم المستند المدخل
resultantFile = 'Split-File'
# العلم الذي يشير إلى ما إذا كان سيتم ضغط الناتج.
zipOutput = 'false'
# تحميل مستند Word المصدر إلى التخزين السحابي
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# إنشاء كائن لتقسيم المستند
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,None, None, zipOutput, None)
# بدء عملية تقسيم الكلمة
result = words_api.split_document(request)
# طباعة الرسالة في وحدة التحكم (اختياري)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

الصورة 3:- معاينة عملية تقسيم المستند.
تقسيم المستند بناءً على الصفحات المحددة
في هذا القسم، سنناقش التفاصيل حول كيفية تقسيم مستند بناءً على صفحات محددة وحفظ الناتج كأرشيف ZIP. مقتطف التعليمات البرمجية هو نفسه تقريبًا كما تمت مشاركته أعلاه باستثناء أننا نحتاج إلى تحديد قيمة “الصفحة من” و"الصفحة إلى" و"القيمة الحقيقية" للناتج المراد أرشفته.
try:
# إنشاء مثيل لـ WordsApi
words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")
# اسم مستند الوورد المدخل
inputFileName = 'source.doc'
# تنسيق الملف الناتج
resultantFormat = 'DOCX'
# اسم المستند الناتج بعد العملية. إذا تم حذف هذه المعلمة
# ثم سيتم حفظ الملف الناتج باسم المستند المدخل
resultantFile = 'SplitOutput'
# يجب أن يكون العلم الذي يشير إلى الإخراج في أرشيف ZIP.
zipOutput = 'false'
# تحميل مستند Word المصدر إلى التخزين السحابي
words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))
# إنشاء كائن لتقسيم المستند
request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
None, resultantFile,pageFrom, pageTo, zipOutput, None)
# بدء عملية تقسيم الكلمة
result = words_api.split_document(request)
# طباعة الرسالة في وحدة التحكم (اختياري)
print('Document Split process completed successfully !')
except ApiException as e:
print("Exception while calling WordsApi: {0}".format(e))

الصورة 4:- معاينة عملية تقسيم المستند للصفحات المحددة.
استخراج الصفحات من مستند Word باستخدام أوامر cURL
مثل واجهات برمجة تطبيقات REST الأخرى، يمكن أيضًا الوصول إلى Aspose.Words Cloud عبر أوامر cURL داخل محطة سطر الأوامر. ومع ذلك، قبل المتابعة، نحتاج أولاً إلى إنشاء رمز وصول JWT استنادًا إلى بيانات اعتماد العميل.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
بمجرد إنشاء الرمز، يرجى تنفيذ الأمر التالي لاستخراج الصفحات من مستند Word وحفظ الناتج في التخزين السحابي.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>"
خاتمة
في هذه المقالة، استكشفنا إمكانية إنشاء أداة تقسيم مستندات يمكنها تقسيم مستند Word إلى ملفات صفحات فردية باستخدام Python SDK. علاوة على ذلك، وفقًا لمتطلباتك، يمكنك استخدام Python SDK أو استخراج الصفحات من مستند Word باستخدام أوامر cURL. يرجى ملاحظة أننا نؤمن بالنمو الجماعي والتعاون. لذلك، تم تطوير حزم SDK الخاصة بنا وفقًا لترخيص MIT ويتوفر كود المصدر الكامل للتنزيل عبر Github. إذا كنت بحاجة، فيمكنك تنزيل الكود وتعديله وفقًا لمتطلباتك. في حالة مواجهة أي مشكلات أو وجود أي استفسارات أخرى، فلا تتردد في الاتصال بنا عبر منتدى دعم المنتج المجاني.
مقالات ذات صلة
ننصحك بزيارة الروابط التالية لمعرفة المزيد عن: