یک روش سریع و آسان برای استخراج صفحات از اسناد word با استفاده از Python SDK.

سند کلمه تقسیم

سند کلمه تقسیم | صفحات را از سند Word به عنوان یک فایل جداگانه استخراج کنید

در حوزه مدیریت اسناد، اغلب نیاز به تقسیم، جداسازی یا استخراج بخش های خاصی از یک سند Word وجود دارد. چه با مقالات تحقیقاتی گسترده، گزارش‌های جامع یا دست‌نوشته‌های طولانی سروکار داشته باشید، وظیفه تقسیم آنها به بخش‌های قابل مدیریت‌تر می‌تواند زمان‌بر و چالش‌برانگیز باشد. در این مقاله، ما مراحل دستیابی به این نیاز را با Python Cloud SDK بررسی خواهیم کرد، که به شما امکان می دهد وظایف مدیریت اسناد خود را ساده کنید و کارآمدتر کار کنید.

API پردازش کلمه

Aspose.Words Cloud راه حل اختصاصی ما برای پردازش MS Word (DOCX، DOC، DOT، RTF، DOCM) یا OpenDocument (ODT، OTT) است. هیچ نرم افزار شخص ثالث یا اتوماسیون MS Office برای پردازش اسناد Word لازم نیست. به سادگی با REST APIها تماس بگیرید تا نیازهای خود را برآورده کنید. از آنجایی که APIها مبتنی بر REST هستند، بنابراین می‌توانید در هر پلتفرمی از جمله دسک‌تاپ، وب، اپلیکیشن موبایل و غیره به آن‌ها دسترسی داشته باشید. اکنون طبق محدوده این مقاله، می‌خواهیم جزئیات نحوه تقسیم صفحات در یک فایل word را به عنوان یک سند word جداگانه مورد بحث قرار دهیم. API همچنین انعطاف پذیری برای سفارشی کردن عملیات تقسیم را فراهم می کند، یعنی هر صفحه را، فرد و زوج، بر اساس تعداد صفحات، بر اساس محدوده صفحه تقسیم کنید.

به منظور تسهیل بیشتر مشتریان خود، Aspose.Words Cloud SDK for Python را ایجاد کرده‌ایم که یک پوشش در اطراف Cloud API است، بنابراین می‌توانید از تمام مزایای پردازش اسناد Word در زبان برنامه‌نویسی مورد علاقه خود بهره ببرید. بنابراین قبل از ادامه، اولین مرحله نصب SDK در سیستم محلی است. برای دانلود در PIP و GitHub در دسترس است. برای نصب SDK دستور زیر را در ترمینال خط فرمان اجرا کنید:

pip install aspose-words-cloud

در صورتی که از ویژوال استودیو به عنوان IDE استفاده می کنید، می توانید مستقیماً مرجع SDK را به پروژه اضافه کنید.

روی گزینه View ->Other Windows ->Python Environments کلیک کنید. همانطور که در زیر نشان داده شده است.

گزینه منوی Python Environment.

تصویر 1: - گزینه منوی Python Environment.

aspose-word-cloud را در قسمت Packages در پنجره Python Environments وارد کنید. سپس روی پیوند Install aspose-word-cloud (21.11.0) کلیک کنید. شماره نسخه ممکن است بسته به آخرین/نسخه نسخه فعلی تغییر کند. تصویر زیر را ببینید.

بسته aspose-words-cloud python

تصویر 2: - بسته aspose-words-cloud python.

تقسیم صفحات در سند ورد با استفاده از پایتون

لطفاً دستورالعمل‌های زیر را دنبال کنید تا همه صفحات را در یک سند word تقسیم کنید که از قبل در فضای ذخیره‌سازی ابری موجود است.

  • ابتدا، ما باید یک شی از WordsApi را مقداردهی اولیه کنیم، در حالی که Client ID و Client Secret را به عنوان آرگومان ارسال می کنیم.
  • در مرحله دوم، نام فایل ورد ورودی، فرمت خروجی حاصل، نام فایل حاصل و پارامتر را مشخص کنید تا خروجی بایگانی شود.
  • با استفاده از شی UploadFileRequest، سند Word ورودی را در فضای ذخیره سازی ابری آپلود کنید.
  • حال یک نمونه از SplitDocumentRequest را در حین انتقال جزئیات تعریف شده در مرحله دوم ایجاد کنید.
  • در نهایت متد splitdocument(…) کلاس WordsApi را برای تقسیم اسناد word فراخوانی کنید. فایل های حاصل در فضای ذخیره سازی ابری نقشه برداری شده ذخیره می شوند.
try:
        # یک نمونه از WordsApi ایجاد کنید
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # نام سند word ورودی
        inputFileName = 'source.doc'
        # فرمت فایل حاصل
        resultantFormat = 'DOCX'
        # نام سند حاصل پس از عمل. اگر این پارامتر حذف شود
        # سپس فایل حاصل با نام سند ورودی ذخیره می شود
        resultantFile = 'Split-File'
        # پرچمی که نشان می دهد خروجی فشرده شود یا خیر.
        zipOutput = 'false'

        # سند ورد منبع را در فضای ذخیره‌سازی ابری بارگذاری کنید
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # یک شی برای Split Document ایجاد کنید
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,None, None, zipOutput, None)
        # عملیات تقسیم Word را آغاز کنید
        result = words_api.split_document(request)
        
        # چاپ پیام در کنسول (اختیاری)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
پیش نمایش عملیات تقسیم اسناد

تصویر 3: - پیش نمایش عملیات تقسیم اسناد.

تقسیم سند بر اساس صفحات انتخاب شده

در این بخش، ما قصد داریم در مورد نحوه تقسیم یک سند بر اساس صفحات انتخاب شده و ذخیره خروجی به عنوان یک آرشیو ZIP صحبت کنیم. قطعه کد تقریباً همان چیزی است که در بالا به اشتراک گذاشته شده است، به جز اینکه ما باید مقدار Page From، Page To و True را برای خروجی بایگانی مشخص کنیم.

try:
        # یک نمونه از WordsApi ایجاد کنید
        words_api = WordsApi("88d1cda8-b12c-4a80-b1ad-c85ac483c5c5","406b404b2df649611e508bbcfcd2a77f")

        # نام سند word ورودی
        inputFileName = 'source.doc'
        # فرمت فایل حاصل
        resultantFormat = 'DOCX'
        # نام سند حاصل پس از عمل. اگر این پارامتر حذف شود
        # سپس فایل حاصل با نام سند ورودی ذخیره می شود
        resultantFile = 'SplitOutput'
        # پرچم نشان دهنده خروجی باید در آرشیو ZIP باشد.
        zipOutput = 'false'

        # سند ورد منبع را در فضای ذخیره‌سازی ابری بارگذاری کنید
        words_api.upload_file(asposewordscloud.models.requests.UploadFileRequest(open('C:\\Users\\Downloads\\'+inputFileName, 'rb'), "", None))

        # یک شی برای Split Document ایجاد کنید
        request = asposewordscloud.models.requests.SplitDocumentRequest(inputFileName, resultantFormat, None, None, None,
                                                                                    None, resultantFile,pageFrom, pageTo, zipOutput, None)
        # عملیات تقسیم Word را آغاز کنید
        result = words_api.split_document(request)
        
        # چاپ پیام در کنسول (اختیاری)
        print('Document Split process completed successfully !')    
    except ApiException as e:
        print("Exception while calling WordsApi: {0}".format(e))
خروجی تقسیم سند

تصویر 4: - پیش نمایش عملیات تقسیم اسناد برای صفحات انتخاب شده.

استخراج صفحات از سند Word با استفاده از دستورات cURL

مانند سایر APIهای REST، Aspose.Words Cloud نیز از طریق دستورات cURL در ترمینال خط فرمان قابل دسترسی است. با این حال، قبل از ادامه، ابتدا باید یک توکن دسترسی JWT بر اساس اعتبار مشتری ایجاد کنیم.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

پس از تولید توکن، لطفاً دستور زیر را برای استخراج صفحات از سند word و ذخیره خروجی در فضای ذخیره سازی ابری اجرا کنید.

curl -v -X PUT "https://api.aspose.cloud/v4.0/words/source.doc/split?format=DOCX&destFileName=Split-File&from=2&to=4&zipOutput=false" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>"

نتیجه گیری

در این مقاله، امکان ایجاد یک تقسیم‌کننده اسناد را بررسی کرده‌ایم که می‌تواند سند Word را با استفاده از Python SDK به فایل‌های صفحه جداگانه تقسیم کند. علاوه بر این، طبق نیاز خود، می‌توانید از Python SDK یا استخراج صفحات از سند Word با استفاده از دستورات cURL استفاده کنید. لطفا توجه داشته باشید که ما به رشد و همکاری جمعی اعتقاد داریم. بنابراین، SDK های ما طبق مجوز MIT توسعه یافته اند و کد منبع کامل آنها برای دانلود از طریق Github در دسترس است. در صورت نیاز، می توانید کد را بر اساس نیاز خود دانلود و تغییر دهید. در صورتی که با مشکلی مواجه شدید یا سؤال دیگری دارید، لطفاً از طریق [تالار گفتمان پشتیبانی رایگان محصول12 با ما تماس بگیرید.

مقالات مرتبط

توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: