ضمیمه های PDF را استخراج کنید

فایل PDF از متن و گرافیک تشکیل شده است و ممکن است کل فایل‌های داخل آن‌ها را به‌عنوان پیوست داشته باشد. این امر تبادل مجموعه ای از اسناد را آسان تر و قابل اطمینان تر می کند. پنجره پیوست ها مکانی مرکزی برای مشاهده، درج، حذف و صادرات پیوست ها در اختیار شما قرار می دهد. همچنین لطفاً توجه داشته باشید که اگر فایل PDF را به مکان جدیدی منتقل کنید، پیوست های داخل آن نیز با آن جابجا می شوند. پیوست‌ها ممکن است شامل پیوندهایی به یا از سند اصلی یا سایر پیوست‌ها باشد. لطفا نظرات پیوست را با فایل پیوست اشتباه نگیرید.

در این مقاله، ما قصد داریم جزئیاتی را در مورد چگونگی خواندن اطلاعات مربوط به پیوست‌ها در اسناد PDF و همچنین نحوه دانلود پیوست‌ها از PDF با استفاده از پایتون مورد بحث قرار دهیم. نیازی به دانلود و نصب نرم افزار خاصی نیست و تمامی عملیات مورد نیاز را در فضای ابری انجام دهید.

API پردازش PDF

Aspose.PDF Cloud API مبتنی بر REST ما است که قابلیت‌هایی را برای ایجاد، ویرایش و تبدیل فرمت‌های مختلف به PDF و همچنین ارائه فایل‌های PDF به فرمت‌هایی از جمله XLSX، PPTX، DOCX، EPUB، HTML، [JPEG و موارد دیگر] ارائه می‌کند. با توجه به معماری REST، API در هر پلتفرمی قابل دسترسی است. بنابراین، می توانید قابلیت های پردازش PDF را در برنامه های دسکتاپ، وب، موبایل، ابری و ترکیبی پیاده سازی کنید.

Python SDK برای پردازش PDF

به منظور تسهیل بیشتر مشتریان خود، ما SDK های برنامه نویسی خاصی ایجاد کرده ایم تا شما تمامی قابلیت های پردازش PDF را به زبان دلخواه خود دریافت کنید. به طور مشابه، برای تسهیل توسعه دهندگان پایتون، ما SDK برنامه نویسی پایتون را با نام Aspose.PDF Cloud SDK برای Python ایجاد کرده‌ایم که یک پوشش در اطراف Aspose.PDF Cloud API است. اکنون برای شروع، اولین قدم نصب آن است. SDK برای دانلود رایگان از طریق مخزن PIP و GitHub در دسترس است. اکنون دستور زیر را در ترمینال/خط فرمان اجرا کنید تا آخرین نسخه SDK روی سیستم نصب شود.

pip install asposepdfcloud

PyCharm IDE

اگر از PyCharm IDE استفاده می کنید، می توانید مستقیماً SDK را به عنوان یک وابستگی در پروژه خود اضافه کنید.

فایل ->تنظیمات ->پروژه ->مترجم پایتون ->asposepdfcloud

کپشن

Image 1:- PyCharm settings option.

بسته پایتون Aspose.PDF

تصویر 2: - بسته Aspose.Pdf Cloud Python.

حساب داشبورد ابری رایگان

پس از نصب، گام مهم بعدی اشتراک رایگان خدمات ابری ما از طریق Aspose.Cloud dashboard است. هدف از این اشتراک این است که فقط به افراد مجاز اجازه دسترسی به خدمات پردازش فایل ما را بدهد. اگر حساب GitHub یا Google دارید، به سادگی ثبت نام کنید یا روی دکمه Create a new Account کلیک کنید و اطلاعات مورد نیاز را ارائه دهید. اکنون با استفاده از اعتبارنامه وارد داشبورد شوید و بخش Applications را از داشبورد گسترش دهید و به سمت پایین به سمت قسمت Client Credentials حرکت کنید تا Client ID و Client Secret را ببینید.

اعتبار مشتری

تصویر 3: - اعتبار مشتری در Aspose.Cloud Dashboard.

اطلاعات پیوست ها را از PDF بخوانید

لطفاً دستورالعمل‌های زیر را برای خواندن اطلاعات پیوست‌ها در سند PDF دنبال کنید.

  • ابتدا باید یک نمونه از کلاس ApiClient ایجاد کنیم و در عین حال Client ID Client Secret را به عنوان آرگومان ارائه کنیم.
  • در مرحله دوم، یک نمونه از کلاس PdfApi ایجاد کنید که شی ApiClient را به عنوان آرگومان ورودی دریافت کند.
  • اکنون روش getdocumentattachments(…) PdfApi را برای واکشی جزئیات پیوست PDF فراخوانی کنید.
def readAttachmentDetails():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # هنگام ارسال PdfApiClient به عنوان آرگومان، نمونه PdfApi ایجاد کنید
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # برای استخراج جزئیات پیوست با API تماس بگیرید
        response = pdf_api.get_document_attachments(name = input_file)
        print(response)
        # چاپ پیام در کنسول (اختیاری)
        print('PDF Attachment details successfully retrieved !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

برای مرجع شما، نمونه سند PDF مورد استفاده در مثال بالا را می توان از PdfWithEmbeddedFiles.pdf دانلود کرد.

اطلاعات پیوست خاص را بخوانید

API همچنین ما را برای خواندن اطلاعات پیوست های خاص در سند PDF تسهیل می کند. برای این منظور، لطفا از روش GetDocumentAttachmentByIndex استفاده کنید. لطفاً جزئیات اولین پیوست بازیابی شده را در زیر مشاهده کنید.

{'attachment': {'check_sum': '33DCE2EE8BD095A3C4E2A67058104D35',
                'creation_date': '11/24/2008 02:02:36.000 PM',
                'description': None,
                'links': [{'href': '/PdfWithEmbeddedFiles.pdf/attachments/1',
                           'rel': 'self',
                           'title': None,
                           'type': None}],
                'mime_type': 'application/pdf',
                'modification_date': '05/03/2007 10:37:41.000 AM',
                'name': 'example1.pdf',
                'size': 10984},
 'code': 200,
 'status': 'OK'}

ضمیمه خاص را از PDF دانلود کنید

لطفاً دستورالعمل‌های مشخص‌شده در زیر را برای دانلود پیوست‌های خاص از سند PDF دنبال کنید.

  • ابتدا باید یک نمونه از کلاس ApiClient ایجاد کنیم و در عین حال Client ID Client Secret را به عنوان آرگومان ارائه کنیم.
  • در مرحله دوم، یک نمونه از کلاس PdfApi ایجاد کنید که شی ApiClient را به عنوان آرگومان ورودی دریافت کند.
  • اکنون برای دانلود پیوست از فایل PDF، روش GetDownloadDocumentAttachmentByIndex(…) را فراخوانی کنید.
def downloadAttachment():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # هنگام ارسال PdfApiClient به عنوان آرگومان، نمونه PdfApi ایجاد کنید
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'PdfWithEmbeddedFiles.pdf'
        
        # برای دانلود اولین پیوست از فایل PDF با API تماس بگیرید
        response = pdf_api.get_download_document_attachment_by_index(name = input_file, attachment_index=1)
        print(response)
        # چاپ پیام در کنسول (اختیاری)
        print('PDF Attachment successfully downloaded !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

اطلاعات پیوست را با استفاده از دستور cURL بخوانید

API های REST به راحتی از طریق دستورات cURL قابل دسترسی هستند و ما می توانیم از یک برنامه ترمینال ساده برای اجرای آنها استفاده کنیم. از آنجایی که Aspose.PDF Cloud بر اساس معماری REST توسعه یافته است، ما همچنین می توانیم از طریق دستورات cURL به آنها دسترسی داشته باشیم. با این حال، به‌عنوان پیش‌نیاز، باید یک توکن وب JSON (JWT) را بر اساس اعتبار مشتری شخصی شما که روی داشبورد Aspose.Cloud مشخص شده است، ایجاد کنیم. اجباری است زیرا API های ما فقط برای کاربران ثبت نام شده قابل دسترسی است. لطفا دستور زیر را برای تولید توکن JWT اجرا کنید.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

اکنون که توکن JWT را داریم، می‌توانیم دستور زیر را برای واکشی 7 اطلاعات پیوست‌های خاص از اسناد PDF اجرا کنیم.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/1" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

با استفاده از دستور cURL، پیوست خاص را دانلود کنید

لطفاً دستور زیر را برای دانلود ضمیمه دوم فایل PDF و ذخیره آن در درایو محلی اجرا کنید.

curl -v -X GET "https://api.aspose.cloud/v3.0/pdf/PdfWithEmbeddedFiles.pdf/attachments/2/download" \
-H  "accept: multipart/form-data" \
-H  "authorization: Bearer <JWT Token>" \
-o Attachment.txt

نتیجه گیری

در این مقاله جزئیات و مراحل نحوه خواندن و دانلود فایل های پیوست از اسناد PDF توضیح داده شده است. ما مراحل را با استفاده از قطعه کد پایتون و همچنین استفاده از دستورات cURL بررسی کرده ایم. جدا از پردازش پیوست‌ها، API همچنین ویژگی‌های فراوانی را در رابطه با سایر عناصر فایل‌های PDF ارائه می‌کند و جزئیات آنها را می‌توان در [راهنمای توسعه‌دهنده18 یافت. علاوه بر این، کد منبع کامل Aspose.PDF Cloud SDK برای پایتون برای دانلود از طریق GitHub در دسترس قرار گرفته است. اگر هنگام استفاده از API با مشکلی مواجه شدید یا سؤالات دیگری دارید، لطفاً از طریق [تالار گفتمان پشتیبانی رایگان محصول] با ما تماس بگیرید.

مقالات مرتبط

همچنین توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: