استخراج تصاویر از PDF

PDF به طور گسترده برای ذخیره و به اشتراک گذاری انواع مختلف اسناد، از جمله گزارش ها، ارائه ها و بروشورها استفاده می شود. با این حال، وقتی نوبت به استخراج تصاویر از این فایل‌ها می‌رسد، این فرآیند می‌تواند زمان‌بر و دست و پا گیر باشد. این که آیا شما نیاز به استخراج تصاویر برای ویرایش بیشتر، تجزیه و تحلیل یا گنجاندن در پروژه های خود دارید، داشتن یک رویکرد قابل اعتماد و کارآمد بسیار مهم است. بنابراین، استفاده از قابلیت‌های یک SDK برنامه‌نویسی می‌تواند فرآیند استخراج تصویر را ساده‌تر کند و در زمان و تلاش ارزشمند صرفه‌جویی کند. اکنون در این مقاله، جزئیات نحوه استخراج تصاویر از فایل‌های PDF با استفاده از Python Cloud SDK و باز کردن سطح کاملاً جدیدی از بهره‌وری و راحتی را بررسی خواهیم کرد.

PDF Processing Cloud SDK

هنگامی که صحبت از استخراج تصاویر از فایل های PDF با استفاده از پایتون می شود، Aspose.PDF Cloud API یک ابزار قدرتمند و همه کاره است. با Aspose.PDF Cloud SDK for Python، می‌توانید نه تنها تصاویر را از PDF استخراج کنید، بلکه می‌توانید کارهای مختلف دیگری مانند تبدیل PDF به فرمت‌های مختلف، اضافه کردن حاشیه‌نویسی، ادغام یا تقسیم اسناد PDF و موارد دیگر را انجام دهید. علاوه بر این، SDK مجموعه ای جامع از API ها را ارائه می دهد که به شما امکان می دهد فایل های PDF را به صورت برنامه ریزی شده دستکاری کنید و در زمان و تلاش شما صرفه جویی کنید.

اکنون، برای نصب SDK، لطفاً آن را از مخزن PIP یا GitHub دانلود کنید. بنابراین، لطفا دستور زیر را در ترمینال/خط فرمان اجرا کنید تا آخرین نسخه SDK را روی سیستم نصب کنید.

 pip install asposepdfcloud

PyCharm IDE

اگر از PyCharm IDE استفاده می کنید، می توانید مستقیماً SDK را به عنوان یک وابستگی در پروژه خود اضافه کنید.

فایل ->تنظیمات ->پروژه ->مترجم پایتون ->asposepdfcloud

تنظیمات PyCharm

تصویر 1: - گزینه تنظیمات PyCharm.

بسته پایتون Aspose.PDF

تصویر 2: - بسته Aspose.PDF Cloud Python.

گام مهم دیگر ایجاد یک حساب کاربری رایگان از طریق داشبورد ابری با استفاده از GitHub یا حساب Google است. یا روی دکمه [ایجاد یک حساب جدید] کلیک کنید و اطلاعات مورد نیاز را ارائه دهید و اعتبار مشتری شخصی خود را دریافت کنید.

Client credentials

Image 3:- Client Credentials on Cloud dashboard.

استخراج تصاویر از PDF در پایتون

لطفاً مراحل زیر را برای استخراج تصاویر از اسناد PDF با فرمت JPEG دنبال کنید و آنها را در پوشه ذخیره سازی ابری ذخیره کنید.

  • ابتدا یک نمونه از کلاس ApiClient ایجاد کنید و در عین حال Client ID Client Secret را به عنوان آرگومان ارائه دهید.
  • در مرحله دوم، یک نمونه از کلاس PdfApi ایجاد کنید که شی ApiClient را به عنوان آرگومان می گیرد.
  • اکنون، روش putimagesextractasjpeg(…) را فراخوانی کنید که نام PDF ورودی، شماره صفحه PDF مربوطه و یک پارامتر اختیاری را که پوشه هدف را برای ذخیره تصاویر استخراج شده مشخص می کند، می گیرد.
def extractImages():
    try:
        #Client credentials
        client_secret = "1c9379bb7d701c26cc87e741a29987bb"
        client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # هنگام ارسال PdfApiClient به عنوان آرگومان، نمونه PdfApi ایجاد کنید
        pdf_api = PdfApi(pdf_api_client)

        #source image file
        input_file = 'URL2PDF.pdf'

        # فراخوانی API برای استخراج تصاویر به صورت JPEG و ذخیره آنها در پوشه ExtractedImages در فضای ذخیره سازی ابری
        response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
        
        print(response)
        # چاپ پیام در کنسول (اختیاری)
        print('Images successfully extracted from PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)

API همچنین از دو پارامتر اختیاری برای تعیین عرض و ارتفاع برای تصاویر استخراج شده پشتیبانی می کند.

عنوان

Image 4:- Preview of extracted images.

در صورت نیاز به استخراج تصاویر در فرمت های دیگر، می توانید از API های زیر استفاده کنید:

تصاویر PDF را با استفاده از دستور cURL دانلود کنید

استخراج تصاویر از فایل های PDF نیز با استفاده از Aspose.PDF Cloud API با دستورات cURL امکان پذیر است. با استفاده از دستورات cURL، می‌توانید درخواست‌های HTTP را به نقاط انتهایی API ارسال کنید و به راحتی تصاویر را از PDF استخراج کنید. این رویکرد انعطاف پذیری و راحتی را فراهم می کند، زیرا می توانید عملکرد استخراج تصویر را مستقیماً در اسکریپت ها یا برنامه های خود ادغام کنید. علاوه بر این، شما همچنین می توانید از طریق ترمینال خط فرمان در هر پلتفرمی مانند ویندوز، لینوکس، macOS یا سایر سیستم عامل ها، به API های REST دسترسی داشته باشید.

در این قسمت قصد داریم از دستورات cURL برای استخراج تصاویر با فرمت PNG استفاده کنیم و خروجی را در فضای ذخیره سازی ابری ذخیره کنیم. بنابراین، اولین قدم این است که با اجرای دستور زیر، یک JSON Web Token (JWT) تولید کنید.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

اکنون لطفا دستور زیر را اجرا کنید تا تصاویر فقط از صفحه سوم سند PDF استخراج شوند. تصاویر با فرمت PNG استخراج می شوند.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H  "Accept: application/json" \
-H  "authorization: Bearer <JWT Token>" \
-d{}

نمونه فایل PDF استفاده شده در مثال بالا را می توان از URL2PDF.pdf دانلود کرد.

نتیجه گیری

در پایان، استخراج تصاویر از فایل‌های PDF یک قابلیت ارزشمند است که می‌توان با استفاده از Aspose.PDF Cloud SDK برای Python و دستورات cURL به آن دست یافت. چه راحتی و سادگی برنامه نویسی پایتون را ترجیح دهید یا تطبیق پذیری دستورات cURL، Aspose.PDF Cloud یک API قوی برای انجام این کار ارائه می دهد. با استفاده از قدرت ابر، می توانید تصاویر را از اسناد PDF به راحتی استخراج کنید و گردش کار خود را بهبود بخشید. با این وجود، با Aspose.PDF Cloud، شما این قابلیت را دارید که رویکردی را انتخاب کنید که به بهترین شکل با نیازهای شما مطابقت دارد و عملکرد استخراج تصویر را به طور یکپارچه در پروژه های خود ادغام کنید.

منابع مفید

مقالات مرتبط

همچنین توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: