
PDF به طور گسترده برای ذخیره و به اشتراک گذاری انواع مختلف اسناد، از جمله گزارش ها، ارائه ها و بروشورها استفاده می شود. با این حال، وقتی نوبت به استخراج تصاویر از این فایلها میرسد، این فرآیند میتواند زمانبر و دست و پا گیر باشد. این که آیا شما نیاز به استخراج تصاویر برای ویرایش بیشتر، تجزیه و تحلیل یا گنجاندن در پروژه های خود دارید، داشتن یک رویکرد قابل اعتماد و کارآمد بسیار مهم است. بنابراین، استفاده از قابلیتهای یک SDK برنامهنویسی میتواند فرآیند استخراج تصویر را سادهتر کند و در زمان و تلاش ارزشمند صرفهجویی کند. اکنون در این مقاله، جزئیات نحوه استخراج تصاویر از فایلهای PDF با استفاده از Python Cloud SDK و باز کردن سطح کاملاً جدیدی از بهرهوری و راحتی را بررسی خواهیم کرد.
- PDF Processing Cloud SDK
- استخراج تصاویر از PDF در پایتون
- تصاویر PDF را با استفاده از دستور cURL دانلود کنید
PDF Processing Cloud SDK
هنگامی که صحبت از استخراج تصاویر از فایل های PDF با استفاده از پایتون می شود، Aspose.PDF Cloud API یک ابزار قدرتمند و همه کاره است. با Aspose.PDF Cloud SDK for Python، میتوانید نه تنها تصاویر را از PDF استخراج کنید، بلکه میتوانید کارهای مختلف دیگری مانند تبدیل PDF به فرمتهای مختلف، اضافه کردن حاشیهنویسی، ادغام یا تقسیم اسناد PDF و موارد دیگر را انجام دهید. علاوه بر این، SDK مجموعه ای جامع از API ها را ارائه می دهد که به شما امکان می دهد فایل های PDF را به صورت برنامه ریزی شده دستکاری کنید و در زمان و تلاش شما صرفه جویی کنید.
اکنون، برای نصب SDK، لطفاً آن را از مخزن PIP یا GitHub دانلود کنید. بنابراین، لطفا دستور زیر را در ترمینال/خط فرمان اجرا کنید تا آخرین نسخه SDK را روی سیستم نصب کنید.
pip install asposepdfcloud
PyCharm IDE
اگر از PyCharm IDE استفاده می کنید، می توانید مستقیماً SDK را به عنوان یک وابستگی در پروژه خود اضافه کنید.
فایل ->تنظیمات ->پروژه ->مترجم پایتون ->asposepdfcloud

تصویر 1: - گزینه تنظیمات PyCharm.

تصویر 2: - بسته Aspose.PDF Cloud Python.
گام مهم دیگر ایجاد یک حساب کاربری رایگان از طریق داشبورد ابری با استفاده از GitHub یا حساب Google است. یا روی دکمه [ایجاد یک حساب جدید] کلیک کنید و اطلاعات مورد نیاز را ارائه دهید و اعتبار مشتری شخصی خود را دریافت کنید.

Image 3:- Client Credentials on Cloud dashboard.
استخراج تصاویر از PDF در پایتون
لطفاً مراحل زیر را برای استخراج تصاویر از اسناد PDF با فرمت JPEG دنبال کنید و آنها را در پوشه ذخیره سازی ابری ذخیره کنید.
- ابتدا یک نمونه از کلاس ApiClient ایجاد کنید و در عین حال Client ID Client Secret را به عنوان آرگومان ارائه دهید.
- در مرحله دوم، یک نمونه از کلاس PdfApi ایجاد کنید که شی ApiClient را به عنوان آرگومان می گیرد.
- اکنون، روش putimagesextractasjpeg(…) را فراخوانی کنید که نام PDF ورودی، شماره صفحه PDF مربوطه و یک پارامتر اختیاری را که پوشه هدف را برای ذخیره تصاویر استخراج شده مشخص می کند، می گیرد.
def extractImages():
try:
#Client credentials
client_secret = "1c9379bb7d701c26cc87e741a29987bb"
client_id = "bbf94a2c-6d7e-4020-b4d2-b9809741374e"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# هنگام ارسال PdfApiClient به عنوان آرگومان، نمونه PdfApi ایجاد کنید
pdf_api = PdfApi(pdf_api_client)
#source image file
input_file = 'URL2PDF.pdf'
# فراخوانی API برای استخراج تصاویر به صورت JPEG و ذخیره آنها در پوشه ExtractedImages در فضای ذخیره سازی ابری
response = pdf_api.put_images_extract_as_jpeg(name = input_file, page_number= 3, dest_folder = 'ExtractedImages')
print(response)
# چاپ پیام در کنسول (اختیاری)
print('Images successfully extracted from PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
API همچنین از دو پارامتر اختیاری برای تعیین عرض و ارتفاع برای تصاویر استخراج شده پشتیبانی می کند.

Image 4:- Preview of extracted images.
در صورت نیاز به استخراج تصاویر در فرمت های دیگر، می توانید از API های زیر استفاده کنید:
- PutImagesExtractAsTiff - استخراج تصاویر سند در قالب TIFF
- PutImagesExtractAsGif - استخراج تصاویر سند در قالب GIF
- PutImagesExtractAsPng - استخراج تصاویر سند با فرمت PNG
تصاویر PDF را با استفاده از دستور cURL دانلود کنید
استخراج تصاویر از فایل های PDF نیز با استفاده از Aspose.PDF Cloud API با دستورات cURL امکان پذیر است. با استفاده از دستورات cURL، میتوانید درخواستهای HTTP را به نقاط انتهایی API ارسال کنید و به راحتی تصاویر را از PDF استخراج کنید. این رویکرد انعطاف پذیری و راحتی را فراهم می کند، زیرا می توانید عملکرد استخراج تصویر را مستقیماً در اسکریپت ها یا برنامه های خود ادغام کنید. علاوه بر این، شما همچنین می توانید از طریق ترمینال خط فرمان در هر پلتفرمی مانند ویندوز، لینوکس، macOS یا سایر سیستم عامل ها، به API های REST دسترسی داشته باشید.
در این قسمت قصد داریم از دستورات cURL برای استخراج تصاویر با فرمت PNG استفاده کنیم و خروجی را در فضای ذخیره سازی ابری ذخیره کنیم. بنابراین، اولین قدم این است که با اجرای دستور زیر، یک JSON Web Token (JWT) تولید کنید.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
اکنون لطفا دستور زیر را اجرا کنید تا تصاویر فقط از صفحه سوم سند PDF استخراج شوند. تصاویر با فرمت PNG استخراج می شوند.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/URL2PDF.pdf/pages/3/images/extract/png?width=0&height=0&destFolder=ExtractedImages" \
-H "Accept: application/json" \
-H "authorization: Bearer <JWT Token>" \
-d{}
نمونه فایل PDF استفاده شده در مثال بالا را می توان از URL2PDF.pdf دانلود کرد.
نتیجه گیری
در پایان، استخراج تصاویر از فایلهای PDF یک قابلیت ارزشمند است که میتوان با استفاده از Aspose.PDF Cloud SDK برای Python و دستورات cURL به آن دست یافت. چه راحتی و سادگی برنامه نویسی پایتون را ترجیح دهید یا تطبیق پذیری دستورات cURL، Aspose.PDF Cloud یک API قوی برای انجام این کار ارائه می دهد. با استفاده از قدرت ابر، می توانید تصاویر را از اسناد PDF به راحتی استخراج کنید و گردش کار خود را بهبود بخشید. با این وجود، با Aspose.PDF Cloud، شما این قابلیت را دارید که رویکردی را انتخاب کنید که به بهترین شکل با نیازهای شما مطابقت دارد و عملکرد استخراج تصویر را به طور یکپارچه در پروژه های خود ادغام کنید.
منابع مفید
مقالات مرتبط
همچنین توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: