استخراج صور PDF

كيفية استخراج صور PDF باستخدام Cloud Java

نستخدم ملفات PDF بانتظام لأنها توفر دعمًا رائعًا لمحتوى النص والصورة. بمجرد وضع هذه العناصر داخل المستند ، يتم الاحتفاظ بتخطيط الملف بغض النظر عن النظام الأساسي الذي تستخدمه لعرضها. ولكن ، قد يكون لدينا متطلبات لاستخراج صور PDF. يمكن تحقيق ذلك باستخدام تطبيق عارض PDF ولكنك تحتاج إلى اجتياز كل صفحة يدويًا وحفظ كل صورة على حدة. علاوة على ذلك ، في سيناريو آخر ، إذا كان لديك ملف PDF مستند إلى الصور وتحتاج إلى إجراء PDF OCR ، فأنت بحاجة أولاً إلى استخراج جميع الصور ثم إجراء عملية التعرف الضوئي على الحروف. يصبح هذا الأمر صعبًا حقًا عندما يكون لديك مجموعة كبيرة من المستندات ولكن الحل البرمجي يمكن أن يكون حلاً سريعًا وموثوقًا. لذلك في هذه المقالة ، سوف نستكشف خيارات استخراج الصور من PDF باستخدام Java Cloud SDK

تحويل PDF إلى JPG API

لتحويل PDF إلى JPG أو JPG إلى PDF في تطبيق Java ، يعد Aspose.PDF Cloud SDK for Java خيارًا رائعًا. في الوقت نفسه ، يتيح لك أيضًا استخراج الصور من PDF ، واستخراج النص من PDF ، واستخراج المرفقات من PDF بالإضافة إلى توفير عدد كبير من الخيارات لمعالجة ملفات PDF. لذلك من أجل تنفيذ ميزة حفظ صور PDF في تطبيق Java ، نحتاج أولاً إلى إضافة مرجع Cloud SDK في مشروعنا. لذا يرجى إضافة التفاصيل التالية في ملف pom.xml الخاص بمشروع نوع البناء المخضرم.

<repositories> 
    <repository>
        <id>aspose-cloud</id>
        <name>artifact.aspose-cloud-releases</name>
        <url>http://artifact.aspose.cloud/repo</url>
    </repository>   
</repositories>

<dependencies>
    <dependency>
        <groupId>com.aspose</groupId>
        <artifactId>aspose-pdf-cloud</artifactId>
        <version>21.11.0</version>
    </dependency>
</dependencies>

بمجرد إضافة مرجع SDK وليس لديك أي حساب موجود عبر Aspose Cloud ، يرجى إنشاء حساب مجاني باستخدام عنوان بريد إلكتروني صالح. ثم قم بتسجيل الدخول باستخدام حساب تم إنشاؤه حديثًا وابحث / أنشئ معرّف العميل وسر العميل في Cloud Dashboard. هذه التفاصيل مطلوبة لأغراض المصادقة في الأقسام التالية.

استخراج صور PDF في جافا

يرجى اتباع الخطوات الواردة أدناه لاستخراج الصور من PDF وبمجرد اكتمال العملية ، يتم تخزين الصور في مجلد منفصل على التخزين السحابي.

  • نحتاج أولاً إلى إنشاء كائن PdfApi مع توفير ClientID وسر العميل كوسائط
  • ثانيًا ، قم بتحميل ملف PDF المدخل باستخدام مثيل الملف
  • قم بتحميل ملف PDF المدخل إلى التخزين السحابي باستخدام طريقة uploadFile (…)
  • سنستخدم أيضًا معلمة اختيارية لتعيين تفاصيل الارتفاع والعرض للصور المستخرجة
  • أخيرًا ، قم باستدعاء طريقة putImagesExtractAsJpeg (…) التي تأخذ اسم ملف PDF ورقم PageNumber لاستخراج الصور وأبعاد الصور المستخرجة واسم المجلد على التخزين السحابي لحفظ الصور المستخرجة
try
    {
    // احصل على ClientID و ClientSecret من https://dashboard.aspose.cloud/
    String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
    String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
	  
    // إنشاء مثيل لـ PdfApi
    PdfApi pdfApi = new PdfApi(clientSecret,clientId);

    // اسم مستند إدخال PDF
    String inputFile = "marketing.pdf";

    // قراءة محتوى ملف إدخال PDF
    File file = new File("//Users//"+inputFile);
	    
    // تحميل PDF إلى التخزين السحابي
    pdfApi.uploadFile("input.pdf", file, null);

    // صفحة PDF لاستخراج الصور
    int pageNumber =1;

    // عرض الصور المستخرجة
    int width = 600;
    // ارتفاع الصور المستخرجة
    int height = 800;
	    
    // مجلد لحفظ الصور المستخرجة
    String folderName = "NewFolder";
	       
    // استخراج صور PDF وحفظها في التخزين السحابي
    pdfApi.putImagesExtractAsJpeg(inputFile, pageNumber, width, height, null, null, folderName);
	    
    // اطبع رسالة النجاح
    System.out.println("PDF images Successsuly extracted !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
معاينة استخراج صور PDF

Image1: - استخراج معاينة صور PDF

يمكن تنزيل نموذج ملف PDF المستخدم في المثال أعلاه من input.pdf.

حفظ صور PDF باستخدام أوامر cURL

سنقوم الآن باستدعاء API لاستخراج صور PDF باستخدام أوامر cURL. الآن كشرط مسبق لهذا النهج ، نحتاج أولاً إلى إنشاء رمز وصول JWT (بناءً على بيانات اعتماد العميل) أثناء تنفيذ الأمر التالي.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

بمجرد حصولنا على رمز JWT ، يرجى تنفيذ الأمر التالي لحفظ صور PDF في مجلد منفصل عبر التخزين السحابي.

curl -X PUT "https://api.aspose.cloud/v3.0/pdf/input_file.pdf/pages/1/images/extract/jpeg?width=0&height=0&destFolder=NewFolder" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

خاتمة

بعد قراءة هذه المقالة ، تعلمت طريقة بسيطة وموثوقة لاستخراج صور PDF باستخدام مقتطف كود Java وكذلك من خلال أوامر cURL. كما لاحظنا ، نحصل على نفوذ لاستخراج الصور من صفحة محددة من ملف PDF ، ويوفر مزيدًا من التحكم في عملية الاستخراج. تم إثراء المنتج الوثائق بمجموعة من الموضوعات المذهلة التي تشرح بشكل أكبر إمكانات واجهة برمجة التطبيقات هذه.

أيضًا ، نظرًا لأن جميع حزم SDK السحابية الخاصة بنا منشورة بموجب ترخيص MIT ، يمكنك التفكير في تنزيل كود المصدر الكامل من GitHub وتعديله وفقًا لمتطلباتك. في حالة وجود أية مشكلات ، يمكنك الاتصال بنا للحصول على حل سريع عبر منتدى دعم المنتج مجانًا.

مقالات ذات صلة

يرجى زيارة الروابط التالية لمعرفة المزيد حول: