אנו משתמשים בקביעות בקבצי PDF מכיוון שהם מספקים תמיכה מדהימה לתוכן טקסט ותמונה. לאחר שהרכיבים הללו הוצבו בתוך המסמך, פריסת הקובץ נשמרת לא משנה באיזו פלטפורמה אתה משתמש לצפייה בהם. אבל, ייתכן שיש לנו דרישה לחלץ תמונות PDF. ניתן להשיג זאת באמצעות יישום מציג PDF אך עליך לעבור ידנית בכל עמוד ולשמור כל תמונה בנפרד. יתר על כן, בתרחיש אחר, אם יש לך PDF מבוסס תמונה ואתה צריך לבצע PDF OCR, אז תחילה עליך לחלץ את כל התמונות ולאחר מכן לבצע את פעולת ה-OCR. זה נהיה ממש קושי כאשר יש לך סט גדול של מסמכים, אבל פתרון פרוגרמטי יכול להיות פתרון אמין ומהיר. אז במאמר זה, אנו הולכים לחקור את האפשרויות לחילוץ תמונות מ-PDF באמצעות Java Cloud SDK
API להמרה של PDF ל-JPG
על מנת להמיר PDF ל-JPG או JPG ל-PDF באפליקציית Java, Aspose.PDF Cloud SDK for Java היא בחירה מדהימה. במקביל, זה גם מאפשר לך לחלץ תמונות מ-PDF, לחלץ טקסט מ-PDF, לחלץ קבצים מצורפים מ-PDF וכן מספק שפע של אפשרויות למניפולציה של PDF. אז כדי ליישם את התכונה לשמירת תמונות PDF באפליקציית Java, ראשית עלינו להוסיף את ההפניה לענן SDK בפרויקט שלנו. אז בבקשה הוסף את הפרטים הבאים ב-pom.xml של פרויקט מסוג maven build.
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.11.0</version>
</dependency>
</dependencies>
לאחר שההפניה ל-SDK נוספה ואין לך שום חשבון קיים דרך Aspose Cloud, אנא צור חשבון בחינם באמצעות כתובת דוא"ל חוקית. לאחר מכן התחבר באמצעות חשבון חדש שנוצר וחפש/צור מזהה לקוח וסוד לקוח ב-Cloud Dashboard. פרטים אלה נדרשים למטרות אימות בסעיפים הבאים.
חלץ תמונות PDF ב-Java
אנא בצע את השלבים המפורטים להלן כדי לחלץ תמונות מ-PDF ולאחר השלמת הפעולה, התמונות מאוחסנות בתיקייה נפרדת באחסון בענן.
- ראשית עלינו ליצור אובייקט PdfApi תוך מתן זיהוי לקוח וסוד לקוח כארגומנטים
- שנית, טען את קובץ ה-PDF הקלט באמצעות מופע קובץ
- העלה את קובץ PDF הקלט לאחסון בענן באמצעות שיטת uploadFile(…).
- אנו גם הולכים להשתמש בפרמטר אופציונלי כדי להגדיר פרטי גובה ורוחב עבור תמונות שחולצו
- לבסוף קרא לשיטת putImagesExtractAsJpeg(…) שלוקחת את שם ה-PDF בקלט, מספר עמוד כדי לחלץ תמונות, ממדי תמונות שחולצו ואת שם התיקיה באחסון בענן כדי לשמור תמונות שחולצו
try
{
// קבל ClientID ו-ClientSecret מ-https://dashboard.aspose.cloud/
String clientId = "bb959721-5780-4be6-be35-ff5c3a6aa4a2";
String clientSecret = "4d84d5f6584160cbd91dba1fe145db14";
// צור מופע של PdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// שם מסמך PDF הקלט
String inputFile = "marketing.pdf";
// קרא את התוכן של קובץ PDF הקלט
File file = new File("//Users//"+inputFile);
// העלה PDF לאחסון בענן
pdfApi.uploadFile("input.pdf", file, null);
// דף PDF לחילוץ תמונות
int pageNumber =1;
// רוחב עבור תמונות שחולצו
int width = 600;
// גובה התמונות שחולצו
int height = 800;
// תיקייה כדי לשמור תמונות שחולצו
String folderName = "NewFolder";
// חלץ תמונות PDF ושמור ב-Cloud Storage
pdfApi.putImagesExtractAsJpeg(inputFile, pageNumber, width, height, null, null, folderName);
// להדפיס הודעת הצלחה
System.out.println("PDF images Successsuly extracted !");
}catch(Exception ex)
{
System.out.println(ex);
}
ניתן להוריד את קובץ ה-PDF לדוגמה המשמש בדוגמה לעיל מ-input.pdf.
שמור תמונות PDF באמצעות פקודות cURL
כעת אנו הולכים לקרוא ל-API לחילוץ תמונות PDF באמצעות פקודות cURL. כעת כתנאי מוקדם לגישה זו, ראשית עלינו ליצור אסימון גישה JWT (מבוסס על אישורי לקוח) תוך ביצוע הפקודה הבאה.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bb959721-5780-4be6-be35-ff5c3a6aa4a2&client_secret=4d84d5f6584160cbd91dba1fe145db14" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
ברגע שיש לנו את אסימון JWT, אנא בצע את הפקודה הבאה כדי לשמור תמונות PDF בתיקייה נפרדת מעל אחסון בענן.
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/input_file.pdf/pages/1/images/extract/jpeg?width=0&height=0&destFolder=NewFolder" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
סיכום
לאחר קריאת מאמר זה, למדת גישה פשוטה אך אמינה לחילוץ תמונות PDF באמצעות קטע קוד Java וכן באמצעות פקודות cURL. כפי ששמנו לב, אנו מקבלים מינוף לחילוץ תמונות מהדף שצוין בקובץ ה-PDF, ומספק שליטה רבה יותר על תהליך החילוץ. המוצר תיעוד מועשר במערך של נושאים מדהימים המסבירים עוד יותר את היכולות של API זה.
כמו כן, מכיוון שכל ערכות SDK הענן שלנו מתפרסמות ברישיון MIT, אז אתה יכול לשקול להוריד את קוד המקור המלא מ-GitHub ולשנות אותו בהתאם לדרישות שלך. בכל מקרה של בעיה, אתה יכול לשקול לפנות אלינו לפתרון מהיר באמצעות פורום תמיכת מוצרים בחינם.
מאמרים קשורים
אנא בקר בקישורים הבאים כדי ללמוד עוד על: