
המר PDF ל-TXT באופן מקוון ב-Java
קובץ PDF הוא אחד הפורמטים הנפוצים לשיתוף נתונים ומידע דרך האינטרנט. עם זאת, לפעמים הם מכילים תוכן באמצעות גופנים מותאמים אישית וגודל הקובץ שנוצר עשוי לגדול. יתר על כן, ייתכן שתהיה לנו דרישה לחלץ את התוכן הטקסטואלי לעיבוד נוסף, כך שבתרחיש זה, ההמרה של PDF לטקסט היא אחד הפתרונות המעשיים. במאמר זה, אנו הולכים לדון בפרטים כיצד אנו יכולים להמיר PDF לפורמט TXT.
API להמרת PDF לטקסט
Aspose.Words Cloud SDK עבור Java הוא הפתרון המוביל לעיבוד מסמכי Word. זהו פתרון מדהים המספק את היכולות ליצור, לערוך ולהמיר מגוון קבצים ל-DOC, HTML, JPEG ועוד פורמטים נתמכים שונים. מלבד מסמכי Word, הוא גם מספק תמיכה לטעינת קבצי PDF ולשמור את הפלט ב-TXT, HTML, XPS, TIFF וכו’. כעת על מנת להשתמש ב-SDK, אנא הוסף את הפרטים הבאים ל-pom.xml שלך מסוג ה-maven build שלך.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.cloud/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.5.0</version>
</dependency>
</dependencies>
כעת עלינו ליצור חשבון בחינם על ידי ביקור ב-Aspose.Cloud Dashboard. כל שעליך לעשות הוא להירשם באמצעות חשבון GitHub או Google הקיים שלך, או לחץ על הלחצן צור חשבון חדש.
המר PDF ל-TXT ב-Java
אנא עקוב אחר ההוראות שלהלן כדי למלא את הדרישות שלך באמצעות קטע קוד Java.
- ראשית, צור אובייקט של WordsApi באמצעות מזהה לקוח וסוד לקוח כפרמטרים
- שנית, קרא את תוכן קובץ ה-PDF מהכונן המקומי באמצעות אובייקט הקובץ
- שלישית, קרא את התוכן של קובץ ה-PDF באמצעות מופע UploadFileRequest
- השלב הבא הוא לקרוא לשיטת uploadFile(…) כדי להעלות את ה-PDF לאחסון בענן
- כעת, צור אובייקט של GetDocumentWithFormatRequest(…) שבו אנו מציינים את פורמט הפלט כפורמט TXT
- לבסוף, קרא לשיטה getDocumentWithFormat(…) כדי להמיר PDF לטקסט ולשמור את הפלט באחסון בענן.
// לדוגמאות נוספות, בקר בכתובת https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// קבל ClientID ו-ClientSecret מ-https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// ליצור אובייקט של WordsApi
// אם baseUrl הוא null, WordsApi משתמש בברירת המחדל https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// קרא את התוכן של PDF מהכונן המקומי
File file = new File("c://input.pdf");
// צור בקשה להעלאת קבצים
UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
// להעלות קובץ לאחסון בענן
wordsApi.uploadFile(uploadRequest);
// צור אובייקט בקשת המרת מסמך
GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
// התקשר ל-API כדי להמיר PDF לטקסט באופן מקוון
wordsApi.getDocumentWithFormat(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
אנא השתמש בקטע הקוד הבא כדי לטעון PDF מהכונן המקומי ולשמור בפורמט TXT. לאחר ההמרה, הקובץ שנוצר נשמר באחסון בענן.
- ראשית, צור אובייקט של WordsApi באמצעות מזהה לקוח וסוד לקוח כפרמטרים
- שנית, קרא את תוכן קובץ ה-PDF מהכונן המקומי באמצעות אובייקט הקובץ
- שלישית, צור אובייקט של ConvertDocumentRequest(…) שבו אנו מספקים ארגומנטים של אובייקט קובץ, TXT כפורמט כתוצאה ונתיב פלט של קובץ TXT שנוצר
- לבסוף, קרא לשיטה convertDocument(…) כדי להמיר PDF לטקסט ולשמור את הפלט באחסון בענן
// לדוגמאות נוספות, בקר בכתובת https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// קבל ClientID ו-ClientSecret מ-https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// ליצור אובייקט של WordsApi
// אם baseUrl הוא null, WordsApi משתמש בברירת המחדל https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// קרא את התוכן של PDF מהכונן המקומי
File file = new File("c://input.pdf");
// צור אובייקט בקשה להמרת מסמך
ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
// התקשר ל-API כדי להמיר PDF לפורמט טקסט
wordsApi.convertDocument(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}

תמונה 1:- תצוגה מקדימה של המרת PDF לטקסט באחסון ענן
PDF ל-TXT באמצעות פקודות cURL
בסעיף זה, אנו הולכים לבצע את המרת PDF לטקסט באמצעות פקודות cURL. כעת כדרישה מוקדמת, עלינו ליצור את אסימון הגישה של JWT בהתבסס על אישורי לקוח באמצעות הפקודה הבאה.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
כעת אנא בצע את הפקודה הבאה כדי להעלות את קובץ ה-PDF לאחסון בענן.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>" \
-H "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
לבסוף, בצע את הפקודה הבאה כדי להמיר PDF לפורמט טקסט.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
מַסְקָנָה
מאמר זה הסביר את הפרטים על המרת PDF לטקסט באמצעות קטע קוד Java. באופן דומה, למדנו גם את השלבים להמרת PDF ל-TXT באמצעות פקודות cURL. ללמידה טובה יותר, תוכל לחקור את ה-API באמצעות Swagger UI בדפדפן האינטרנט.
אם יש לך שאילתה קשורה כלשהי או שאתה נתקל בבעיות כלשהן, אל תהסס לפנות אלינו דרך [פורום תמיכה טכנית] ללא תשלום 16.
מאמרים קשורים
אנו ממליצים בחום לעבור על המאמרים הבאים כדי ללמוד עוד על: