
გადაიყვანეთ PDF-ზე TXT-ზე ონლაინ ჯავაში
PDF ფაილი არის ერთ-ერთი ფართოდ გამოყენებული ფორმატი მონაცემთა და ინფორმაციის გაზიარებისთვის ინტერნეტში. თუმცა, ზოგჯერ ისინი ათავსებენ შინაარსს მორგებული შრიფტების გამოყენებით და შედეგად ფაილის ზომა შეიძლება გაიზარდოს. გარდა ამისა, ჩვენ შეიძლება გვქონდეს მოთხოვნილება გამოვიტანოთ ტექსტური შინაარსი შემდგომი დამუშავებისთვის, ამიტომ ამ სცენარში PDF-ის ტექსტად გადაქცევა ერთ-ერთი ეფექტური გამოსავალია. ამ სტატიაში ჩვენ განვიხილავთ დეტალებს, თუ როგორ შეგვიძლია გადავიყვანოთ PDF ფორმატში TXT.
PDF to Text Conversion API
Aspose.Words Cloud SDK for Java არის წამყვანი გადაწყვეტა Word დოკუმენტების დამუშავებისთვის. ეს არის საოცარი გადაწყვეტა, რომელიც უზრუნველყოფს სხვადასხვა ფაილების შექმნის, რედაქტირებისა და გარდაქმნის შესაძლებლობებს DOC, HTML, JPEG და სხვადასხვა სხვა მხარდაჭერილი ფორმატები. გარდა Word დოკუმენტებისა, ის ასევე უზრუნველყოფს PDF ფაილების ჩატვირთვის მხარდაჭერას და გამოსავლის შენახვას TXT, HTML, XPS, TIFF და ა.შ. ახლა, SDK-ის გამოსაყენებლად, გთხოვთ, დაამატოთ შემდეგი დეტალები თქვენს pom.xml-ში თქვენი maven build ტიპის.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.cloud/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.5.0</version>
</dependency>
</dependencies>
ახლა ჩვენ უნდა შევქმნათ უფასო ანგარიში Aspose.Cloud dashboard-ის მონახულებით. უბრალოდ დარეგისტრირდით თქვენი არსებული GitHub ან Google ანგარიშის გამოყენებით, ან დააწკაპუნეთ ღილაკზე Create a new Account.
გადაიყვანეთ PDF TXT-ში Java-ში
გთხოვთ, მიჰყვეთ ქვემოთ მოცემულ ინსტრუქციებს თქვენი მოთხოვნების შესასრულებლად Java კოდის ფრაგმენტის გამოყენებით.
- პირველი, შექმენით WordsApi-ს ობიექტი Client ID და Client Secret პარამეტრების გამოყენებით
- მეორეც, წაიკითხეთ PDF ფაილის შინაარსი ადგილობრივი დისკიდან File ობიექტის გამოყენებით
- მესამე, წაიკითხეთ PDF ფაილის შინაარსი UploadFileRequest ინსტანციის გამოყენებით
- შემდეგი ნაბიჯი არის uploadFile(…) მეთოდის გამოძახება PDF-ის ღრუბლოვან საცავში ატვირთვისთვის
- ახლა შექმენით GetDocumentWithFormatRequest(…) ობიექტი, სადაც გამომავალი ფორმატი განვსაზღვროთ, როგორც TXT ფორმატი
- და ბოლოს, გამოიძახეთ მეთოდი getDocumentWithFormat(…) PDF-ის ტექსტად გადასაყვანად და გამომავალი Cloud-ში შესანახად.
// დამატებითი მაგალითებისთვის, გთხოვთ, ეწვიოთ https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// მიიღეთ ClientID და ClientSecret https://dashboard.aspose.cloud/-დან
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// WordsApi-ს ობიექტის შექმნა
// თუ baseUrl არის null, WordsApi იყენებს ნაგულისხმევს https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// წაიკითხეთ PDF-ის შინაარსი ადგილობრივი დისკიდან
File file = new File("c://input.pdf");
// ფაილის ატვირთვის მოთხოვნის შექმნა
UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
// ატვირთეთ ფაილი ღრუბლოვან საცავში
wordsApi.uploadFile(uploadRequest);
// დოკუმენტის კონვერტაციის მოთხოვნის ობიექტის შექმნა
GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
// დარეკეთ API-ზე PDF-ის ტექსტად გადაქცევისთვის ონლაინ
wordsApi.getDocumentWithFormat(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
გთხოვთ, გამოიყენოთ შემდეგი კოდის ნაწყვეტი PDF-ის ლოკალური დისკიდან ჩასატვირთად და TXT ფორმატში შესანახად. კონვერტაციის შემდეგ, შედეგად მიღებული ფაილი ინახება ღრუბლოვან საცავში.
- პირველი, შექმენით WordsApi-ს ობიექტი Client ID და Client Secret პარამეტრების გამოყენებით
- მეორეც, წაიკითხეთ PDF ფაილის შინაარსი ადგილობრივი დისკიდან File ობიექტის გამოყენებით
- მესამე, შექმენით ConvertDocumentRequest(…) ობიექტი, სადაც ჩვენ მივაწოდებთ File ობიექტის არგუმენტებს, TXT, როგორც შედეგიან ფორმატს და შედეგიანი TXT ფაილის გამომავალ გზას.
- და ბოლოს, გამოიძახეთ მეთოდი convertDocument(…) PDF-ის ტექსტად გადასაყვანად და გამომავალი Cloud საცავში შესანახად.
// დამატებითი მაგალითებისთვის, გთხოვთ, ეწვიოთ https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// მიიღეთ ClientID და ClientSecret https://dashboard.aspose.cloud/-დან
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// WordsApi-ს ობიექტის შექმნა
// თუ baseUrl არის null, WordsApi იყენებს ნაგულისხმევს https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// წაიკითხეთ PDF-ის შინაარსი ადგილობრივი დისკიდან
File file = new File("c://input.pdf");
// დოკუმენტის კონვერტაციის მოთხოვნის ობიექტის შექმნა
ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
// დარეკეთ API PDF-ის ტექსტურ ფორმატში გადასაყვანად
wordsApi.convertDocument(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}

სურათი 1: - PDF-ის ტექსტში გადაქცევის გადახედვა ღრუბლოვან საცავში
PDF to TXT cURL ბრძანებების გამოყენებით
ამ განყოფილებაში ჩვენ ვაპირებთ PDF-ზე ტექსტის გადაქცევას cURL ბრძანებების გამოყენებით. ახლა, როგორც წინაპირობა, ჩვენ გვჭირდება JWT წვდომის ტოკენის გენერირება კლიენტის სერთიფიკატების საფუძველზე შემდეგი ბრძანების გამოყენებით.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
ახლა გთხოვთ შეასრულოთ შემდეგი ბრძანება PDF ფაილის ღრუბლოვან საცავში ატვირთვისთვის.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>" \
-H "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
და ბოლოს, შეასრულეთ შემდეგი ბრძანება PDF-ის ტექსტურ ფორმატში გადასაყვანად.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
დასკვნა
ამ სტატიაში აღწერილია დეტალები PDF-ის ტექსტად გადაქცევის შესახებ Java კოდის ფრაგმენტის გამოყენებით. ანალოგიურად, ჩვენ ასევე ვისწავლეთ PDF-ის TXT-ად გადაქცევის ნაბიჯები cURL ბრძანებების გამოყენებით. უკეთესი სწავლისთვის, შეგიძლიათ შეისწავლოთ API Swagger UI-ის გამოყენებით ვებ ბრაუზერში.
თუ თქვენ გაქვთ რაიმე დაკავშირებული შეკითხვა ან შეგექმნათ რაიმე პრობლემა, გთხოვთ, მოგერიდებათ დაგვიკავშირდეთ უფასო [ტექნიკური მხარდაჭერის ფორუმის] მეშვეობით 16.
დაკავშირებული სტატიები
ჩვენ გირჩევთ გაეცნოთ შემდეგ სტატიებს მეტის გასაგებად: