
Μετατροπή PDF σε TXT online σε Java
Το αρχείο PDF είναι μια από τις ευρέως χρησιμοποιούμενες μορφές για κοινή χρήση δεδομένων και πληροφοριών μέσω του Διαδικτύου. Ωστόσο, μερικές φορές περιέχουν περιεχόμενο χρησιμοποιώντας προσαρμοσμένες γραμματοσειρές και το μέγεθος του αρχείου που προκύπτει μπορεί να αυξηθεί. Επιπλέον, μπορεί να χρειαστεί να εξαγάγουμε το περιεχόμενο κειμένου για περαιτέρω επεξεργασία, επομένως σε αυτό το σενάριο, η μετατροπή PDF σε Κείμενο είναι μία από τις βιώσιμες λύσεις. Σε αυτό το άρθρο, θα συζητήσουμε τις λεπτομέρειες σχετικά με το πώς μπορούμε να μετατρέψουμε το PDF σε μορφή TXT.
API μετατροπής PDF σε κείμενο
Το Aspose.Words Cloud SDK για Java είναι η κορυφαία λύση για την επεξεργασία εγγράφων του Word. Είναι μια καταπληκτική λύση που παρέχει τις δυνατότητες δημιουργίας, επεξεργασίας και μετατροπής ποικιλίας αρχείων σε DOC, HTML, JPEG και διάφορες άλλες υποστηριζόμενες μορφές. Εκτός από έγγραφα του Word, παρέχει επίσης υποστήριξη για τη φόρτωση αρχείων PDF και την αποθήκευση της εξόδου σε TXT, HTML, XPS, TIFF κ.λπ. Τώρα, για να χρησιμοποιήσετε το SDK, προσθέστε τις ακόλουθες λεπτομέρειες στο pom.xml σας του τύπου κατασκευής Maven.
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.cloud/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.5.0</version>
</dependency>
</dependencies>
Τώρα πρέπει να δημιουργήσουμε έναν δωρεάν λογαριασμό μεταβαίνοντας στο Aspose.Cloud dashboard. Απλώς Εγγραφείτε χρησιμοποιώντας τον υπάρχοντα λογαριασμό σας στο GitHub ή στο Google ή κάντε κλικ στο κουμπί Δημιουργία νέου λογαριασμού.
Μετατροπή PDF σε TXT σε Java
Ακολουθήστε τις παρακάτω οδηγίες για να εκπληρώσετε τις απαιτήσεις σας χρησιμοποιώντας απόσπασμα κώδικα Java.
- Αρχικά, δημιουργήστε ένα αντικείμενο του WordsApi χρησιμοποιώντας ένα Client ID και Client Secret ως παραμέτρους
- Δεύτερον, διαβάστε το περιεχόμενο του αρχείου PDF από την τοπική μονάδα δίσκου χρησιμοποιώντας το αντικείμενο Αρχείο
- Τρίτον, διαβάστε το περιεχόμενο του αρχείου PDF χρησιμοποιώντας την παρουσία UploadFileRequest
- Το επόμενο βήμα είναι να καλέσετε τη μέθοδο uploadFile(…) για να ανεβάσετε το PDF στο χώρο αποθήκευσης cloud
- Τώρα, δημιουργήστε ένα αντικείμενο του GetDocumentWithFormatRequest(…) όπου καθορίζουμε τη μορφή εξόδου ως μορφή TXT
- Τέλος, καλέστε τη μέθοδο getDocumentWithFormat(…) για να μετατρέψετε το PDF σε Κείμενο και να αποθηκεύσετε την έξοδο στο χώρο αποθήκευσης Cloud.
// για περισσότερα παραδείγματα, επισκεφθείτε τη διεύθυνση https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// Λάβετε ClientID και ClientSecret από https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// δημιουργήστε ένα αντικείμενο του WordsApi
// Εάν το baseUrl είναι μηδενικό, το WordsApi χρησιμοποιεί την προεπιλεγμένη διεύθυνση https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// διαβάστε το περιεχόμενο του PDF από την τοπική μονάδα δίσκου
File file = new File("c://input.pdf");
// δημιουργία αιτήματος μεταφόρτωσης αρχείου
UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
// μεταφόρτωση αρχείου στο χώρο αποθήκευσης cloud
wordsApi.uploadFile(uploadRequest);
// δημιουργία αντικειμένου αιτήματος μετατροπής εγγράφου
GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
// Καλέστε το API για να μετατρέψετε το PDF σε Κείμενο online
wordsApi.getDocumentWithFormat(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
Χρησιμοποιήστε το παρακάτω απόσπασμα κώδικα για να φορτώσετε το PDF από την τοπική μονάδα δίσκου και να το αποθηκεύσετε σε μορφή TXT. Μετά τη μετατροπή, το αρχείο που προκύπτει αποθηκεύεται στον χώρο αποθήκευσης cloud.
- Αρχικά, δημιουργήστε ένα αντικείμενο του WordsApi χρησιμοποιώντας ένα Client ID και Client Secret ως παραμέτρους
- Δεύτερον, διαβάστε το περιεχόμενο του αρχείου PDF από την τοπική μονάδα δίσκου χρησιμοποιώντας το αντικείμενο Αρχείο
- Τρίτον, δημιουργήστε ένα αντικείμενο του ConvertDocumentRequest(…) όπου παρέχουμε ορίσματα του αντικειμένου αρχείου, TXT ως προκύπτουσα μορφή και διαδρομή εξόδου του προκύπτοντος αρχείου TXT
- Τέλος, καλέστε τη μέθοδο convertDocument(…) για να μετατρέψετε το PDF σε κείμενο και να αποθηκεύσετε την έξοδο στο χώρο αποθήκευσης Cloud
// για περισσότερα παραδείγματα, επισκεφθείτε τη διεύθυνση https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// Λάβετε ClientID και ClientSecret από https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// δημιουργήστε ένα αντικείμενο του WordsApi
// Εάν το baseUrl είναι μηδενικό, το WordsApi χρησιμοποιεί την προεπιλεγμένη διεύθυνση https://api.aspose.cloud
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// διαβάστε το περιεχόμενο του PDF από την τοπική μονάδα δίσκου
File file = new File("c://input.pdf");
// δημιουργία αντικειμένου αιτήματος μετατροπής εγγράφου
ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
// Καλέστε το API για να μετατρέψετε το PDF σε μορφή κειμένου
wordsApi.convertDocument(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}

Εικόνα 1: - Προεπισκόπηση της μετατροπής PDF σε κείμενο στο χώρο αποθήκευσης cloud
PDF σε TXT χρησιμοποιώντας εντολές cURL
Σε αυτήν την ενότητα, θα πραγματοποιήσουμε τη μετατροπή PDF σε Κείμενο χρησιμοποιώντας εντολές cURL. Τώρα ως προαπαιτούμενο, πρέπει να δημιουργήσουμε το διακριτικό πρόσβασης JWT με βάση τα διαπιστευτήρια πελάτη χρησιμοποιώντας την ακόλουθη εντολή.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Τώρα εκτελέστε την ακόλουθη εντολή για να ανεβάσετε το αρχείο PDF στο χώρο αποθήκευσης cloud.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>" \
-H "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
Τέλος, εκτελέστε την ακόλουθη εντολή για να μετατρέψετε το PDF σε μορφή κειμένου.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
Σύναψη
Αυτό το άρθρο εξήγησε τις λεπτομέρειες σχετικά με τη μετατροπή PDF σε κείμενο χρησιμοποιώντας απόσπασμα κώδικα Java. Ομοίως, μάθαμε επίσης τα βήματα για τη μετατροπή PDF σε TXT χρησιμοποιώντας τις εντολές cURL. Για καλύτερη εκμάθηση, μπορείτε να εξερευνήσετε το API χρησιμοποιώντας το Swagger UI στο πρόγραμμα περιήγησης ιστού.
Εάν έχετε οποιοδήποτε σχετικό ερώτημα ή αντιμετωπίζετε προβλήματα, μη διστάσετε να επικοινωνήσετε μαζί μας μέσω του δωρεάν φόρουμ τεχνικής υποστήριξης.
Σχετικά Άρθρα
Συνιστούμε ανεπιφύλακτα να διαβάσετε τα παρακάτω άρθρα για να μάθετε περισσότερα σχετικά με: