PDF konvertálása TXT-re online Java nyelven
A PDF fájl az interneten keresztüli adat- és információmegosztás egyik legszélesebb körben használt formátuma. Néha azonban egyéni betűtípusokat használnak a tartalmak, és az eredményül kapott fájl mérete megnőhet. Továbbá előfordulhat, hogy a szöveges tartalom kinyerése a további feldolgozáshoz szükséges, ezért ebben a forgatókönyvben a PDF szöveggé konvertálása az egyik életképes megoldás. Ebben a cikkben megvitatjuk a PDF TXT formátumba konvertálásának részleteit.
- PDF-ből szöveggé konvertáló API
 - PDF konvertálása TXT-re Java nyelven
 - PDF-ből TXT-be a cURL parancsokkal
 
PDF-ből szöveggé konvertáló API
Az Aspose.Words Cloud SDK for Java a Word dokumentumfeldolgozás vezető megoldása. Ez egy csodálatos megoldás, amely lehetőséget biztosít különféle fájlok létrehozására, szerkesztésére és átalakítására DOC, HTML, JPEG és számos más támogatott formátumba. A Word dokumentumokon kívül támogatja a PDF fájlok betöltését és a kimenet mentését TXT, HTML, XPS, TIFF stb. formátumba. Az SDK használatához adja hozzá a következő adatokat a maven build típusának pom.xml fájljához.
<repositories>
    <repository>
        <id>AsposeJavaAPI</id>
        <name>Aspose Java API</name>
        <url>https://repository.aspose.cloud/repo/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
		<groupId>com.aspose</groupId>
		<artifactId>aspose-words-cloud</artifactId>
		<version>22.5.0</version>
	</dependency>
</dependencies>
Most létre kell hoznunk egy ingyenes fiókot az Aspose.Cloud dashboard oldal meglátogatásával. Egyszerűen regisztráljon meglévő GitHub- vagy Google-fiókjával, vagy kattintson az Új fiók létrehozása gombra.
PDF konvertálása TXT-re Java nyelven
Kövesse az alábbi utasításokat, hogy a Java kódrészlet használatával teljesítse követelményeit.
- Először hozzon létre egy WordsApi objektumot egy ügyfél-azonosító és ügyféltitkos paraméterek használatával
 - Másodszor olvassa el a PDF fájl tartalmát a helyi meghajtóról a File objektum segítségével
 - Harmadszor, olvassa el a PDF-fájl tartalmát az UploadFileRequest példány használatával
 - A következő lépés az uploadFile(…) metódus meghívása a PDF felhőtárhelyre való feltöltéséhez
 - Most hozzon létre egy GetDocumentWithFormatRequest(…) objektumot, ahol a kimeneti formátumot TXT formátumban adjuk meg
 - Végül hívja meg a getDocumentWithFormat(…) metódust a PDF szöveggé konvertálásához és a kimenet mentéséhez a felhőtárhelyen.
 
// további példákért látogasson el a https://github.com/aspose-words-cloud/aspose-words-cloud-java oldalra
try
    {
    // Szerezze be a ClientID-t és a ClientSecret-et a https://dashboard.aspose.cloud/ webhelyről
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // hozzon létre egy WordsApi objektumot
    // ha a baseUrl értéke null, a WordsApi az alapértelmezett https://api.aspose.cloud címet használja
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
    // olvassa el a PDF tartalmát a helyi meghajtóról
    File file = new File("c://input.pdf");
    
    // fájlfeltöltési kérés létrehozása
    UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
    
    // fájl feltöltése felhőtárhelyre
    wordsApi.uploadFile(uploadRequest);
        
    // dokumentumkonverziós kérelem objektum létrehozása
    GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
        
    // Hívja az API-t a PDF-ből szöveggé konvertálásához online
    wordsApi.getDocumentWithFormat(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
Kérjük, használja a következő kódrészletet a PDF betöltéséhez a helyi meghajtóról, és mentse TXT formátumba. Az átalakítás után az eredményül kapott fájl felhőtárhelyre kerül mentésre.
- Először hozzon létre egy WordsApi objektumot egy ügyfél-azonosító és ügyféltitkos paraméterek használatával
 - Másodszor olvassa el a PDF fájl tartalmát a helyi meghajtóról a File objektum segítségével
 - Harmadszor, hozzon létre egy ConvertDocumentRequest(…) objektumot, ahol megadjuk a File objektum argumentumait, a TXT eredő formátumként és az eredményül kapott TXT fájl kimeneti útvonala
 - Végül hívja meg a convertDocument(…) metódust a PDF szöveggé konvertálásához és a kimenet mentéséhez a felhőtárhelyen.
 
// további példákért látogasson el a https://github.com/aspose-words-cloud/aspose-words-cloud-java oldalra
try
    {
    // Szerezze be a ClientID-t és a ClientSecret-et a https://dashboard.aspose.cloud/ webhelyről
    String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
    String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
  
    // hozzon létre egy WordsApi objektumot
    // ha a baseUrl értéke null, a WordsApi az alapértelmezett https://api.aspose.cloud címet használja
    WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
    // olvassa el a PDF tartalmát a helyi meghajtóról
    File file = new File("c://input.pdf");
           
    // dokumentumkonverziós kérelem objektum létrehozása
    ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
        
    // Hívja az API-t a PDF szöveges formátumba konvertálásához
    wordsApi.convertDocument(request);
    
    System.out.println("PDF to TXT Conversion sucessfull !");
    }catch(Exception ex)
    {
        System.out.println(ex);
    }
 - kép: – A PDF-ből szöveggé konvertálás előnézete felhőtárhelyen
 
PDF-ből TXT-be a cURL parancsokkal
Ebben a részben a PDF-ből szöveggé konvertálást hajtjuk végre cURL-parancsok segítségével. Most előfeltételként létre kell hoznunk a JWT hozzáférési jogkivonatot az ügyfél hitelesítő adatai alapján a következő paranccsal.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
Most hajtsa végre a következő parancsot a PDF-fájl felhőtárhelyre való feltöltéséhez.
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H  "accept: application/json" \
-H  "Authorization: Bearer <JWT Token>" \
-H  "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
Végül hajtsa végre a következő parancsot a PDF szöveges formátumba konvertálásához.
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H  "accept: application/octet-stream" \
-H  "Authorization: Bearer <JWT Token>"
Következtetés
Ez a cikk ismerteti a PDF-ből szöveggé konvertálás részleteit Java kódrészlet segítségével. Hasonlóképpen megtanultuk a PDF TXT formátumú konvertálásának lépéseit is a cURL parancsok használatával. A jobb tanulás érdekében felfedezheti az API-t a Swagger UI használatával a webböngészőben.
Ha bármilyen kérdése van, vagy bármilyen problémába ütközik, forduljon hozzánk bizalommal az ingyenes műszaki támogatási fórumon.
Kapcsolódó cikkek
Javasoljuk, hogy olvassa el az alábbi cikkeket, hogy többet megtudjon a témáról: