
แปลง PDF เป็น TXT ออนไลน์ใน Java
ไฟล์ PDF เป็นรูปแบบหนึ่งที่ใช้กันอย่างแพร่หลายสำหรับการแชร์ข้อมูลผ่านอินเทอร์เน็ต อย่างไรก็ตาม บางครั้งไฟล์เหล่านี้ใช้แบบอักษรที่กำหนดเอง และขนาดไฟล์ที่ได้อาจเพิ่มขึ้น นอกจากนี้ เราอาจจำเป็นต้องแยกเนื้อหาข้อความเพื่อประมวลผลเพิ่มเติม ดังนั้นในสถานการณ์นี้ การแปลง PDF เป็นข้อความจึงเป็นหนึ่งในวิธีแก้ปัญหาที่เหมาะสม ในบทความนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับการแปลง PDF เป็นรูปแบบ TXT
API การแปลง PDF เป็นข้อความ
Aspose.Words Cloud SDK for Java เป็นโซลูชันชั้นนำสำหรับการประมวลผลเอกสาร Word เป็นโซลูชันที่น่าทึ่งซึ่งให้ความสามารถในการสร้าง แก้ไข และแปลงไฟล์ต่างๆ เป็น DOC, HTML, JPEG และรูปแบบอื่นๆ ที่รองรับ นอกเหนือจากเอกสาร Word แล้ว ยังรองรับการโหลดไฟล์ PDF และบันทึกผลลัพธ์เป็น TXT, HTML, XPS, TIFF เป็นต้น เพื่อใช้ SDK โปรดเพิ่มรายละเอียดต่อไปนี้ลงใน pom.xml ของประเภทการสร้าง maven ของคุณ
<repositories>
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.cloud/repo/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words-cloud</artifactId>
<version>22.5.0</version>
</dependency>
</dependencies>
ตอนนี้เราต้องสร้างบัญชีฟรีโดยไปที่ Aspose.Cloud Dashboard เพียงลงทะเบียนโดยใช้บัญชี GitHub หรือ Google ที่มีอยู่ของคุณ หรือคลิกปุ่ม สร้างบัญชีใหม่
แปลง PDF เป็น TXT ใน Java
โปรดปฏิบัติตามคำแนะนำด้านล่างเพื่อปฏิบัติตามข้อกำหนดของคุณโดยใช้ชิ้นส่วนโค้ด Java
- ขั้นแรก ให้สร้างอ็อบเจ็กต์ของ WordsApi โดยใช้ Client ID และ Client Secret เป็นพารามิเตอร์
- ประการที่สอง อ่านเนื้อหาไฟล์ PDF จากไดรฟ์ภายในเครื่องโดยใช้ไฟล์ออบเจ็กต์
- ประการที่สาม อ่านเนื้อหาของไฟล์ PDF โดยใช้อินสแตนซ์ UploadFileRequest
- ขั้นตอนถัดไปคือการเรียกใช้เมธอด uploadFile(…) เพื่ออัปโหลด PDF ไปยังที่เก็บข้อมูลบนคลาวด์
- ตอนนี้สร้างอ็อบเจ็กต์ของ GetDocumentWithFormatRequest(…) โดยที่เราระบุรูปแบบเอาท์พุตเป็นรูปแบบ TXT
- ในที่สุด เรียกใช้เมธอด getDocumentWithFormat(…) เพื่อแปลง PDF เป็นข้อความ และบันทึกเอาต์พุตในที่เก็บข้อมูลบนคลาวด์
// สำหรับตัวอย่างเพิ่มเติม โปรดไปที่ https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// รับ ClientID และ ClientSecret จาก https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// สร้างวัตถุของ WordsApi
// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// อ่านเนื้อหา PDF จากไดรฟ์ภายในเครื่อง
File file = new File("c://input.pdf");
// สร้างคำขออัปโหลดไฟล์
UploadFileRequest uploadRequest = new UploadFileRequest(Files.readAllBytes(file.toPath()), "input.pdf", null);
// อัพโหลดไฟล์ไปยังที่เก็บข้อมูลบนคลาวด์
wordsApi.uploadFile(uploadRequest);
// สร้างวัตถุคำขอการแปลงเอกสาร
GetDocumentWithFormatRequest request = new GetDocumentWithFormatRequest("input.pdf", "PDF", "", "Internal","", "", "", "extracted.txt","");
// เรียก API เพื่อแปลง PDF เป็นข้อความออนไลน์
wordsApi.getDocumentWithFormat(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}
โปรดใช้โค้ดสั้นๆ ต่อไปนี้เพื่อโหลด PDF จากไดรฟ์ในเครื่องและบันทึกเป็นรูปแบบ TXT หลังจากการแปลงแล้ว ไฟล์ที่ได้จะถูกบันทึกไว้ในที่เก็บข้อมูลบนคลาวด์
- ขั้นแรก ให้สร้างอ็อบเจ็กต์ของ WordsApi โดยใช้ Client ID และ Client Secret เป็นพารามิเตอร์
- ประการที่สอง อ่านเนื้อหาไฟล์ PDF จากไดรฟ์ภายในเครื่องโดยใช้ไฟล์ออบเจ็กต์
- ประการที่สาม สร้างอ็อบเจ็กต์ของ ConvertDocumentRequest(…) โดยที่เราระบุอาร์กิวเมนต์ของอ็อบเจ็กต์ไฟล์ TXT เป็นรูปแบบผลลัพธ์ และเส้นทางเอาต์พุตของไฟล์ TXT ผลลัพธ์
- สุดท้าย เรียกใช้เมธอด convertDocument(…) เพื่อแปลง PDF เป็นข้อความและบันทึกผลลัพธ์ในที่เก็บข้อมูลบนคลาวด์
// สำหรับตัวอย่างเพิ่มเติม โปรดไปที่ https://github.com/aspose-words-cloud/aspose-words-cloud-java
try
{
// รับ ClientID และ ClientSecret จาก https://dashboard.aspose.cloud/
String clientId = "bbf94a2c-6d7e-4020-b4d2-b9809741374e";
String clientSecret = "1c9379bb7d701c26cc87e741a29987bb";
// สร้างวัตถุของ WordsApi
// หาก baseUrl เป็นค่าว่าง WordsApi จะใช้ https://api.aspose.cloud เริ่มต้น
WordsApi wordsApi = new WordsApi(clientId, clientSecret, null);
// อ่านเนื้อหา PDF จากไดรฟ์ภายในเครื่อง
File file = new File("c://input.pdf");
// สร้างวัตถุคำขอการแปลงเอกสาร
ConvertDocumentRequest request = new ConvertDocumentRequest(Files.readAllBytes(file.toPath()), "TXT", "Extracted.txt", null, null, null);
// เรียก API เพื่อแปลง PDF เป็นรูปแบบข้อความ
wordsApi.convertDocument(request);
System.out.println("PDF to TXT Conversion sucessfull !");
}catch(Exception ex)
{
System.out.println(ex);
}

ภาพที่ 1:- ดูตัวอย่างการแปลง PDF เป็นข้อความในที่เก็บข้อมูลบนคลาวด์
แปลง PDF เป็น TXT โดยใช้คำสั่ง cURL
ในส่วนนี้ เราจะทำการแปลง PDF เป็น Text โดยใช้คำสั่ง cURL โดยขั้นตอนเบื้องต้นคือ เราต้องสร้างโทเค็นการเข้าถึง JWT ตามข้อมูลประจำตัวไคลเอนต์โดยใช้คำสั่งต่อไปนี้
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=bbf94a2c-6d7e-4020-b4d2-b9809741374e&client_secret=1c9379bb7d701c26cc87e741a29987bb" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
ตอนนี้โปรดดำเนินการคำสั่งต่อไปนี้เพื่ออัปโหลดไฟล์ PDF ไปยังที่เก็บข้อมูลบนคลาวด์
curl -v -X PUT "https://api.aspose.cloud/v4.0/words/storage/file/input.pdf" \
-H "accept: application/json" \
-H "Authorization: Bearer <JWT Token>" \
-H "Content-Type: multipart/form-data" \
-d {"fileContent":{}}
สุดท้ายให้ดำเนินการคำสั่งต่อไปนี้เพื่อแปลง PDF เป็นรูปแบบข้อความ
curl -v -X GET "https://api.aspose.cloud/v4.0/words/Quick%20Start%20Guide-%20Inventory%20Software%20Suite.pdf?format=TXT&outPath=extracted.txt" \
-H "accept: application/octet-stream" \
-H "Authorization: Bearer <JWT Token>"
บทสรุป
บทความนี้จะอธิบายรายละเอียดเกี่ยวกับการแปลง PDF เป็น Text โดยใช้โค้ด Java นอกจากนี้ เรายังได้เรียนรู้ขั้นตอนการแปลง PDF เป็น TXT โดยใช้คำสั่ง cURL อีกด้วย หากต้องการเรียนรู้เพิ่มเติม คุณสามารถสำรวจ API โดยใช้ Swagger UI ภายในเว็บเบราว์เซอร์
หากคุณมีคำถามใดๆ ที่เกี่ยวข้องหรือพบปัญหาใดๆ โปรดติดต่อเราผ่าน ฟอรัมการสนับสนุนทางเทคนิค ฟรี
บทความที่เกี่ยวข้อง
เราขอแนะนำให้อ่านบทความต่อไปนี้เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ: