
รูปภาพเป็นส่วนประกอบที่สำคัญอย่างหนึ่งในการแบ่งปันข้อมูล และแอปพลิเคชันบางตัวจะแสดงเนื้อหาต้นฉบับในรูปแบบ PDF โดยตรง แต่ความสะดวกนี้จะเพิ่มต้นทุนเมื่อเราต้องค้นหาเนื้อหาบางส่วนภายในเอกสาร ในสถานการณ์ดังกล่าว เราต้องตรวจดูเอกสารทั้งหมดด้วยตนเองเพื่อค้นหาข้อมูลที่เกี่ยวข้อง ดังนั้นแนวทางที่แนะนำคือสร้างไฟล์ที่สามารถค้นหาได้และจัดการได้ง่าย อย่างไรก็ตาม หากคุณได้รับไฟล์ PDF ที่คุณไม่สามารถควบคุมรูปแบบของเอกสารที่ต้นฉบับได้ ดังนั้นเพื่อการเก็บถาวรข้อมูลและการสร้างดัชนี เราจำเป็นต้องแปลงเอกสารดังกล่าวเป็นรูปแบบที่สามารถค้นหาได้ ในบทความนี้ เราจะมาพูดถึงรายละเอียดเกี่ยวกับวิธีการทำ OCR PDF ออนไลน์และแปลงไฟล์ PDF ที่สแกนหรือเป็นภาพเป็นเอกสาร PDF ที่สามารถค้นหาได้หรือเป็นข้อความ
API การประมวลผล PDF
Aspose.PDF Cloud คือ API สำหรับการสร้างและจัดการ PDF ที่ใช้สถาปัตยกรรม REST ซึ่งได้รับรางวัลของเรา การใช้ API เดียวกันนี้ทำให้คุณสามารถดำเนินการต่างๆ ได้มากมาย เช่น แปลง EPUB เป็น PDF, แปลง HTML เป็น PDF, แปลง XPS เป็น PDF, แปลง DOC และ Doc X เป็น PDF, แปลง XPS เป็น PDF, แทรกภาพในไฟล์ PDF ใหม่หรือที่มีอยู่แล้ว เป็นต้น การดำเนินการทั้งหมดนี้ดำเนินการในระบบคลาวด์ ดังนั้นคุณจึงสามารถเข้าถึง API ได้จากทุกแพลตฟอร์ม
PDF OCR โดยใช้คำสั่ง cURL
คำสั่ง cURL เป็นวิธีง่ายๆ ในการเข้าถึง Aspose.PDF Cloud ผ่านทางเทอร์มินัลบรรทัดคำสั่ง แต่ก่อนจะเข้าถึง API คุณต้องไปที่ Aspose.Cloud Dashboard ก่อน และหากคุณมีบัญชี GitHub หรือ Google ให้ลงทะเบียนเพียงเท่านี้ มิฉะนั้น ให้คลิกที่ปุ่ม Create a new Account และระบุข้อมูลที่จำเป็น จากนั้นเข้าสู่ระบบแดชบอร์ดโดยใช้ข้อมูลรับรอง และขยายส่วนแอปพลิเคชันจากแดชบอร์ด จากนั้นเลื่อนลงไปที่ส่วนข้อมูลรับรองไคลเอนต์เพื่อดูรายละเอียดรหัสไคลเอนต์และความลับไคลเอนต์
ขั้นตอนถัดไปคือการสร้าง JSON Web Token (JWT) เพื่อให้สามารถเข้าถึง API ได้ผ่านพรอมต์คำสั่ง
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4&client_secret=d87269aade6a46cdc295b711e26809af" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
เมื่อเรามีโทเค็น JWT แล้ว ให้ดำเนินการคำสั่ง cURL ต่อไปนี้ในเทอร์มินัลบรรทัดคำสั่ง
curl -X PUT "https://api.aspose.cloud/v3.0/pdf/ocrscan.pdf/ocr?lang=eng" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
แปลง PDF ที่สแกนเป็น Searchable ใน Java
เพื่ออำนวยความสะดวกให้กับโปรแกรมเมอร์ Java ของเรา เราจึงได้สร้างตัวห่อหุ้ม Aspose.PDF Cloud ขึ้นมาเพื่อให้สามารถเข้าถึงฟีเจอร์ทั้งหมดของ Cloud API ได้อย่างง่ายดายในโค้ด Java ในทำนองเดียวกัน เพื่อดำเนินการ OCR กับ PDF ที่สแกน เราจำเป็นต้องใช้ Aspose.PDF Cloud SDK for Java
ขั้นตอนแรกคือการติดตั้ง SKD ในระบบ Cloud SDK พร้อมให้ดาวน์โหลดผ่าน Maven และ GitHub จากนั้นเพิ่มรายละเอียดต่อไปนี้ในไฟล์ pom.xml เพื่อดาวน์โหลดและใช้ Aspose.Pdf.jar ในโปรเจ็กต์ Maven build ของคุณ
<repositories>
<repository>
<id>aspose-cloud</id>
<name>artifact.aspose-cloud-releases</name>
<url>https://artifact.aspose.cloud/repo</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf-cloud</artifactId>
<version>21.1.0</version>
<scope>compile</scope>
</dependency>
</dependencies>
สำหรับข้อมูลเพิ่มเติม โปรดไปที่ วิธีติดตั้ง Aspose.Cloud SDK
ขั้นตอนด้านล่างนี้จะอธิบายกระบวนการดำเนินการ COR ในไฟล์รูปภาพ PDF
- ขั้นตอนแรกคือการสร้างอ็อบเจ็กต์ PdfApi ในขณะส่งรายละเอียด ClientID และความลับของ Client (มีอยู่ที่ แดชบอร์ด Aspose.Cloud)
- สร้างอินสแตนซ์ไฟล์และส่งตำแหน่งของไฟล์รูปภาพเป็นอาร์กิวเมนต์
- เรียกใช้เมธอด uploadFile(…) และส่งเอกสาร PDF และอินสแตนซ์ไฟล์เป็นอาร์กิวเมนต์
- ขั้นตอนถัดไปคือการสร้างอินสแตนซ์ของสตริงและตั้งค่าให้เป็นรหัสภาษาที่มีอยู่ในไฟล์ต้นฉบับ เช่น “rus,eng”
- ในที่สุด เรียกใช้เมธอด putSearchableDocument(…) ของ PdfApi และส่งชื่อไฟล์ PDF อินพุตและส่งรหัสภาษาเป็นอาร์กิวเมนต์
ภาษาสำหรับเครื่อง OCR ค่าที่รองรับ: eng, ara, bel, ben, bul, ces, dan, deu, ell, fin, fra, heb, hin, ind, isl, ita, jpn, kor, nld, nor, pol, por, ron, rus, spa, swe, tha, tur, ukr, vie, chisim, chitra หรือการรวมกัน เช่น eng, rus
// รับ ClientID และ ClientSecret จาก https://dashboard.aspose.cloud/
String clientId = "a41d01ef-dfd5-4e02-ad29-bd85fe41e3e4";
String clientSecret = "d87269aade6a46cdc295b711e26809af";
// สร้างอินสแตนซ์ PdfApi
PdfApi pdfApi = new PdfApi(clientSecret,clientId);
// อินพุตเอกสาร PDF
String name = "ocrscan.pdf";
// โหลดไฟล์จากระบบภายในเครื่อง
File file = new File("/Users/nayyershahbaz/Downloads/" + name);
// อัพโหลดไฟล์ไปยังที่เก็บข้อมูลบนคลาวด์
FilesUploadResult uploadResponse = pdfApi.uploadFile(name, file, null);
// ภาษาที่ใช้ในไฟล์ภาพ
String lang = "rus,eng";
// ดำเนินการ OCR บนเอกสาร PDF ที่เป็นภาพ
AsposeResponse response = pdfApi.putSearchableDocument(name, null, null, lang);
assertEquals(200, (int)response.getCode());

ภาพที่ 1:- ดูตัวอย่างผลลัพธ์ OCR
ไฟล์ PDF ตัวอย่างที่ใช้ในตัวอย่างข้างต้นสามารถดาวน์โหลดได้จากลิงค์ต่อไปนี้:
บทสรุป
ในบทความนี้ เราได้เรียนรู้ขั้นตอนง่ายๆ เกี่ยวกับวิธีการดำเนินการ OCR PDF ออนไลน์และแปลงเอกสาร PDF ที่สแกนเป็นเอกสาร PDF ที่ค้นหาได้ นอกเหนือจากการดำเนินการ OCR แล้ว SDK ยังมีประสิทธิภาพมากและสามารถดำเนินการอื่นๆ ได้อีกมากมาย สำหรับรายละเอียดเพิ่มเติม โปรดไปที่ Aspose.PDF Cloud Features