קבצי PDF נמצאים בשימוש נרחב באינטרנט לשיתוף מידע ומידע. הם די פופולריים מכיוון שהם שומרים על נאמנות המסמכים בעת צפייה בכל פלטפורמה. עם זאת, אין לנו שליטה על המקור וחלק מהקבצים משותפים בפורמט סרוק. לפעמים אתה מצלם תמונה כקובץ PDF ובהמשך אתה צריך לחלץ את התוכן מהקובץ. אז פתרון בר-קיימא הוא לבצע פעולת OCR ולחלץ את הטקסט. עם זאת, לאחר פעולת ה-OCR, אם אתה צריך לשמר את הקובץ, המרה לפורמט PDF היא פתרון בר-קיימא. במאמר זה, אנו הולכים לדון בשלבים כיצד להמיר PDF סרוק ל-PDF טקסט באמצעות Python.
OCR PDF API
Aspose.PDF Cloud SDK עבור Python הוא מעטפת סביב Aspose.PDF Cloud. זה מאפשר לך לבצע את כל יכולות עיבוד קבצי PDF בתוך אפליקציית Python. בצע מניפולציה של קובצי PDF ללא Adobe Acrobat או כל יישום אחר. אז כדי להשתמש ב-SDK, השלב הראשון הוא ההתקנה שלו, והוא זמין להורדה במאגר PIP ו-GitHub. כעת בצע את הפקודה הבאה בשורת המסוף/הפקודה כדי להתקין את הגרסה העדכנית ביותר של SDK במערכת.
pip install asposepdfcloud
MS Visual Studio
אתה יכול גם להוסיף ישירות את ההפניה בפרויקט Python שלך בתוך פרויקט Visual Studio. אנא חפש את asposepdfcloud כחבילה תחת חלון סביבת Python. אנא בצע את השלבים הממוספרים בתמונה למטה כדי להשלים את תהליך ההתקנה.
Aspose.Cloud Dashboard
מאחר שממשקי ה-API שלנו נגישים רק לאנשים מורשים, אז השלב הבא הוא יצירת חשבון ב-Aspose.Cloud Dashboard. אם יש לך חשבון GitHub או Google, פשוט הירשם או לחץ על הלחצן צור חשבון חדש וספק את המידע הנדרש. כעת היכנס ללוח המחוונים באמצעות אישורים והרחב את קטע היישומים מלוח המחוונים וגלול מטה לכיוון הקטע אישורי לקוח כדי לראות את פרטי זיהוי הלקוח ופרטי סוד הלקוח.
תמונה PDF ל-PDF ניתן לחיפוש ב-Python
אנא בצע את השלבים המפורטים להלן כדי לבצע פעולת OCR על מסמך PDF סרוק ולאחר מכן שמור אותו כקובץ שניתן לחיפוש (הפוך את PDF לאפשרי חיפוש). השלבים האלה עוזרים לנו לפתח OCR מקוון בחינם באמצעות Python.
- ראשית, עלינו ליצור מופע של מחלקה ApiClient תוך כדי אספקת Client ID Client Secret כארגומנטים
- שנית, צור מופע של מחלקה PdfApi שלוקח אובייקט ApiClient כארגומנט קלט
- כעת קרא את השיטה putsearchabledocument(..) של מחלקת PdfApi אשר לוקחת את שם ה-PDF בקלט ופרמטר אופציונלי המציין את השפה של מנוע ה-OCR.
def ocrPDF():
try:
#Client credentials
client_secret = "406b404b2df649611e508bbcfcd2a77f"
client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"
#initialize PdfApi client instance using client credetials
pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)
# צור מופע PdfApi תוך העברת PdfApiClient כארגומנט
pdf_api = PdfApi(pdf_api_client)
#input PDF file name
input_file = 'image-based-pdf-sample.pdf'
# התקשר ל-API כדי לבצע פעולת OCR ולשמור את הפלט באחסון בענן
response = pdf_api.put_searchable_document(name=input_file,lang='eng')
# הדפס הודעה במסוף (אופציונלי)
print('Image PDF successfully converted to Text PDF !')
except ApiException as e:
print("Exception while calling PdfApi: {0}".format(e))
print("Code:" + str(e.code))
print("Message:" + e.message)
בתמונה למעלה, החלק השמאלי מציין את קובץ ה-PDF הסרוק לקלט והחלק בצד ימין מציג תצוגה מקדימה של ה-PDF מבוסס הטקסט שנוצר. ניתן להוריד את קבצי הדוגמה המשמשים בדוגמה לעיל מ-image-based-pdf-sample.pdf ו-OCR-Result.pdf.
OCR מקוון באמצעות פקודות cURL
ניתן לגשת אל ממשקי ה- REST API גם באמצעות פקודות cURL ומכיוון שממשקי ה-API של הענן שלנו מבוססים על ארכיטקטורת REST, כך נוכל גם להשתמש בפקודת cURL לביצוע PDF OCR באינטרנט. עם זאת, לפני שנמשיך בפעולת ההמרה, עלינו ליצור JSON Web Token (JWT) על סמך אישורי הלקוח האישיים שלך שצוינו בלוח המחוונים של Aspose.Cloud. זה חובה מכיוון שממשקי ה-API שלנו נגישים רק למשתמשים רשומים. אנא בצע את הפקודה הבאה כדי ליצור את אסימון JWT.
curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"
ברגע שיש לנו את אסימון JWT, אנא בצע את הפקודה הבאה כדי לבצע את פעולת ה-OCR ולשמור את הפלט באותו אחסון ענן.
curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/image-based-pdf-sample.pdf/ocr" \
-H "accept: application/json" \
-H "authorization: Bearer <JWT Token>"
סיכום
במאמר זה, דנו בשלבים של תמונה PDF ל-PDF ניתן לחיפוש באמצעות קטע קוד של Python. בדקנו גם את הפרטים כיצד לבצע OCR מקוון באמצעות פקודות cURL. מכיוון שערכות ה-SDK שלנו בענן מפותחות תחת רישיון MIT, אז אתה יכול להוריד את קטע הקוד המלא מ-GitHub ולעדכן אותו בהתאם לדרישות שלך. אנו ממליצים לך בחום לחקור את מדריך למפתחים כדי ללמוד עוד על תכונות מרגשות אחרות המוצעות כעת על ידי Cloud API.
במקרה שיש לך שאילתות קשורות כלשהן או שאתה נתקל בבעיות כלשהן בזמן השימוש בממשקי ה-API שלנו, אל תהסס לפנות אלינו דרך [פורום תמיכת הלקוחות החינמי].13
מאמרים קשורים
אנו מציעים גם לעבור על המאמרים הבאים כדי ללמוד עוד עליהם