PDF OCR

קבצי PDF נמצאים בשימוש נרחב באינטרנט לשיתוף מידע ומידע. הם די פופולריים מכיוון שהם שומרים על נאמנות המסמכים בעת צפייה בכל פלטפורמה. עם זאת, אין לנו שליטה על המקור וחלק מהקבצים משותפים בפורמט סרוק. לפעמים אתה מצלם תמונה כקובץ PDF ובהמשך אתה צריך לחלץ את התוכן מהקובץ. אז פתרון בר-קיימא הוא לבצע פעולת OCR ולחלץ את הטקסט. עם זאת, לאחר פעולת ה-OCR, אם אתה צריך לשמר את הקובץ, המרה לפורמט PDF היא פתרון בר-קיימא. במאמר זה, אנו הולכים לדון בשלבים כיצד להמיר PDF סרוק ל-PDF טקסט באמצעות Python.

OCR PDF API

Aspose.PDF Cloud SDK עבור Python הוא מעטפת סביב Aspose.PDF Cloud. זה מאפשר לך לבצע את כל יכולות עיבוד קבצי PDF בתוך אפליקציית Python. בצע מניפולציה של קובצי PDF ללא Adobe Acrobat או כל יישום אחר. אז כדי להשתמש ב-SDK, השלב הראשון הוא ההתקנה שלו, והוא זמין להורדה במאגר PIP ו-GitHub. כעת בצע את הפקודה הבאה בשורת המסוף/הפקודה כדי להתקין את הגרסה העדכנית ביותר של SDK במערכת.

 pip install asposepdfcloud

MS Visual Studio

אתה יכול גם להוסיף ישירות את ההפניה בפרויקט Python שלך בתוך פרויקט Visual Studio. אנא חפש את asposepdfcloud כחבילה תחת חלון סביבת Python. אנא בצע את השלבים הממוספרים בתמונה למטה כדי להשלים את תהליך ההתקנה.

Aspose.PDF Cloud Python

תמונה 1:- Aspose.PDF Cloud SDK עבור חבילת Python.

Aspose.Cloud Dashboard

מאחר שממשקי ה-API שלנו נגישים רק לאנשים מורשים, אז השלב הבא הוא יצירת חשבון ב-Aspose.Cloud Dashboard. אם יש לך חשבון GitHub או Google, פשוט הירשם או לחץ על הלחצן צור חשבון חדש וספק את המידע הנדרש. כעת היכנס ללוח המחוונים באמצעות אישורים והרחב את קטע היישומים מלוח המחוונים וגלול מטה לכיוון הקטע אישורי לקוח כדי לראות את פרטי זיהוי הלקוח ופרטי סוד הלקוח.

אישורי לקוח

תמונה 2:- אישורי לקוח בלוח המחוונים של Aspose.Cloud.

תמונה PDF ל-PDF ניתן לחיפוש ב-Python

אנא בצע את השלבים המפורטים להלן כדי לבצע פעולת OCR על מסמך PDF סרוק ולאחר מכן שמור אותו כקובץ שניתן לחיפוש (הפוך את PDF לאפשרי חיפוש). השלבים האלה עוזרים לנו לפתח OCR מקוון בחינם באמצעות Python.

  • ראשית, עלינו ליצור מופע של מחלקה ApiClient תוך כדי אספקת Client ID Client Secret כארגומנטים
  • שנית, צור מופע של מחלקה PdfApi שלוקח אובייקט ApiClient כארגומנט קלט
  • כעת קרא את השיטה putsearchabledocument(..) של מחלקת PdfApi אשר לוקחת את שם ה-PDF בקלט ופרמטר אופציונלי המציין את השפה של מנוע ה-OCR.
def ocrPDF():
    try:
        #Client credentials
        client_secret = "406b404b2df649611e508bbcfcd2a77f"
        client_id = "88d1cda8-b12c-4a80-b1ad-c85ac483c5c5"

        #initialize PdfApi client instance using client credetials
        pdf_api_client = asposepdfcloud.api_client.ApiClient(client_secret, client_id)

        # צור מופע PdfApi תוך העברת PdfApiClient כארגומנט
        pdf_api = PdfApi(pdf_api_client)

        #input PDF file name
        input_file = 'image-based-pdf-sample.pdf'

        # התקשר ל-API כדי לבצע פעולת OCR ולשמור את הפלט באחסון בענן
        response = pdf_api.put_searchable_document(name=input_file,lang='eng')

        # הדפס הודעה במסוף (אופציונלי)
        print('Image PDF successfully converted to Text PDF !')    
    except ApiException as e:
        print("Exception while calling PdfApi: {0}".format(e))
        print("Code:" + str(e.code))
        print("Message:" + e.message)
תצוגה מקדימה של PDF OCR

תמונה 3:- תצוגה מקדימה של פעולת PDF OCR.

בתמונה למעלה, החלק השמאלי מציין את קובץ ה-PDF הסרוק לקלט והחלק בצד ימין מציג תצוגה מקדימה של ה-PDF מבוסס הטקסט שנוצר. ניתן להוריד את קבצי הדוגמה המשמשים בדוגמה לעיל מ-image-based-pdf-sample.pdf ו-OCR-Result.pdf.

OCR מקוון באמצעות פקודות cURL

ניתן לגשת אל ממשקי ה- REST API גם באמצעות פקודות cURL ומכיוון שממשקי ה-API של הענן שלנו מבוססים על ארכיטקטורת REST, כך נוכל גם להשתמש בפקודת cURL לביצוע PDF OCR באינטרנט. עם זאת, לפני שנמשיך בפעולת ההמרה, עלינו ליצור JSON Web Token (JWT) על סמך אישורי הלקוח האישיים שלך שצוינו בלוח המחוונים של Aspose.Cloud. זה חובה מכיוון שממשקי ה-API שלנו נגישים רק למשתמשים רשומים. אנא בצע את הפקודה הבאה כדי ליצור את אסימון JWT.

curl -v "https://api.aspose.cloud/connect/token" \
-X POST \
-d "grant_type=client_credentials&client_id=88d1cda8-b12c-4a80-b1ad-c85ac483c5c5&client_secret=406b404b2df649611e508bbcfcd2a77f" \
-H "Content-Type: application/x-www-form-urlencoded" \
-H "Accept: application/json"

ברגע שיש לנו את אסימון JWT, אנא בצע את הפקודה הבאה כדי לבצע את פעולת ה-OCR ולשמור את הפלט באותו אחסון ענן.

curl -v -X PUT "https://api.aspose.cloud/v3.0/pdf/image-based-pdf-sample.pdf/ocr" \
-H  "accept: application/json" \
-H  "authorization: Bearer <JWT Token>"

סיכום

במאמר זה, דנו בשלבים של תמונה PDF ל-PDF ניתן לחיפוש באמצעות קטע קוד של Python. בדקנו גם את הפרטים כיצד לבצע OCR מקוון באמצעות פקודות cURL. מכיוון שערכות ה-SDK שלנו בענן מפותחות תחת רישיון MIT, אז אתה יכול להוריד את קטע הקוד המלא מ-GitHub ולעדכן אותו בהתאם לדרישות שלך. אנו ממליצים לך בחום לחקור את מדריך למפתחים כדי ללמוד עוד על תכונות מרגשות אחרות המוצעות כעת על ידי Cloud API.

במקרה שיש לך שאילתות קשורות כלשהן או שאתה נתקל בבעיות כלשהן בזמן השימוש בממשקי ה-API שלנו, אל תהסס לפנות אלינו דרך [פורום תמיכת הלקוחות החינמי].13

מאמרים קשורים

אנו מציעים גם לעבור על המאמרים הבאים כדי ללמוד עוד עליהם