אין הייַנט ס דיגיטאַל וועלט, מיר זענען ינאַנדייטיד מיט וואַסט אַמאַונץ פון דאַטן, פיל פון וואָס איז סטאָרד אין PDF פֿאָרמאַט. אָבער, ניט אַלע פּדפס זענען באשאפן גלייַך, און פילע זענען פשוט בילד-באזירט טעקעס וואָס זענען שווער צו זוכן אָדער רעדאַגירן. דאָס איז ווו OCR (Optical Character Recognition) קומט אין. מיט די מאַכט פון OCR, איר קענען לייכט גער בילד-באזירט פּדף צו סעאַרטשאַבלע פּדפס, מאכן זיי גרינגער צו זוכן, רעדאַגירן און טיילן. אין דעם בלאָג, מיר וועלן ויספאָרשן ווי צו נוצן OCR צו גער בילד פּדפס צו סעאַרטשאַבלע פּדף מיט Java.