OCR

Druckzeichen stark vergrößert OCR (Optical Character Recognition = Optische Zeichenerkennung) ist der Fachbegriff für automatische Erkennung gedruckter Zeichen mittels optischer Abtastung (z.B. durch Scanner). Mit OCR kann man also das Abtippen gedruckter Texte vom PC erledigen lassen.
Als Vater der Texterfassung gilt Lawrence Roberts, der 1960 Versuche zur automatischen Erkennung von Zeichen unternahm. Erste Anwendungen der Texterfassung in der Praxis gab es bereits 1965 in Form von Hardware-Lösungen. Damals beschränkte sich die Erkennung allerdings noch auf spezielle Schriften wie OCR-A und OCR-B. 1976 entwickelte Ray Kurzweil das erste omnifonte, d.h. schriftartenunabhängige Texterfassungssystem. Mit zunehmender Leistungsfähigkeit der PCs haben seit Mitte der 80er Jahre software-basierte OCR-Lösungen immer mehr an Bedeutung hinzugewonnen.

OCR gliedert sich in die Arbeitsschritte Scannen, Layout-Analyse, Segmentierung, Merkmalserkennung und Wörterbuchabgleich, wobei bei modernen Systemen die Grenzen zwischen diesen Vorgängen immer mehr verwischen. Häufige Anwendungen von OCR sind Dokumentenerkennung (siehe OmniPage), Archivsysteme und Formularauswertung (siehe FormPro).