Texterkennung

Druckzeichen stark vergrößert Texterkennung beinhaltet die optische Erfassung und automatische Umwandlung gedruckter Zeichen in editierbaren Text. Es geht also darum, mit Texterkennung oder OCR das Abschreiben gedruckter Texte vom Computer erledigen zu lassen.
Als Vater der Texterkennung gilt Lawrence Roberts, der 1960 Versuche zur automatischen Erkennung von Zeichen unternahm. Erste Anwendungen der Texterkennung in der Praxis gab es bereits 1965 in Form von Hardware-Lösungen. Damals beschränkte sich die Erkennung allerdings noch auf spezielle Schriften wie OCR-A und OCR-B. 1976 entwickelte Ray Kurzweil das erste omnifonte, d.h. schriftartenunabhängige Texterkennungssystem. Mit zunehmender Leistungsfähigkeit der PCs haben seit Mitte der 80er software-basierte OCR-Lösungen immer mehr an Bedeutung hinzugewonnen.

Texterkennung gliedert sich in die Arbeitsschritte Scannen, Layout-Analyse, Segmentierung, Merkmalserkennung und Wörterbuch­abgleich, wobei bei modernen Systemen die Grenzen zwischen diesen Vorgängen immer mehr verwischen. Häufige Anwendungen von Texterkennung sind Dokumentenerkennung (siehe OmniPage), Archivsysteme und Formularauswertung (siehe FormPro).