Texterfassung

Druckzeichen stark vergrößert Texterfassung beinhaltet die optische Erfassung und automatische Umwandlung gedruckter Zeichen in editierbaren Text. Es geht also darum, mit Texterfassung oder OCR das Abschreiben gedruckter Texte vom Computer erledigen zu lassen.
Als Vater der Texterfassung gilt Lawrence Roberts, der 1960 Versuche zur automatischen Erkennung von Zeichen unternahm. Erste Anwendungen der Texterfassung in der Praxis gab es bereits 1965 in Form von Hardware-Lösungen. Damals beschränkte sich die Erkennung allerdings noch auf spezielle Schriften wie OCR-A und OCR-B. 1976 entwickelte Ray Kurzweil das erste omnifonte, d.h. schriftartenunabhängige Texterfassungssystem. Mit zunehmender Leistungsfähigkeit der PCs haben seit Mitte der 80er software-basierte OCR-Lösungen immer mehr an Bedeutung hinzugewonnen.

Texterfassung gliedert sich in die Arbeitsschritte Scannen, Layout-Analyse, Segmentierung, Merkmalserkennung und Wörterbuch­abgleich, wobei bei modernen Systemen die Grenzen zwischen diesen Vorgängen immer mehr verwischen. Häufige Anwendungen von Texterfassung sind Dokumentenerkennung (siehe OmniPage), Archivsysteme und Formularauswertung (siehe FormPro).