11: Handschrifterkennung Flashcards
Welche Aspekte beinhaltet die Handschrifterkennung?
- Eingabe von handschriftlichen Notizen
- Speicherung und Weiterverarbeitung von Bitmaps
- Direkte Erkennung als Wörter
Was sind die wesentlichen Tasks der Handschrifterkennung?
- Vorverarbeitung
- Merkmalsextraktion
- Erkennung von Handschriftdaten
Welche Arten der Handschrifterkennung gibt es? Erklären Sie diese.
Offline:
- Der Schriftzug liegt als Bitmap (Grafik) vor
- Beispiele:
-automatische Erkennung von Druckbuchstaben
-Auswertung von Adressen aus Briefen
Online:
- Zu jedem Punkt der abgetasteten Trajektorie (Pfad) wird die zeitliche und räumliche Information aufgezeichnet
- Erfassung von …
-x/y-Position
-Druckintensität
-Stiftneigung
-Stiftrotation
- Für MMI relevant, aber aufwändiger als Offline-Verfahren
Warum ist das Online-Verfahren für MMI wichtiger als das Offline-Verfahren?
- Handschrift wird auf dem Gerät selbst aufgezeichnet und ausgewertet
→ Es stehen also online-Daten zur Verfügung
→ Online-Verfahren bietet höhere Erkennungsraten
Was sind die Komponenten des Eingangssignals bei der handschriftlichen Eingabe?
- x- und y-Position
- Druck
- Stiftneigung
- Stiftrotation
Wie erfolgt die Normalisierung bei “freier Eingabe”?
Normalisierung = Eliminierung der Freiheitsgrade
- scale → Skalierung
- slant → Schriftneigung
- skew → Zeilenneigung
Aus welchen Schritten besteht die Vorverarbeitung bei der Handschrifterkennung?
- Diskretisierung
- Zeilenneigung
- Schriftneigung
- Schriftgröße
Erklären Sie die Diskretisierung in der Vorverarbeitung.
- Die Abtastung erfolgt zeitbasiert → Dadurch ist die Auflösung von Schriftteilen abhängig von der Schreibgeschwindigkeit
⇒ ungleiche Abstände der Abtastpunkte - Vorgehen → Neuabtastung der Schriftzüge, damit Abtastpunkte die gleichen Abstände zueinander haben
- Diskretisierung nach dem letzten Schritt der Vorverarbeitung wiederholen
Wann kann die Diskretisierung entfallen?
Wenn die Schrift nur “offline” also als Bitmap vorliegt.
Wie lässt sich die Zeilenneigung korrigieren?
- Neuausrichtung des Schriftzuges
- Prüfen der Entropie (= Grad der Unordnung) → Ziel ist möglichst geringe Entropie
- Ergebnis → Kernlinie ist möglichst horizontal
Wie lässt sich die Schriftneigung korrigieren?
- Man nimmt an, dass die Schriftneigung in der Zeile konstant ist
- Ausrichtung der Buchstaben innerhalb eines Schriftzuges
- Prüfen der Entropie (= Grad der Unordnung) → Ziel ist möglichst geringe Entropie
- Ergebnis → reduzierte Schriftneigung
Wie lässt sich die Schriftgröße normieren?
- Schätzung der Referenzlinien im Schriftzug:
- Oberlängenlinie
- Kernlinie
- Grundlinie
- Unterlängenlinie
Welche schreiberabhängigen Merkmale werden durch die Vorverarbeitung nicht kompensiert?
Die Art und Weise wie ein konkreter Buchstabe geschrieben wird, z.B. Schreibschrift vs. Druckschrift
Was ist die Merkmalsextraktion in der Handschrifterkennung?
- Extraktion von besonderen Merkmalen aus dem normalisierten Schriftzug
- 4- oder 5-dimensionaler Merkmalsvektor (ohne/mit Druckinformation)
Wie erfolgt die Erkennung in der Handschrifterkennung und was sind mögliche Methoden?
- Erfassung der Schreibweisen auf Modellebene ⇒ Modelle werden angewendet
- Handschrift wird in kleine Segmente (Grapheme) zerlegt und über Algorithmen mit Modellen abgeglichen
Methoden für dynamische Modellierung und Erkennung:
- Hidden-Markov-Modelle (HMM) → Merkmalsextraktion aus Rohdaten, Ermittlung der wahrscheinlichsten Wortfolge
- Neuronale Netze → lernfähig auf Basis von Fehleroptimierung, robust und fehlertolerant (lernen ist aufwendig)