12: Spracheingabe Flashcards
1
Q
Wie funktioniert ein Mikrofon allgemein?
A
Wandlung von Luftschall in ein elektrisches Signal
2
Q
Unterscheiden Sie dynamische Mikrofone und Lasermikrofone voneinander und nennen Sie weitere Mikrofonarten.
A
-
Dynamisches Mikrofon
- Schallwellen treffen auf Membran → Membran bewegt eine Schwingspule im Magnetfeld
- Die induzierte Spannung wird als elektrisches Ausgangssignal verwendet
-
Lasermikrofon
- Ein Laserstrahl ist auf eine Glasscheibe gerichtet
- Durch Schallwellen bewegt sich die Glasscheibe
- Die Bewegung des Glases lenkt den Laserstrahl vom Fotodetektor ab
-
Weitere Mikrofonarten
- Kondensatormikrofon
- Kohlenmikrofon
- Piezomikrofon
3
Q
Warum hat das IPhone mehrere Mikrofone?
A
- Richtungsabdeckung von allen Seiten, unabhängig von der Telefonposition
- verbessertes Filtern von Umgebungsgeräuschen
4
Q
Nennen Sie Anwendungsbeispiele für akustische Eingabe über Mikrofone.
A
- Aufzeichnung von gesprochener Sprache
- Digitalisierung von gesprochener Sprache
- Sprachbasierte Steuerung der Maschine
- Weitere Anwendung → automatische Aktivitätserkennung (z.B. Essen, Werkstattarbeit), für Massendatenerhebung
5
Q
Was sind die drei großen Visionen in Bezug auf Spracheingabe?
A
- Verwendung natürlicher Sprache
- Ähnlich zu zwischenmenschlicher Kommunikation
- Natural User Interface (NUI) → Eingabegeräte sind für den Benutzer nicht als solche wahrnehmbar
6
Q
Was sind Anwendungsbeispiele für Spracheingabe?
A
- Auskunftssysteme/Voice Dialog Systems (z.B. Bank)
- Smartphone Bedienung (z.B. Siri)
- Diktieren von Text
7
Q
Was sind die Herausforderungen der Spracherkennung?
A
- Sprecher → Dialekte oder Eigenarten des Sprechers
- Umgebung → Andere Sprecher, Umgebungsgeräusche
-
Wortschatz
→ Großer Wortschatz reduziert die Korrektheit
→ Geringer Wortschatz reduziert die Flexibilität
→ Verwechslung von ähnlichen Begriffen und Namen
8
Q
Was ist Spracherkennung und welche Arten gibt es?
A
- Spracherkennung ist die Ermittlung der gesprochenen Wort- bzw. Lautfolge aus einem Sprachsignal
-
Mustererkennung
- Zuordnung des Sprachsignals zu unterschiedlichen Wort-/Lautfolgen
-
Klassifizierung
- Zuordnung von Signalen erfolgt zu bestimmten Klassen
9
Q
Wie funktioniert die Klassifizierung bei der Spracherkennung?
A
-
Signaldetektion
- Umwandlung der Sprache (Schall) in elektrisches Signal über Mikrofone
-
Merkmalsextraktion
- Extraktion bedeutender Teile und Zusammenfassung in einem Merkmalsvektor
- Mel-Frequenzskala → zeigt den Unterschied zwischen exakten und wahrgenommener Tonhöhe, Korrektur
- Verwendung HMM Modell
-
Trainingsphase
- Einlesen von Sprachmuster
- Lernen des Zusammenhangs von Mustern und Klassen
-
Erkennung
- Bei unbekannten Wörtern wird bei HMM die Einzelworterkennung auf Phonemebene aktiviert
⇒ Zerlegung des Wortes in Phoneme (kleinsten Lauteinheiten), Verkettung in HMM
- Bei unbekannten Wörtern wird bei HMM die Einzelworterkennung auf Phonemebene aktiviert