01a - Sprachsynthese Flashcards
Was ist Sprachsynthese?
- Eine Maschine soll beliebigen Text vorlesen/ausgeben können
Was ist ein TTS System?
- Ein Text to Speech Synthese System
- Es beschreibt wie Text in Sprache umgewandelt wird bzw. welche Schritte dafür notwndig sind
Aus welchen Prozessteilen besteht ein TTS System?
- NLP = Natural Language Processing
- DSP = Digital Signal Processing
Was passiert beim Natural Language Processing?
- Ist Teil des TTS Systems
- Der Text wird in Lautschrift und ProsodieBeschreibung konvertiert
Was passiert beim Digital Signal Processing?
- Die Ausgabe des NLP wird genommen und es wird eine Synthese durchgeführt
Was wird bei der Textnormalisierung gemacht und wofür wird sie gebraucht?
- Buchstaben werden je nach Wort oft anders ausgesprochen (st, …)
- Manchmal sind Symbole, Abkürzungen (.NET) im Text enthalten, wovon man nicht weiß wie diese ausgesprochen gehören
- Bei der Textnormalisierung muss herausgefunden werden wie diese Buchstaben richtig ausgsprochen werden
Was ist Prosodie?
- Die Prosodie bestimmt folgende Eigenschaften von lautsprachlichen Äußerungen:
- Akzent/Betonung
- Grundfrequenzkonturen
- Lautstärke
- Intonation
- Sprechgeschwindigkeit
Was ist Intonation?
- Der Tonhöhenverlauf innerhalb eines Sprechaktes
Was ist das Problem bei der Prosodie in Bezug auf Sprachsynthese?
- Im geschriebenen Text ist nur wenig Information über Prosodie kodiert
Was ist ein Phonem?
- Ein einzelner Laut
Was sind Grapheme?
- Nicht jeder Laut hat einen Buchstaben
- Für den Laut ch, sch, nk, pf, ts, äu, … werden mehrere Buchstaben verwendet
- Laute, die Buchstabenkombinationen benötigen nennt man Grapheme
Was passiert beim Synthetisator?
- Das Sprachsignal wird erzeugt
- Hier werden Dauer, Lautstärke und Tonhöhe des Signals bestimmt
Was passiert bei der modernen Sprachsynthese?
- Bei der Textanalyse findet eine Segmentierung statt
- Segment → Phonem, Silbe, Wort, Phrase
- Segmente werden mit einer Reihe von akustischen udn phonetischen Eigenschaften wie Grundfrequenzverlauf, Dauer oder Nachbarn gespreichert
Welche allgemeinen Ansätze bei der modernen Sprachsynthese gibt es?
- Konkatenative Synthese
- Formatsynthese
- Artikulartorische Synthese
Wie funktioniert die konkatenative Synthese, welche Probleme gibt es damit und wo wird sie eingesetzt?
- Durch Suchalgorithmen und gewichtete Entscheidungsbäume wird eine Reihe möglichst großer Segmente bestimmt
- Probleme können bei der Aneinanderreihung der Segmente entstehen, da sie sich in Lautstärk und Grundfrequenz unterscheiden
- Wird häufig in kommerziellen Systemen verwendet