01a - Sprachsynthese Flashcards

Question 1

Q

Was ist Sprachsynthese?

Answer

A

Eine Maschine soll beliebigen Text vorlesen/ausgeben können

Question 2

Q

Was ist ein TTS System?

Answer

A

Ein Text to Speech Synthese System

- Es beschreibt wie Text in Sprache umgewandelt wird bzw. welche Schritte dafür notwndig sind

Question 3

Q

Aus welchen Prozessteilen besteht ein TTS System?

Answer

A

NLP = Natural Language Processing

- DSP = Digital Signal Processing

Question 4

Q

Was passiert beim Natural Language Processing?

Answer

A

Ist Teil des TTS Systems

- Der Text wird in Lautschrift und ProsodieBeschreibung konvertiert

Question 5

Q

Was passiert beim Digital Signal Processing?

Answer

A

Die Ausgabe des NLP wird genommen und es wird eine Synthese durchgeführt

Question 6

Q

Was wird bei der Textnormalisierung gemacht und wofür wird sie gebraucht?

Answer

A

Buchstaben werden je nach Wort oft anders ausgesprochen (st, …)
Manchmal sind Symbole, Abkürzungen (.NET) im Text enthalten, wovon man nicht weiß wie diese ausgesprochen gehören
Bei der Textnormalisierung muss herausgefunden werden wie diese Buchstaben richtig ausgsprochen werden

Question 7

Q

Was ist Prosodie?

Answer

A

Die Prosodie bestimmt folgende Eigenschaften von lautsprachlichen Äußerungen:
- Akzent/Betonung
- Grundfrequenzkonturen
- Lautstärke
- Intonation
- Sprechgeschwindigkeit

Question 8

Q

Was ist Intonation?

Answer

A

Der Tonhöhenverlauf innerhalb eines Sprechaktes

Question 9

Q

Was ist das Problem bei der Prosodie in Bezug auf Sprachsynthese?

Answer

A

Im geschriebenen Text ist nur wenig Information über Prosodie kodiert

Question 10

Q

Was ist ein Phonem?

Answer

A

Ein einzelner Laut

Question 11

Q

Was sind Grapheme?

Answer

A

Nicht jeder Laut hat einen Buchstaben
Für den Laut ch, sch, nk, pf, ts, äu, … werden mehrere Buchstaben verwendet
Laute, die Buchstabenkombinationen benötigen nennt man Grapheme

Question 12

Q

Was passiert beim Synthetisator?

Answer

A

Das Sprachsignal wird erzeugt

- Hier werden Dauer, Lautstärke und Tonhöhe des Signals bestimmt

Question 13

Q

Was passiert bei der modernen Sprachsynthese?

Answer

A

Bei der Textanalyse findet eine Segmentierung statt
Segment → Phonem, Silbe, Wort, Phrase
Segmente werden mit einer Reihe von akustischen udn phonetischen Eigenschaften wie Grundfrequenzverlauf, Dauer oder Nachbarn gespreichert

Question 14

Q

Welche allgemeinen Ansätze bei der modernen Sprachsynthese gibt es?

Answer

A

Konkatenative Synthese
Formatsynthese
Artikulartorische Synthese

Question 15

Q

Wie funktioniert die konkatenative Synthese, welche Probleme gibt es damit und wo wird sie eingesetzt?

Answer

A

Durch Suchalgorithmen und gewichtete Entscheidungsbäume wird eine Reihe möglichst großer Segmente bestimmt
Probleme können bei der Aneinanderreihung der Segmente entstehen, da sie sich in Lautstärk und Grundfrequenz unterscheiden
Wird häufig in kommerziellen Systemen verwendet

Question 16

Q

Wie funktioniert die Formatsynthese?

Answer

Study These Flashcards

A

Beruht auf der Beobachtung, dass es zur Unterscheidung der Vokale genügt, die ersten zwei Formanten passend zu reproduzieren
Ein Formant wird durch einen in der Mittenfrequenz und Güte steuerbaren Bandpass nachgebildet

Question 17

Q

Welchen Ansatz gibt es zur Formatsynthese und wie funktioniert dieser?

Answer

Study These Flashcards

A

Akustisches Modell

- Das Modell bildet die Resonanzeigenschaften des Vokaltrakts durch einen Filter nach

Question 18

Q

Wie funktioniert die artikulorische Synthese?

Answer

Study These Flashcards

A

Basiert auf einem Modell des menschlichen Vokaltrakts und den Prinzipien der Schall Generierung und Schall Ausbreitung
Mit modernen bildgebenden Verfahren und Computergraphiken lassen sich Anatomie und Zusammenspiel der Artikulatoren visualisieren
Hoher Rechenaufwand
Hauptsächlich in Forschung eingesetzt
Kein kommerzieller Einsatz

Question 19

Q

Was ist die Speech Synthesis Markup Language

Answer

Study These Flashcards

A

Eine W3C Spezifikation
Eine Markup Sprache, mit der man mit Kommandos Dinge wie Textnormalisierung, Betonunssteuerung, Pause, usw. angeben kann

01a - Sprachsynthese Flashcards

(19 cards)