Sprachverarbeitung, Korpuslinguistik Flashcards

1
Q

Worin liegt das Problem bei der maschinellen Spracherkennung?

A

Bei ganzen Äußerungen werden inhaltliche Analysen und der Kontext benötigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welches Problem eröffnet sich bei der französischen maschinellen Sprachverarbeitung jeglicher Art?

A

viele Homophone, Mehrdeutigkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was macht die Morphologische Analyse?

A

maschinelle Erkennung von Wortarten mit sogenannten “Taggern”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind sogenannte “Tagger”?

A

Tagger sind Programme, die die morphologische Analyse durchführen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was macht die syntaktische Analyse?

A

Texte werden maschinell syntaktisch analysiert mit sogenannten “Parsern”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind sogenannte “Parser”?

A

Parser sind Programme, die Texte automatisch syntaktisch analysiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was passiert bei der Textgenerierung?

A

Maschine/Programme produziert Text selbstständig auf mündlicher oder schriftlicher Ebene
maschinell generierte Äußerungen durch Bausteine wie zB bei Bahnhofsdurchsagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie nennt man nach bestimmten Kriterien zusammengestellte Sammlungen von geschriebener/gesprochener Sprachdaten für linguistische Analysen?

A

Korpus, Korpora

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist ein Korpus?

A

eine nach bestimmten Kriterien zusammengestellte Sammlung von geschriebener/gesprochener Sprachdaten für linguistische Analysen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist neu an dem Verfahren Sprache mithilfe von Texten zu analysieren bei der Korpuslinguistik?

A

Texte liegen in elektronischer Form vor und können in elektronischer Form analysiert werden, dadurch sind quantitative Korpusanalysen wesentlich schneller

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welche sind die beiden 2 bekanntesten französischen Korpora?

A
  1. TLF: größter Wörterbuch der französischen Sprache, korpusbasiert aber veraltet
  2. Frantext: kein Referenzkorpus, da zu 80% basierend auf literarischen Texten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Auf was basieren die bekanntesten deustchen Korpora des IDS?

A

Fast ausschließlich auf zeitungsartikeln

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welche ist die 1. Generation der maschinellen Übersetzung?

A

Regelbasiert:
Programm analysiert Texte auf semantischer, syntaktischer, morphologischer Ebene
> Übersetzung
> neuen Text generieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche ist die 2. Generation der maschinellen Übersetzung?

A

Statistisch:
basiert auf Korpora aus 2sprachigen und übersetzten Texten
> Programm rechnet passende Übersetzung aus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist das Problem an der Statistischen maschinellen Übersetzung?

A

Qualität hängt von Umfang und Qualität der Korpora ab

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welche ist die 3. Generation der maschinellen Übersetzung?

A

Neuronal:
arbeitet mit statistischen Mitteln: Wahrscheinlichkeitsrechnung
Prinzip wie bei automatischen Ergänzungen bei Autokorrektur, künstliche Intelligenz

17
Q

Worin bestehen die Probleme bei der neuronalen maschinellen Übersetzung?

A

semantische Fehler
Unvollständigkeit
Texte werden in die Cloud mitaufgenommen > Datendiebstahl

18
Q

In welchen Bereichen wird die maschinelle Übersetzung hauptsächlich genutzt/gebraucht?

A

Maschinelle Übersetzung noch nicht gut genug um humane Übersetzung zu ersetzen, deshalb hauptsächlich für den alltäglichen Bereich für Vereinfachung

19
Q

Welche Typen von Korpora gibt es?

A
  1. einsprachige/mehrsprachige Korpora
  2. Vergleichskorpora: Texte der gleichen Textsorte, die keine Übersetzungen sind
  3. Parallelkorpora: Ausgangstexte und deren Übersetzungen
20
Q

Was besagt die “Explication hypothesis”?

A

Übersetzungen sind expliziter als Originaltexte

21
Q

Was ist eine Relais-Übersetzung?

A

Eine Relais-Übersetzung ist eine Übersetzung, die durch eine 3. Sprache stattfindet. Dies wird vor allem bei weniger verbreiteten Sprachen genutzt für deren Sprachpaar es keine Übersetzer gibt.

22
Q

Was ist pre-editing?

A

spezielle Vorbereitung eines Textes vom Computer um Fehler wie zB Eigennamen und Idiome zu vermeiden

23
Q

Was ist post-editing?

A

Korrektur von Übersetzungsfehlern und Verstößen gegen die Norm