Basics Flashcards

1
Q

Beschreib das CL Paradigma

A

streben nach Erkenntnissen über bedeutungsdefinierende und bedeutungsunterscheidende Merkmale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beschreib das CL Ziel

A

algorithmische Verarbeitung natürlicher Sprache mittels Computer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Liste die formale Grundlagen der CL

A
  • Morphology
  • Syntax
  • Semantik
> Formale Sprachen
> Mengenlehre
> Grammatikformalism
> Reguläre Sprachen und Ausdrücke
> Endliche Automaten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Definiere Tokenisierung

A

Segmentierung eines Textes in Einheiten der Wortebene

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definiere PoS-Tagging

A

= part-of-speech tagging

> Zuordnung von Wörtern und Satzzeichen eines Textes zu Wortarten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Definiere Chunking

A

= light parsing

> Bestimmung des Typs eines Konstituenten (Phrasen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definiere Stemming

A

Extrahieren des Wortstammes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Erkläre den Begriff ‘formale Sprachen’

A

Ausdrucken einer Sprache in definierten, unverwechselbaren Form

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definiere Subsumieren

A

unterordnen
> A subsumiert B
= A ist untergeordnet an B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erkläre der unterschied zwischen existensonale und intensionale Spezifikationen

A

existensional: Auflistung
intensional: spezifiziert Bedingungen, Merkmale, Eigenschaften

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Liste die Möglichkeiten unendliche Sprachen intensional zu definieren

A
  • über Generator > Muster - Quelle

- über Eigenschaften > Grundmenge - Erkenner (Filter)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Liste einige Anwendungen der Computerlinguistik

A
  • Sprachübersetzung
  • Prüfsoftware
  • Sprachdialogsysteme und Sprachsteuerung
  • Marktforschung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erkläre die Funktion der Grammatikformalismen

A
  • Beschreibung unendlicher Sprachen über endliches Regelsystem
    > Grammatik G erzeugt formale Sprache L(G)
  • Bestimmung Sprachklasse (Chomsky-Hierarchie)
  • einfachster Grammatikformalismus
    > Reguläre Sprachen
    > Beschreibung aller endlichen Sprachen
    > kompakte Notation über regulären Ausdruck
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Liste einige Anwendungen für reguläre Ausdrücke

A
  • Durchsuchen von Texten
  • Überprüfung von Nutzereingaben
  • Text Mining
  • Linguistische Korpussuche
  • Tokenisierung und Satzgrenzenerkennung
  • Wortlisten und Varianten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Erkläre die Unterschied zwischen ‘greedy’ und ‘non-greedy’ / ‘lazy’ matching

A
  • greedy: so viel wie möglich

- lazy: minimaler Match

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Erkläre den Konzept ‘Abgeschlossenheit’

A

(wort1) operation (wort2) = (wort3)

(reguläre Sprache 1) operation (reguläre Sprache 2) = (reguläre Sprache 3)

> Sprachklasse bleibt behalten

17
Q

Erkläre die Unterschied zwischen FSA und FST

A
  • FSA erkennt
  • FST transformiert
    > FST hat Ausgabealphabet
18
Q

Erkläre die Unterschied zwischen nicht-Deterministische und Deterministische FSA

A

Nicht-Deterministisch
- per Zustand mehrere gleiche Übergangsrelationen in unterschiedliche Zustände
- leeres Wort als Übergangsrelation
- bilden keine eigene Sprachklasse
- lässt sich in einen äquivalenten deterministischen FSA überführen
> determinierungsalgorithmus

Deterministisch

  • nur einmalige Übergangsrelationen per Zustand
  • kein leeres Wort als Übergangsrelation
19
Q

Liste einige Ziele / Anwendungen der morphologischen Analyse

A

Analyse und Generierung der Morphologie

  • Tokenisierung
  • Lemmatisierung, Stemming
  • PoS-Tagging
  • Identifikation morphosyntaktischer Merkmale (Flexion)
  • Zerlegung komplexen Wörter
> ling. Korpussuche
> Rechtschreibkorrektur
> Information retrieval
> maschinelle Übersetzung
> syntaktische Analyse
20
Q

Definiere Lemmatisierung

A

Extrahieren der Zitierform (Form des Wortes in Wörterbuch)

21
Q

Erkläre die Unterschied zwischen Token und Typen

A
Token = Instanzen (ohne auf Wiederholungen zu achten)
Typen = unterschiedliche Wörter
22
Q

Erkläre die Unterschied zwischen Flexion und Wortbildung

A

Flexion

  • Derivate eines Stammes (Lexem)
  • keine Änderung der Grundbedeutung
  • kodierung morphosyntaktische Merkmale
  • Deklination, Konjugation, Komparation

Wortbildung

  • neue Lexeme
  • veränderte Bedeutung
  • konkatenativ: Derivation, Komposition
  • nichtkonkatenativ: Konversion, Reduplikation, Kurzwörter (clipping), Kofferwörter (blending)
  • Abgrenzung Neologismen und kreativen Wortspielen
23
Q

Liste einige morphosyntaktische Merkmale (Deutsch)

A
Substantivisch
- Person:
- Numerus:
- Kasus:
- Genus:
> Kongruenz in Nominalphrasen
> starke vs. schwache Adjektivdeklination (Bestimmtheit)
Verbale Kategorien
- Tempus:
- Modus:
- (Genus Verbi:
> Kongruenz mit Subjekt (Person, Numerus)
24
Q

Definiere Flexionsparadigma

A

Gesamtheit der unterschiedlichen Flexionsformen einer Wortklasse

25
Erkläre die Unterschied zwischen 'open' und 'closed' Wortklassen
open - es lassen sich einfacher neue Wörter zufügen - Substantiv, Verb, Adjektiv, Adverb closed - beschränkter Anzahl - können keine Neue erstellt werden - Artikel, Pronomen, Präposition, Konjunktion
26
Definiere Parsing
syntax analysis
27
Definiere Textsegmentierung
in sinnvolle Textteile (bspw. einzelne Paragraphen) aufteilen
28
Beschreibe die Grammatiken und Erkenner für Sprachen der Chomsky-Hierarchie
type 0 - algorithmic languages - rewrite grammars - Turing machines (TM) type 1 - context-sensitive languages - context-sensitve grammars - linear bounded TM - RHS gleich lang / länger als LHS type 2 - context-free languages - context-free grammars - push-down automata - LHS: nur 1 Nichtterminal type 3 - regular languages - regular expressions / linear grammars - finite-state automata - LHS: nur 1 Nichtterminal; RHS: 1 Terminal / 1 Terminal und 1 Nichtterminal
29
Liste die Aufgaben der semantischen Interpretation
- Formale Repräsentation der Bedeutung von Äußerungen - Ebenen der Bedeutungsrepräsentation: Wort, Satz, Diskurs - Kompositionalitätsprinzip - Computerlinguistik: Syntax-Semantik-Schnittstelle - Voraussetzung: formale Bedeutungsrepräsentation
30
Erkläre Modus Ponens
Wenn aus p folgt q, und p liegt fest, dann folgt q > wenn es regnet werden die Straßen nass > es regnet > die Straßen werden nass
31
Erkläre Modus Tollens
Wenn aus p folgt q, und nicht-q liegt fest, dann folgt nicht-p > wenn es regnet werden die Straßen nass > die Straßen sind nicht nass > es regnet nicht
32
Erkläre das Kontrapositionsgesetz
Wenn aus p folgt q, dann aus nicht-q folgt nicht-p
33
Erkläre die Unterschied zwischen lexikalische und grammatischen Morpheme
grammatisch - Funktionswörter lexikalisch - haben 'Inhalt' - verweisen auf reale 'Sachen'
34
Erkläre die Unterschied zwischen Subsumtion und Unifikation
Subsumption - Relation!! > kein Ergebnis, nur Vergleich - 2 durch eine Subsumptionsrelation verbundene Merkmalstrukturen sind unifizierbar - beide Merkmalstrukturen müssen die gleiche Information beinhalten, einer von Beide soll aber auch noch zusätzliche Infos beinhalten > 'kleinere' Struktur subsumiert 'größere' Struktur Unifikation - Aktion, mit Ergebnis - 2 unifizierbare Merkmalstrukturen sind nicht unbedingt durch eine Subsumptionrelation verbunden
35
Liste die zulässigen Ersetzungsregeln
- feasible pairs > a:b - default pair > a:a - insertion > 3:a - deletion > a:3 - leere Übergang > 3:3
36
Liste die Ressourcen der CL
- Lexica - Grammatiken - Wissensquellen - Korpora
37
Liste die übliche Operatoren der Aussagenlogik
- Und = Konjunktion - Oder = Disjunktion - Kontravalenz - Äquivalenz - Konditional - Negation
38
Liste die Quantoren der Prädikatenlogik
Universalität Existenz Nichtexistenz Kardinalität