Basics Flashcards

1
Q

Beschreib das CL Paradigma

A

streben nach Erkenntnissen über bedeutungsdefinierende und bedeutungsunterscheidende Merkmale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beschreib das CL Ziel

A

algorithmische Verarbeitung natürlicher Sprache mittels Computer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Liste die formale Grundlagen der CL

A
  • Morphology
  • Syntax
  • Semantik
> Formale Sprachen
> Mengenlehre
> Grammatikformalism
> Reguläre Sprachen und Ausdrücke
> Endliche Automaten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Definiere Tokenisierung

A

Segmentierung eines Textes in Einheiten der Wortebene

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definiere PoS-Tagging

A

= part-of-speech tagging

> Zuordnung von Wörtern und Satzzeichen eines Textes zu Wortarten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Definiere Chunking

A

= light parsing

> Bestimmung des Typs eines Konstituenten (Phrasen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definiere Stemming

A

Extrahieren des Wortstammes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Erkläre den Begriff ‘formale Sprachen’

A

Ausdrucken einer Sprache in definierten, unverwechselbaren Form

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definiere Subsumieren

A

unterordnen
> A subsumiert B
= A ist untergeordnet an B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erkläre der unterschied zwischen existensonale und intensionale Spezifikationen

A

existensional: Auflistung
intensional: spezifiziert Bedingungen, Merkmale, Eigenschaften

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Liste die Möglichkeiten unendliche Sprachen intensional zu definieren

A
  • über Generator > Muster - Quelle

- über Eigenschaften > Grundmenge - Erkenner (Filter)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Liste einige Anwendungen der Computerlinguistik

A
  • Sprachübersetzung
  • Prüfsoftware
  • Sprachdialogsysteme und Sprachsteuerung
  • Marktforschung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erkläre die Funktion der Grammatikformalismen

A
  • Beschreibung unendlicher Sprachen über endliches Regelsystem
    > Grammatik G erzeugt formale Sprache L(G)
  • Bestimmung Sprachklasse (Chomsky-Hierarchie)
  • einfachster Grammatikformalismus
    > Reguläre Sprachen
    > Beschreibung aller endlichen Sprachen
    > kompakte Notation über regulären Ausdruck
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Liste einige Anwendungen für reguläre Ausdrücke

A
  • Durchsuchen von Texten
  • Überprüfung von Nutzereingaben
  • Text Mining
  • Linguistische Korpussuche
  • Tokenisierung und Satzgrenzenerkennung
  • Wortlisten und Varianten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Erkläre die Unterschied zwischen ‘greedy’ und ‘non-greedy’ / ‘lazy’ matching

A
  • greedy: so viel wie möglich

- lazy: minimaler Match

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Erkläre den Konzept ‘Abgeschlossenheit’

A

(wort1) operation (wort2) = (wort3)

(reguläre Sprache 1) operation (reguläre Sprache 2) = (reguläre Sprache 3)

> Sprachklasse bleibt behalten

17
Q

Erkläre die Unterschied zwischen FSA und FST

A
  • FSA erkennt
  • FST transformiert
    > FST hat Ausgabealphabet
18
Q

Erkläre die Unterschied zwischen nicht-Deterministische und Deterministische FSA

A

Nicht-Deterministisch
- per Zustand mehrere gleiche Übergangsrelationen in unterschiedliche Zustände
- leeres Wort als Übergangsrelation
- bilden keine eigene Sprachklasse
- lässt sich in einen äquivalenten deterministischen FSA überführen
> determinierungsalgorithmus

Deterministisch

  • nur einmalige Übergangsrelationen per Zustand
  • kein leeres Wort als Übergangsrelation
19
Q

Liste einige Ziele / Anwendungen der morphologischen Analyse

A

Analyse und Generierung der Morphologie

  • Tokenisierung
  • Lemmatisierung, Stemming
  • PoS-Tagging
  • Identifikation morphosyntaktischer Merkmale (Flexion)
  • Zerlegung komplexen Wörter
> ling. Korpussuche
> Rechtschreibkorrektur
> Information retrieval
> maschinelle Übersetzung
> syntaktische Analyse
20
Q

Definiere Lemmatisierung

A

Extrahieren der Zitierform (Form des Wortes in Wörterbuch)

21
Q

Erkläre die Unterschied zwischen Token und Typen

A
Token = Instanzen (ohne auf Wiederholungen zu achten)
Typen = unterschiedliche Wörter
22
Q

Erkläre die Unterschied zwischen Flexion und Wortbildung

A

Flexion

  • Derivate eines Stammes (Lexem)
  • keine Änderung der Grundbedeutung
  • kodierung morphosyntaktische Merkmale
  • Deklination, Konjugation, Komparation

Wortbildung

  • neue Lexeme
  • veränderte Bedeutung
  • konkatenativ: Derivation, Komposition
  • nichtkonkatenativ: Konversion, Reduplikation, Kurzwörter (clipping), Kofferwörter (blending)
  • Abgrenzung Neologismen und kreativen Wortspielen
23
Q

Liste einige morphosyntaktische Merkmale (Deutsch)

A
Substantivisch
- Person:
- Numerus:
- Kasus:
- Genus:
> Kongruenz in Nominalphrasen
> starke vs. schwache Adjektivdeklination (Bestimmtheit)
Verbale Kategorien
- Tempus:
- Modus:
- (Genus Verbi:
> Kongruenz mit Subjekt (Person, Numerus)
24
Q

Definiere Flexionsparadigma

A

Gesamtheit der unterschiedlichen Flexionsformen einer Wortklasse

25
Q

Erkläre die Unterschied zwischen ‘open’ und ‘closed’ Wortklassen

A

open

  • es lassen sich einfacher neue Wörter zufügen
  • Substantiv, Verb, Adjektiv, Adverb

closed

  • beschränkter Anzahl
  • können keine Neue erstellt werden
  • Artikel, Pronomen, Präposition, Konjunktion
26
Q

Definiere Parsing

A

syntax analysis

27
Q

Definiere Textsegmentierung

A

in sinnvolle Textteile (bspw. einzelne Paragraphen) aufteilen

28
Q

Beschreibe die Grammatiken und Erkenner für Sprachen der Chomsky-Hierarchie

A

type 0

  • algorithmic languages
  • rewrite grammars
  • Turing machines (TM)

type 1

  • context-sensitive languages
  • context-sensitve grammars
  • linear bounded TM
  • RHS gleich lang / länger als LHS

type 2

  • context-free languages
  • context-free grammars
  • push-down automata
  • LHS: nur 1 Nichtterminal

type 3

  • regular languages
  • regular expressions / linear grammars
  • finite-state automata
  • LHS: nur 1 Nichtterminal; RHS: 1 Terminal / 1 Terminal und 1 Nichtterminal
29
Q

Liste die Aufgaben der semantischen Interpretation

A
  • Formale Repräsentation der Bedeutung von Äußerungen
  • Ebenen der Bedeutungsrepräsentation: Wort, Satz, Diskurs
  • Kompositionalitätsprinzip
  • Computerlinguistik: Syntax-Semantik-Schnittstelle
  • Voraussetzung: formale Bedeutungsrepräsentation
30
Q

Erkläre Modus Ponens

A

Wenn aus p folgt q, und p liegt fest, dann folgt q

> wenn es regnet werden die Straßen nass
es regnet
die Straßen werden nass

31
Q

Erkläre Modus Tollens

A

Wenn aus p folgt q, und nicht-q liegt fest, dann folgt nicht-p

> wenn es regnet werden die Straßen nass
die Straßen sind nicht nass
es regnet nicht

32
Q

Erkläre das Kontrapositionsgesetz

A

Wenn aus p folgt q, dann aus nicht-q folgt nicht-p

33
Q

Erkläre die Unterschied zwischen lexikalische und grammatischen Morpheme

A

grammatisch
- Funktionswörter

lexikalisch

  • haben ‘Inhalt’
  • verweisen auf reale ‘Sachen’
34
Q

Erkläre die Unterschied zwischen Subsumtion und Unifikation

A

Subsumption

  • Relation!! > kein Ergebnis, nur Vergleich
  • 2 durch eine Subsumptionsrelation verbundene Merkmalstrukturen sind unifizierbar
  • beide Merkmalstrukturen müssen die gleiche Information beinhalten, einer von Beide soll aber auch noch zusätzliche Infos beinhalten > ‘kleinere’ Struktur subsumiert ‘größere’ Struktur

Unifikation

  • Aktion, mit Ergebnis
  • 2 unifizierbare Merkmalstrukturen sind nicht unbedingt durch eine Subsumptionrelation verbunden
35
Q

Liste die zulässigen Ersetzungsregeln

A
  • feasible pairs > a:b
  • default pair > a:a
  • insertion > 3:a
  • deletion > a:3
  • leere Übergang > 3:3
36
Q

Liste die Ressourcen der CL

A
  • Lexica
  • Grammatiken
  • Wissensquellen
  • Korpora
37
Q

Liste die übliche Operatoren der Aussagenlogik

A
  • Und = Konjunktion
  • Oder = Disjunktion
  • Kontravalenz
  • Äquivalenz
  • Konditional
  • Negation
38
Q

Liste die Quantoren der Prädikatenlogik

A

Universalität
Existenz
Nichtexistenz
Kardinalität