Data-Mining Flashcards

1
Q

Welche Arten von Variablen gibt es im Sinne des “Data-Mining”?

A
  • kategorielle Variablen (ordinal oder nominal) - numerische Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie nennt man im Sinne des überwachten Lernens unabhängige und abhängige Variablen?

A
  • unabhängige Variablen: Predictor-Variablen - abhängige Variablen: Response-Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist der Unterschied des nichtüberwachten Lernens zum überwachten Lernen?

A

verwendet unlabeled data (keine Unterteilung in Response und Predictor)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist das Ziel bei der Generierung eines Entscheidungsbaums?

A
  • Minimierung der durchschnittlichen Entropie - Maximierung des Informationsgewinns pro Schritt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die Formel für die Gesamt-Entropie?

A

E = -Σi=1k (pi log2 (pi))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly