Data-Mining Flashcards
1
Q
Welche Arten von Variablen gibt es im Sinne des “Data-Mining”?
A
- kategorielle Variablen (ordinal oder nominal) - numerische Variablen
2
Q
Wie nennt man im Sinne des überwachten Lernens unabhängige und abhängige Variablen?
A
- unabhängige Variablen: Predictor-Variablen - abhängige Variablen: Response-Variablen
3
Q
Was ist der Unterschied des nichtüberwachten Lernens zum überwachten Lernen?
A
verwendet unlabeled data (keine Unterteilung in Response und Predictor)
4
Q
Was ist das Ziel bei der Generierung eines Entscheidungsbaums?
A
- Minimierung der durchschnittlichen Entropie - Maximierung des Informationsgewinns pro Schritt
5
Q
Was ist die Formel für die Gesamt-Entropie?
A
E = -Σi=1k (pi log2 (pi))
6
Q
A