Vorlesung 6 Flashcards
Wie unterscheiden sich Feature-Selektion und -Extraktion?
Selektion: optimale Featureteilmenge durch objektive Funktion
Extraktion: Mapping hochdim. auf niedrigdim. Raum
Wie funktioniert die Feature-Seletkion?
ein Feature ist praktisch, falls es Klassen trennt, dazu teste
| mean(A) - mean(B) | / SE(A-B) > Threshold
mit SE(A-B) = sqrt(var(A)/n_A + var(B)/n_B)
- Filtermethode: basiert auf generellen Infos (kein Bias)
- Wrapper-Methoden: basieren auf Klassifikationsalgorithmus, predictive accuracy als Maß
-> zusammen: Embedded
Was fällt dir zu Korrelationsanalyse ein?
Berechnung Korrelationskoeffiziente (Pearson)
r_AB = Cov(A,B) / (σ_Aσ_B)
Welche Methoden gibtes bei der Datentransformation?
Fourier-Analyse (Signal -> Frequenzraum), Normalisierung (Min-Max, Z-Score), Featurekonstruktion (neue Features)
Beispiele:
neue Features: BMI = K * F(Gewicht, Größe)
Smoothing: 0,93 -> 1
Gib 4 Normalisierungsmethoden an
- Min-Max
v’ = (v - min_A) / (max_A - min_A) - Z-Score
v’ = (v - μ_A) /σ_A - Whitening
v’ = kein Bock dier Formel hier hinzuschreiben, die kommt sowieso net dran - Decimal scaling
v’=v/10^j
Welche drei Schritte hat der Algorithmus bei PCA
- berechne Kovarianzmatrix
- berechne, sortiere Eigenwert
- Eigenvektoren bilden Hauptkomponentenachse
Wie sind die Eigenwerte der Kovarianzmatrix?
positiv, da SPD
Was passiert bei wiederholter Multiplikation mit der Kovarianzmatrix?
Drehung in Richtung Hauptkomponentenachse