PCA Flashcards
1
Q
Cosa fare dopo aver simulato distribuzione normale multivariata
A
Ricalcolare vettore media e matrice covarianza campionaria ( i valori non sono uguali)
2
Q
10 Steps per PCA su R
A
- Leggo dati
- Separo a mano i dati numerici da categorici
- Controllo covarianze e boxplot
- Standardizzo
- Calcolo PCA e osservo il summary
- Plotto i Loadings e Interpreto
- Plotto la var cumulata e interpreto
- Plotto il biplot e confermo ipotesi
- Osservo i boxplot dei loadings
- Divido il boxplot dei loadings secondo le variabili categoriche
3
Q
Cosa mi dice la matrice dei loadings
A
Quali sono i pesi (letti in verticale) da assegnare alle variabili per avere la PC corrispondente
4
Q
Vantaggi PCA
A
- Riduce spazio di rappresentazione ruotando assi per massimizzare varianza
- Elimina situazioni di variabili troppo correlate ( vedi regressione lineare)
5
Q
Come mi assicuro che in una variabile categorica factor venga rispettato un ordine?
A
Uso attributo
levels = c(“Jan”,”Feb”,…)