PCA Flashcards

1
Q

Cosa fare dopo aver simulato distribuzione normale multivariata

A

Ricalcolare vettore media e matrice covarianza campionaria ( i valori non sono uguali)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

10 Steps per PCA su R

A
  1. Leggo dati
  2. Separo a mano i dati numerici da categorici
  3. Controllo covarianze e boxplot
  4. Standardizzo
  5. Calcolo PCA e osservo il summary
  6. Plotto i Loadings e Interpreto
  7. Plotto la var cumulata e interpreto
  8. Plotto il biplot e confermo ipotesi
  9. Osservo i boxplot dei loadings
  10. Divido il boxplot dei loadings secondo le variabili categoriche
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cosa mi dice la matrice dei loadings

A

Quali sono i pesi (letti in verticale) da assegnare alle variabili per avere la PC corrispondente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vantaggi PCA

A
  1. Riduce spazio di rappresentazione ruotando assi per massimizzare varianza
  2. Elimina situazioni di variabili troppo correlate ( vedi regressione lineare)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Come mi assicuro che in una variabile categorica factor venga rispettato un ordine?

A

Uso attributo
levels = c(“Jan”,”Feb”,…)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly