Föreläsning 6 - PCA Flashcards
Vad gör en PCA?
Reducerar antalet variabler genom att skapa principalkomponenter (nya variabler/faktorer) som sammanfattar de gamla.
Principalkomponenter sammanfattar det mesta av variablernas varians.
Sant.
Det är viktigt att faktorerna är ortogonala mot varandra.
Ja. På så vis korrelerar de inte och löser problem med kollineratitet.
Vad är EFA och CFA?
Två metoder för PCA.
Vad är skillnaden mellan EFA och CFA?
EFA: baseras inte på idéer om vilket datastruktur vi kanske hittar. Avslöjar mängden faktorer och variablerna som tillhör en specifik faktor.
CFA: Tydliga förväntningar av faktorstrukturen och vi vill testa för den förväntade strukturen.
Vilka kriterier måste uppfyllas för att göra en PCA?
- Mätskalorna måste vara lämpliga (intervall, kvot eller likert)
- Urvalet måste vara tillräckligt stort.
- Observationerna (svaren) måste vara oberoende av varandra.
- Variablerna måste korrelera med varandra. Kontrollera MSA genom att läsa av KMO > 0,7 eller 0,5.
Vad beskriver factor weights och factor loadings?
Förklarar relationen mellan variabeln och faktorn, med andra ord hur väl ett x och ett F sammanfaller.
PCA jobbar med standardiserade variabler. Vad möjliggör det?
- Egenvärde för respektive faktor kan beräknas som indikerar hur mycket en specifik faktor fångar den totala variansen hos variablerna.
- Communalities för respektive variabel som beskriver hur mycket de framtagna faktorerna fångar varje variabels varians (dvs hur väl de förklarar variabeln).
Vad är det minsta värdet på communalities som en variabel kan ha?
0,5.
Vilka metoder finns för att avgöra hur många faktorer som ska tas fram?
Kaiser-kriteriet: Välj de faktorer med egenvärde över 1.
Scree-plot: Avbryt ett steg innan armbågen.
Parallell analys
Förväntningar
Hur avgör man vilka variabler som relaterar till respektive faktor?
Mha factor loadings. Faktorn med högst factor loading får representera variabeln. Över 0,5 bra men 0,3 ok.
Varför vill man rotera faktorerna?
För att underlätta tolkningen och så att samtliga faktorer fångar variansen från variabler väl.
När variabler “klumpas ihop” till en faktor föreslås korrelationer mellan de ingående variablerna. Vad är viktigt att tänka på för att kontrollera lösningens inpassning till datat?
Korrelationerna som förelås av faktorerna får inte avvika från korrelationerna i datat alltför mycket = korrelationsresidualer. bör inte vara 0,5 i mer än 50 % av fallen.
Hur ser sambandet ut mellan faktorerna och variablerna den representerar?
Principalkomponentsvärdena (factor scores) är linjärkombinationer av originalvariablerna.
Hur beräknas faktorvärdena?
T.ex. genom regression. Denna tar vikterna från variablerna och räknar ut en score för varje faktor och case.