Week 4 college Flashcards
Wat zijn de vier voornaamste verschillen tussen PCA en exploratieve factoranalyse?
Wat is het voornaamste doel van EFA en PCA?
data reductie
Beschrijf PCA via de algebraische methode
een principal component is een liniaire combinatie van de variabelen
Beschrijf PCA via de geometrische methode
waar staan de lange en korte as voor?
Wat zijn de variabelen, observaties en componenten binnen de geometrische PCA?
variabelen: richting in p-dimensionale ruimte–>vectoren
observaties: punten in dezelfde ruimte
componenten: zijn vectoren, zoals variabelen.
wat wordt bedoeld met orthogonaal binnen geometrische PCA?
rechte hoek op de andere lijn
Het doel van PCA is data reductie. toch k=p (even veel variabelen als componenten). Waarom is het dan toch data reductie?
omdat elke volgende component minder variantie verklaart dan de vorige, is een klein aantal componenten voldoende om de meeste variantie van de variabelen te verklaren.
Waaruit bestaat de componentlading? wat krijg je als je deze kwadrateerd?
correlatie tussen variable Xi en component j. kwadraat= proportie verklaarde variantie.
Wat is het verschil tussen eigenwaarde en communaliteit?
eigenwaarde= slaat op component–>geeft geen variantie. wil je variantie verklaard door component j (van alle variabelen) weten? doe dan / aantal variabelen.
communaliteit=slaat op variabel–>geef variantie.
Een derde methode voor eht extraheren van componenten is interpreteren. hoe werkt dit op de algebraische manier? Wat kun je stellen aan de hand van de onderstaande tabel?
Je zou hier kunnen stellen dat F1 op alle variabelen sterk correleert. Er is er niet specifiek 1 heel belangrijk? is er een algemene onderliggende factor misschien?
bij F2 kun je bijvoorbeeld stellen dat het component sterk gerelateerd is aan rekenkundige variabelen (x4 en x5)
Wat is de functie van rotatie bij PCA?
oplossing hier is de assen draaien. de pijlen blijven hetzelfde. We geven hier de techniek een andere bias.
Een manier van Rotatie bij PCA is de VARIMAX. Hoe werkt dit?
orthogonaal of niet?
is een orthogonale orientatie. Hierbij kies je de nieuwe assen zo dat voor elke factor de variantie van de gekwadrateerde componentenlading zo hoog mogelijk is. Dit leidt tot een aantal ladingen die heel hoog zijn (dicht bij 1) en een aantal dicht bij 0.
Een manier van rotatie bij PCA is OBLIMIN. Hoe werkt dit?
niet orthogonaal. zelfde als VARIMAX, maar nu kunnen de geroteerde componenten wel gecorreleerd zijn. dit wordt ook wel oblieke rotatie genoemd.
theoretisch is deze methode vaak aantrekkelijker, echter
-interpretatie lastig en oplossing vaak vergelijkbaar met VARIMAX.
Welke twee zaken veranderen rotaties WEL en welke NIET? mbt rotaties in PCA
In PCA wanneer er evenveel componenten als geobserveerde variabelen zijn noemen we dat?
full dimensionality