Factoranalyse Flashcards
PCA
Principale componenten analyse
Principale componentenanalyse
Door de variabelen samen te nemen, de gewogen sommen samen nemen, de som van de variabelen. Het zijn principale componenten
EFA
Exploratieve factoranalyse
Exploratieve factoranalyse
Zoeken naar de onderliggende factoren die de verschillen op de vragen verklaren
Doel van PCA
Datareductie
Doel EFA
Ontdekken van latente variabelen
Het ontdekken van latente variabelen met een hypothese vooraf
Conformatieve factoranalyse
Ontdekken van latente variabelen zonder hypothese vooraf
Exploratieve factor analyse
de 2 opties als je doel enkel datareductie is
PCA of clusteranalyse
eigenwaarde
De som van de gekwadrateerde lading
Regels PCA
- De eerste principale pakt de meeste variantie op
- de tweede component beschrijft zoveel mogelijk van de nog overgebleven variantie
Enz…
Stappen PCA
- Zoek de principale componenten
- Kijk voor elke component hoeveel % van de totale variantie door de betreffende component wordt beschreven
- Maak een bewuste keuze voor het aantal componenten
- Bereken de geroteerde oplossing voor een beter interpreteerbare oplossing
- Interpreteer de geroteerde oplossing, is er sprake van een eenvoudige structuur?
- Geef inhoudelijke betekenis aan de componenten
3 manieren om het aantal componenten te bepalen
- Je kiest een bepaald % en kijkt hoeveel je er hierbij nodig hebt
- Kaisers rule
- Cattels elbow criterion
Kaisers rule
Alle componenten met een eigenwaarde van meer dan 1 neem je mee
Cattel’s Elbow criterion
Op basis van een scree plot. Je kijkt waar de knik zit en pakt dan enkel de punten die hiervoor vallen mee. Dit is de meest gebruikte manier
Communaliteiten
Per item aangeven hoeveel info de PC gezamelijk behouden
Uniciteit
Deel van de variantie in een item die niet door de gezamelijke pc opgepakt wordt
uniciteit = 1 - communaliteit
Perfecte eenvoudige structuur
- Elk item laadt op 1 en slechts 1 component
- Bij elke component horen een aantal items
Principale component
Een gewogen gemiddelde van alle indicatoren
Datareductie
Het hoofddoel is om een groot aantal variabelen terug te brengen tot een kleiner aantal ‘samenvattende variabelen’ (principale componenten), zonder dat er teveel informatie verloren gaat
Gemeenschappelijke variantie
De gemeenschappelijke variantie is gelijk aan het kwadraat van
de correlatie.
Waaruit is alle statistische informatie opgebouwd?
Variantie + correlatie
Hoe krijg je de eerste principale component?
Met behulp van wiskundige optimalisatie kunnen we de waarden voor 𝑎1, 𝑎2 en 𝑎3 bepalen, waarmee je een PC krijgt die
de meeste variantie behoudt
Synoniem gewogen som van variabelen
lineaire combinatie
Eigenwaarde
De variantie van de waarnemingen langs deze as wordt beschreven door de eigenwaarde die bij de eerste
component hoort.
Dus, bij élke component hoort een eigenwaarde, en deze eigenwaarde geeft de mate van variatie op de
component aan
Wanneer zijn componenten orthogonaal
Verschillen langs de groene as staan haaks op de verschillen
langs de rode as. M.a.w., de tweede component beschrijft
verschillen tussen personen die niets te maken hebben met de
verschillen op de eerste component
Waarmee geven we componentladingen aan?
een a
lading 𝑎(𝑖𝑐) verwijst naar…
de lading variabele 𝑖 op component 𝑐. Dus, het eerste index
verwijst naar de variabele, en de tweede index verwijs naar de component.
Hoe bereken je de eigenwaarde
Het is de som van de gekwadrateerde ladingen
Grove stappen PCA analyse
- Zoek de principale componenten (wiskundige oplossing)
- Kijk voor elke component hoeveel % van de totale variantie door de betreffende component wordt
beschreven. - Maak een beargumenteerde keuze over het aantal componenten dat je wilt behouden.
- Bereken de geroteerde oplossing om een beter interpreteerbare oplossing te krijgen.
- Interpreteer de geroteerde oplossing: Is er sprake van een eenvoudige (simpele) structuur? Welke
items/componenten passen wel/niet binnen de structuur? - Geef een inhoudelijk betekenis aan de componenten. Wat betekenen hoge/lage scores op de
component? Hoe hangen de geroteerde componenten samen?
Wat vertelt de component matrix?
Deze tabel geeft de wiskundige oplossing van de componenten. Het is de uitkomst van een wiskundige optimalisatie. We noemen dit de initiële oplossing.
Maar dit is nog NIET de oplossing waar we als inhoudelijke onderzoekers naar zullen kijken! Voordat we gaan interpreteren passen we meestal een rotatie toe.
We kunnen de initiële oplossing wel gebruiken om te onderzoeken hoeveel % van de totale variantie elke
component voor zijn rekening neemt en een keuze maken voor het aantal te behouden componenten.
Waar kun je de initiele oplossing terugvinden van PCA
In de total variance explained tabel, de eerste 3 kolommen, initial eigenvalues
Waar kun je de resultaten zien specifiek voor het aantal componenten dat je gekozen hebt?
In de total variances explained tabel de laatste 3 rijen (extraction sums of squared loadings). Wanneer je bv 2 componenten gekozen hebt, zijn de eerste 2 rijen hier hetzelfde als de 2 rijen aan het begin van de tabel bij PCA. Bij EFA niet
Waar kun je zien per item welk deel van de variantie in dat item door alle PCA’s wordt verklaard?
De communaliteiten tabel, en dan bij extraction
Wat is de grens van een eenvoudige structuur in de praktijk?
Iedere component heeft zijn eigen groep van items.
ieder item heeft op slechts één van de
componenten een substantiële lading:
|𝑎(𝑖𝑐)| ≥ 0.30.
Kruisladingen
Een item op meerdere componenten substantieel laadt