Factoranalyse Flashcards
factoranalyse
Factoranalyse is een statistische techniek die gebruikt wordt om een grote verzameling variabelen (zoals vragen uit een vragenlijst of psychologische testen) terug te brengen tot een kleiner aantal onderliggende, latente variabelen of factoren
een factor/component:
= groepje variabelen die sterk correleren
doelen factoranalyse
- Data-reductie: aantal variabelen reduceren
- Data samenvatten: zoeken naar onderliggende dimensies (items -> subschalen)
Exploratieve FA
zoektocht naar structuur in set variabelen / data-reductie
Confirmatorische FA
= a priori samenhang tussen variabelen toetsen op basis van theorie/eerder onderzoek
Wat voorkomt een factoranalyse
Voorkomt multicolineariteit
Bartlett’s test of sphericity
heeft de correlatiematrix een significant aantal correlaties tussen de variabelen?
Measure of sampling adequacy (MSA):
maat van 0-1 waar 1 aangeeft dat elke variabele perfect voorspeld kan worden door de anderen. Moet > .50
Variantie van variabelen opsplitsen in:
- Gemeenschappelijke variantie: deel variantie in een variabele die gedeeld wordt met alle andere variantie in de analyse
- Unieke variantie: deel variantie geassocieerd met slechts 1 variabele, kan niet verklaard worden door correlaties met anderen
- Error variantie: deel variantie te wijten aan fouten
De totale variantie bestaat uit
- gemeenschappelijke variantie
- unieke variantie;
specifieke variantie + error variantie
PCA
= Component analysis of Principale Componenten Analyse
= gaat uit van de totale variantie en levert factoren op die kleine proporties unieke (en soms error) variantie bevatten
PFA
= Common factor analysis of Principale Factor Analyse
= gaat enkel uit van de gemeenschappelijke variantie en levert dus factoren op die enkel hierop gebaseerd zijn
= gaat ervan uit dat de unieke/error variantie niet belangrijk zijn voor het definiëren van de structuur van de variabelen
Hoe beslissen of je PCA of PFA ?
2 criteria;
- Doel van de FA?
- A priori kennis omtrent de variantie in de variabelen
Doel van de FA? PCA of PFA
- PCA: samenvatten van zo goed als alle oorspronkelijke variantie in zo weinig mogelijk factoren
- PFA: identificeren van onderliggende dimensies die gemeenschappelijke variantie in de variabelen reflecteren
PCA aangewezen bij:
- Data-reductie als voornaamste doel: minimum aantal factoren om een maximum proportie van de TOTALE variantie in de oorspronkelijke variabelen te representeren
- A priori kennis geeft aan dat unieke variantie een vrij klein deel van de totale variantie uitmaken
- Oorspronkelijke aantal variabelen blijft behouden -> evenveel componenten -> welke behouden?
- Identificeren van latente dimensies/constructen die vervat zitten in de oorspronkelijke data
- A priori weinig kennis over de hoeveelheid unieke variantie
- Items meten nét iets anders
Hoeveel factoren/componenten?
- Eigenwaarde > 1 = Kaiser criterium
- A priori criterium
- % variantie
- scree plot
Kaiser criterium
= Eigenwaarde > 1
Eigenwaarde/eigenvalue
= hoeveelheid variantie toe te schrijven aan een factor/component
Idee: elke factor moet minstens de variantie van één enkele variable (=1 in PCA) verklaren om behouden te blijven
A priori criterium
- Op voorhand al kennis over hoeveel factoren er zouden moeten zijn (vb.: replicatie)
- Geef gewenste aantal op
% variantie
- Bereiken van een specifiek cumulatief % variantie verklaard door de opeenvolgende factoren (bijv. min 60% variantie verklaren)
- Garandeert praktische relevantie factoren
Factorlading
= correlatie elke variabele met de factor
3 fundamentele processen helpen bij interpretatie en selecteren finale factor structuur:
- Schatten van de factormatrix
- Factor rotatie
- Factor interpretatie en herspecificatie
soorten factor rotatie
- orthogonale factor rotatie
- Oblique factor rotatie
Orthogonale factor rotatie
= assen blijven steeds loodrecht op elkaar (90° hoek) -> factoren zijn onafhankelijk van elkaar, correleren niet (SPSS: VARIMAX)
Oblique factor rotatie:
assen hoeven niet loodrecht op elkaar te staan, factoren mogen correleren (realistischer!) (SPSS: DIRECT OBLIMIN)
“Praktische” significantie
(als n>100)
beoordelen van de significantie van factorladingen
- “praktische” significantie
- statistische significantie
- aantal variabelen/factoren
aantal variabelen factoren -> om als significant beschouwd te worden
- Is een kleinere lading nodig bij een grotere sample of een groter aantal variabelen
- Is een grotere lading nodig bij een groter aantal factoren
Communaliteit:
= Totale hoeveelheid variantie die een oorspronkelijke variabele deelt met alle andere variabelen die in de factoranalyse zijn opgenomen. Berekend als de som van de gekwadrateerde ladingen voor een variabele over de factoren.
Het hoofdidee achter FDA (functionele data analyse)
= dat de waarnemingen door een vloeiend/continu proces worden gegenereerd, en bijgevolg is het doel van FDA inzicht te krijgen in dit proces