CFA RMSEA SEM Flashcards
Wanneer gebruik je PCA
Als je alle variantie die er is wil verklaren
Wanneer gebruik je EFA
Als je juist wil kijken naar de samenhang van items, aan de hand van 1 of meer factoren
Wat is een probleem bij grote residuen?
Een lage betrouwbaarheid
Waaruit is de totale variantie opgebouwd?
De common variance en unieke variance
Synoniem common variance
Communality
Hoe bereken je communality
Je telt de eigenwaardes van de items die je wil bekijken op, en deelt dit door het totale aantal items
Waaruit is unieke variantie opgebouwd?
Specifieke en error variantie
Error variantie
Meetfouten
Specifieke variantie
Variantie specifiek voor het item maar die niet wordt gedeeld met andere items
2 verschillen EFA en PCA
- We beschouwen de factoren als oorzaken bij EFA
- We verdelen de itemvariantie in 2 componenten, gezamelijk en uniek
Kenmerken EFA
- Geen specifieke hypothese van tevoren
- Je begint met een geschat aantal factoren, en kijkt hierna of dit klopt
Hoeveel items heb je minimaal nodig voor EFA
Minimaal 3
Hoe bereken je het aantal unieke itemcorrelaties
Je kijkt naar het aantal indicatoren
Als je er 4 hebt:
(4x(4-1) /2
(4x3)/ 2
12/2
6
Variantie bij gestandaardiseerde variabelen
Variantie is 1
Covariantie = correlatie
iteratief zoeken
Je begint met een schatting van de communaliteiten. Als je deze hebt update je de gereduceerde correlatie matrix door de communaliteiten te berekenen van het geschatte model. Hierna ga je weer op zoek naar factorladingen waarmee je de huidige gereduceerde correlatie matrix het best kunt verklaren
Veelgebruikte initiele schatting van de communaliteit
De R-square die je krijgt als je het betreffende item regresseert op alle andere items
4 stappen om je EFA te controleren
- Prechecks, is EFA zinvol?
- Kies het aantal factoren dat je wil extraheren
- Schat het factor model met het gekozen aantal factoren en de geigende rotatie
- Evalueren van de factoroplossing
Deelvragen van prechecks, is EFA zinvol
- Is je steekproef groot genoeg
- Voldoen de data aan bepaalde verdelingsaannames
- Is de samenhang tussen de items factoriseerbaar
Is je steekproef groot genoeg?
Hier is een vuistregel voor, je moet minimaal 5 waarnemingen per item hebben, maar 100 man als absolute ondergrens
Voldoen de data aan bepaalde verdelingsaannames?
- Onafhankelijke observaties
- Scores op geobserveerde variabelen zijn continu en getrokken uit normaal verdeelde populatie
- Scores op latente variabelen zijn ook normaal verdeeld
Is de samenhang tussen de items factoriseerbaar?
3 vuistregels
- Minstens 60% van de correlaties is groter dan 0.3
- Bartlett’s spericity test is significant
- KMO-index
Waar staat KMO voor
Kaiser Meyes Olkin index
Bartlett’s specirity test
De toets test H0: alle interitem correlaties zijn 0
vs
h1: 1 of meer correlaties wijken af van 0
Onvoldoende KMO index
onder de 0.6
matig tot redelijke kmo index
0.6-0.8
adquate kmo index
boven de 0.8
Wat is belangrijk voor stap 2: kies het aantal factoren dat je wil extraheren
Je MOET minimaal 3 items per factor hebben
Over welke 2 dingen moet je een beslissing nemen bij stap 3: schat het factor model met het gekozen aantal factoren en de geeigende rotatie?
- Welke schattingsmethode gebruik je
- Welke rotatiemethode gebruik je
CFA
Conformatieve factoranalyse
Eisen CFA
- Een aantal ladingen is vastgesteld op 0
- De rest van de ladingen worden wel geschat
- Items mogen op meerdere factoren laden, als er per factor maar enkele unieke items zijn
- Wordt meestal gebruikt om een simpele structuur te forceren
- Roteren mag niet!!
Voordelen CFA
- Modellen zijn spaarzamer
- Correlaties tussen disturbance termen kunnen worden gemodereerd
- Schatten van de orrelaties tussen de constructen wordt gecorrigeerd voor meetfouten
- Je kunt verschillende theorien over de onderliggende structuur gemakkelijk vergelijken
- Je kunt formeel onderzoeken of de factorstructuur vergelijkbaar is tussen groepen of over tijd
Nadelen CFA
- Je hebt speciale software nodig
- Normaliteitsassumpties spelen een zwaardere rol
- Je hebt een goede theoretische basis nodig
Waarom spelen bij CFA normaliteitsassumpties een zwaardere rol?
Omdat je niet alleen de structuur gaat exploreren maar ook formele hypothesetoetsen uitvoert. Als de aannames geschonden zijn kun je niet vertrouwen op de toetsen
Model fit onderzoek
Met behulp van een formele statistische nulhypothese toets kijken of het model past
of
Met behulp van beschrijvende grootheden kijken
Welke toets hoort bij modelfit?
De chi kwadraat toets
Wat is de H0 bij de chi kwadraat toets?
Alle residuele correlaties zijn 0
Wat als je H0 bij de chi kwadraat toets verwerpt?
Je hebt dan een significante misfit
Wat als je de H0 bij de chi kwadraat toets niet verwerpt
Dan heb je nog niet aangetoond dat je een significante misfit hebt
Kanttekening bij de chi kwadraat toets
- Bij hele grote steekproeven wordt deze bijna altijd verworpen
- Bij hele kleine steekproeven heb je juist geen power. Deze is pas significant als de residuele correlaties heel groot zijn
Modelfit onderzoek met behulp van beschrijvende grootheden
Je kijkt naar de RMSEA
RMSEA afkorting
Root mean squared error of approcimation
De wortel van het gemiddelde van de gekwadrateerde residuele correlaties
RMSEA perfect fit
0
RMSEA close fit
0-0.05
RMSEA =approximate / voldoende fit
0.05-0.08
RMSEA slechte fit
meer dan 0.08
Kenmerken RMSEA
- Het is een index, geen statistische toets
- je berekent hem uit een steekproef
- Het heeft een SE en betrouwbaarheidsinterval
SEM afkorting
Structural equation models
Wat voor iets is SEM
Een combinatie tussen CFA en padanalyse
2 delen van SEM
- Een meetmodel waarin de indicatoren worden gelinkt aan de latente variabelen
- Structureel model waarin de latente variabelen aan elkaar worden gelinkt
Voordelen SEM
- Padanalyse en FA in 1 analyse
- De analyse is gebaseerd op afzonderlijke indicatoren ipv somscores, dus niet steunen op somscores maar rekening houdend met factorladingen voor latente variabelen
- Correctie voor meetfouten in de indicatoren
- Grote padmodellen schatten met 1 analyse
- Niet recursieve padmodellen schatten
- Niet alleen aparte causale effecten toetsen, maar ook het model als geheel
- Modellen vergelijken met de model fit
Nadelen SEM
- Het gebruikt de maximum likelihood schatting
- ML neemt aan dat de variabelen normaal verdeeld zijn. Schending hiervan heeft een grote impact op het hele model, zelfs als dit maar voor een paar variabelen is
- Je hebt een grotere steekproef nodig
Combinatie CFA en model fit
Het CFA model is een hypothese over de onderliggende latente variabele structuur die de varianties en samenhang in en tussen de items verklaren. Op basis van empirische gegevens kunnen we de hypothese onderzoeken! =>
model-fit onderzoek