Evalueren van padmodellen Flashcards
Totaal causaal effect
Direct + Indirect effect
X1 -b1> M -b2> X2
Hoe bereken je de toename in X2 als X1 1 eenheid toeneemt
Als X1 met 1 eenheid toeneemt neemt X2 met b1.b2 eenheden toe
Van welk type model gaan we uit bij padmodellen
Gestandaardiseerde modellen
Decompositieregel
De correlatie tussen 2 variabelen is gelijk aan de som van het directe effect, de indirecte effecten, de schijnrelatie en de onbekende effecten
Waaruit is een correlatie opgebouwt
- Directe effecten
- Indirecte effecten
- Schijnrelaties
- Onbekende effecten
Wright tracing rules
- Je ‘loopt’ of altijd met de richting van de pijlpunten mee, of je begint tegen de richting van de pijlen in en wisselt hooguit één keer van richting
- Je mag dezelfde variabele niet meerdere keren passeren. Elke variabele komt maar één
keer voor in het pad. - Je mag maar 1x een onbekend effect meenemen
Werkwijze Wrights tracing rules
- Je zoekt alle modelijke paden die voldoen aan de spelregels
- Al deze paden dragen bij aan de correlatie
- Je telt van elk pad de componenten bij elkaar op
Hoe bereken je het indirecte effect?
Het indirecte effect is gelijk aan het product van de padcoëfficiënten!
Hoe bereken je het gestandaardiseerde indirecte effect
Het gestandaardiseerde indirecte effect is gelijk aan het product van de gestandaardiseerde
padcoëfficiënten!
Verwachte correlaties synoniem
Geimpliceerde correlaties
Welke correlatie verwacht je bij enkel een direct effect
de verwachte correlatie tussen twee
variabelen waarvoor het model alleen een direct effect veronderstelt is gelijk aan het gestandaardiseerde effect
Welke geimpliceerde correlatie krijg je bij schijnsamenhang?
wanneer er sprake is van een (zuivere) schijnsamenhang, dan is de geïmpliceerde correlatie gelijk aan het product van de gestandaardiseerde padcoëfficiënten die bij de directe effecten horen van de confounder op de andere variabelen.
Wat is de geimpliceerde correlatie bij een model met meerdere mediators
de geïmpliceerde correlatie tussen X1 en X2 – volgens dit model – is gelijk aan het product van de gestandaardiseerde padcoëfficiënten
2 relevante vragen voor het herleiden van het verband tussen X en Y
- Hoe vinden we alle directe effecten, indirecte effecten, schijnverbanden en onbekende effecten tussen X
en Y? - En hoe berekenen voor elk van die effecten de bijdrage aan de geïmpliceerde correlatie tussen X en Y?
Wat is een parameter?
Alle te schatten coëfficiënten – inclusief de correlaties
(onbekende effecten) tussen de exogene variabelen – zijn
de parameters van het model
Wanneer is een model verzadigd?
Wanneer het padmodel evenveel parameters heeft als het aantal unieke correlaties tussen de variabelen in het model, dan is het model verzadigd (Eng: saturated).
De geïmpliceerde correlaties zijn dan precies gelijk aan de geobserveerde correlaties.
Hoeveel vrijheidsgraden heeft een verzadigd model?
0
Wat is er aan de hand wanneer een model meer parameters heeft dan unieke correlaties?
Wanneer een model meer parameters heeft dan unieke correlaties, dan is het model niet- geïdentificeerd. Dit betekent dat er
geen unieke oplossing is (net zoals 𝑥 + 𝑦 = 5 oneindig veel oplossingen heeft). Het aantal vrijheidsgraden is negatief (df < 0).
Wat zijn de vrijheidsgraden bij een niet-geidentificeerd model
Deze zijn negatief
Recusiviteit en geidentificeerdheid
Recursieve modellen zijn altijd geidentificeerd
Hoe bereken je het aantal unieke correlaties
(aantal variabelen * (aantal variabelen -1) / 2
Wanneer kun je iets zeggen over de fit?
Door bij onverzadigde modellen naar de verschillen in geobserveerde en
geïmpliceerde correlaties te kijken kunnen we iets zeggen over de fit
Wat als het model minder parameters heeft dan unieke correlaties?
Wanneer het model minder parameters heeft dan unieke correlaties, dan zijn de
voorspelde correlaties en geobserveerde correlaties niet noodzakelijk hetzelfde:
hoe groter de verschillen, hoe slechter de fit!
Waar draait modelfit om?
Model fit gaat om de vraag hoe goed het padmodel – dus de hypothesen over de onderliggende causale processen – in staat is om
de geobserveerde correlaties te reproduceren.
Residuele correlatie
geobserveerde correlatie – geïmpliceerde correlatie
Wanneer heb je een behoorlijke misfit?
Als je residuele correlatie groter is dan 0.1
h0 bij de chi kwadraat toets
H0
: alle residuele correlaties zijn gelijk aan 0 (in de populatie)
Wat als H0 niet wordt verworpen bij de chi kwadraat toets?
Dus, als H0 niet wordt verworpen (𝑝 > 𝛼), dan vallen de geobserveerde residuele correlaties binnen de
steekproevenfluctuaties (kort door de bocht: redelijke kans dat je residuen van deze orde van grootte ziet onder H0).
Er is onvoldoende bewijs tegen het model; we houden we het model aan! Het model geeft statistisch gezien een
plausibele weergave van de onderliggende causale processen (m.a.w., dit zou het kunnen zijn, maar we weten het niet zeker).
Wat als H0 wel wordt verworpen op de chi kwadraat toets
Als H0 wel wordt verworpen (𝑝 ≤ 𝛼) – d.w.z., de 𝜒2-kwadraat toets is significant – dan past het model onvoldoende bij de data en zullen we het model moeten verwerpen.
We hebben overtuigend bewijs dat – statistisch gezien – het model geen plausibele verklaring geeft van de
onderliggende causale processen. We kunnen het model aanpassen (paden toevoegen!) en dan opnieuw naar de fit
kijken.