Moeilijke begrippen Flashcards
Wat gebeurt er met b1 als je de confounder wegneemt?
–> schijnrelatie
b1 is fout geschat –> toetsen van causale hypothese geeft fout resultaat
- er is namelijk geen directe relatie, dat lijkt zo door de schijnrelatie
Indirecte schijnrelaties
Er zit nog een variabele tussen de gemeenschappelijke oorzaak en een of beide variabele
Schijnrelatie door onbekend effect
De relatie gaat via de gemeenschappelijke oorzaak
–> dit is hetzelfde als een normaal indirect effect, we weten alleen niet wat precies de relatie is?
Exploratief onderzoek
Je doet onderzoek om iets te ontdekken –> je laat de data spreken
Confirmatief onderzoek
Je doet onderzoek om iets te bevestigen
Manifeste variabele
Variabele die direct meetbaar en te observeren is
Latente variabele
Variabele die niet direct meetbaar of te observeren is
Decompositieregel
- !!
Correlatie tussen X en Y =
Direct effect (causaal) + Indirecte effecten (causaal) +
Schijnrelaties (niet causaal) + Onbekende effecten (niet causaal)
padcoëfficiënten berekenen aan de hand van decompositieregels
Correlatie = direct+indirect+schijn+onbekend
Direct = correlatie-indirect-schijn-onbekend
Indirect = correlatie-direct-schijn-onbekend
Schijn = correlatie-direct-indirect-onbekend
Effect of interest
Correlatie - andere effecten/relaties
Recursief model
- geen dubbele pijlen (tussen distrurbance termen en endogene variabelen
- geen wederkerende effecten
- geen ‘feedbackloops’
Hoe bereken je het totale causale effect
Je telt alle paden bij elkaar op (indirecte effecten vermenig vuldig je met elkaar)
–> je wilt hier niet de correlatie weten, dus je maakt geen gebruik van de tracing rules
Wanneer gebruik je tracing rules?
Tracing rules gebruik je wanneer je de correlatie wilt berekenen
Tracing rules
- met de richting mee óf beginnen tegen de richting in (max. 1 keer wisselen)
- elke variabelen max 1 keer passeren per pad
- max. 1 onbekend effect passeren
- je vermenigvudig alles in de paden en telt dan de paden bij elkaar op (zie decompositieregel)
Conditioneel indirect effect
Indirect effect waarbij tenminste één van de betrokken effecten gemodereerd wordt (conditioneel is op een variabele)
–> wat tussen de haakjes staat bij een indirect verband
Conditioneel direct effect
Wat tussen de haakjes staat bij een direct verband
Totale conditionele effect
Alle haakjes van de directe en indirecte verbanden
Wanneer is indirecte effect statistisch significant op basis van 95%CI
Wanneer 0 in het interval valt, is het verschil niet significant van 0
–> wanneer 0 niet in het interval valt, verschilt het significant van 0
Chi-kwadraat toets
H0 = verschil tussen geobserveerde en geïmpliceerde correlaties is -
- p-waarde < 0.05 –> model verworpen
RMSEA
Vat in 1 getal samen hoe sterk geobserveerde e geïmpliceerde correlaties van elkaar verschillen
- <0.05= goede model fit
- >0.08= slechte model fit
Hoe bereken je communcaliteit?
De waardes van de component (uit de componentmatrix) kwadrateren en bij elkaar optellen
Component matrix
Ruwe waardes voor componentladingen
–> deze zijn dus niet geroteerd of gecorreleerd
Pattern matrix
Waardes voor componentladingen die obliek geroteerd zijn
–> bij oblique rotatie zijn de waardes ook gecorreleerd
Structure matrix
Bevat de correlaties tussen de variabele en het component
–> dit is dus met de oblique geroteerde waarden
Hoe bereken je de proportie variantie met de eigenwaarde?
Eigenwaarde delen door het totaal –> dan krijg je de proportie en kun je ook cumulatief berekenen
Rotated component matrix
Dit zijn de waarden die orthogonaal geroteerd zijn
–> oblique geroteerde waarde staan in de pattern matrix
Wat zie je in de communalities tabel
Bij initial staat altijd 1.000, omdat voor de componentvorming 100% werd meegenomen
Bij extraction staat de berekende communalitie nu niet alles door de componenten wordt meegenomen.
- berekenen door de waarden uit componentmatrix te kwadrateren en bij elkaar op te tellen
item-specifieke variantie
deels verklaarbare variantie en deel puur-random variantie
Gemeenschappelijke variantie
Variantie die wordt verklaard door de gemeenschappelijke, onderliggende latente factoren
Verschil PCA en Factor analyse
Bij PCA wil je het aantal variabelen reduceren
Bij factor analyse (FA) wil je zoeken naar latente variabelen
Wat is Factor analyse
- Zijn er latente variabelen die samenhang tussen items verklaren?
1-factor model
Er is 1 onderliggende factor die de samenhang verklaard F1
Visuele weergave CFA
Heeft de zelfde opzet als PCA, omdat sommige ladingen op 0 zijn gezet
–> het verschil met PCA is dat het niet samenvat, maar verklaard dmv de latente factor
Stellingen EFA
- EFA verklaart alle correlaties tussen geobserveerde variabelen door middel van schijnrelaties via een of meer latente variabelen
- in EFA zijn de factoren NIET het resultaat van een regressie op de geobserveerde variabelen
Stellingen PCA
- PCA analyseert de totale variantie van de geobserveerde variabelen, inclusief de meetfout
- Als het onrealistisch is om aan te nemen dat latente variabelen de scores op de geobserveerde variabelen veroorzaken, dan kun je beter PCA gebruiken
- een component is een gewogen som van de geobserveerde variabelen
Checklisten even doornemen voor extra informatie
Wat stelt de gouden regel?
Volgens de gouden regel moet je alle mogelijke confounders van de veronderstelde causale
relaties tussen de variabelen in je model eveneens in het model opnemen
Hoeveel regressievergelijkingen heeft een model nodig?
Evenveel vergelijkingen als dat er endogene variabelen zijn
Hoe stel je de regressievergelijking bij een model op?
In de vergelijking staan alleen die variabelen die direct naar de engogene varbiabele gaan (indirecte paden worden niet meegenomen!)
Wat is een verzadigd model?
Er zijn vier variabelen, dus er zijn (4x3)/2 = 6 unieke correlaties die relaties tussen de variabelen beschrijven. Het padmodel heeft 6 parameters; d.w.z., er zijn zes te schatte coëfficiënten, namelijk de drie directe effecten en de correlaties tussen de exogene variabelen. De correlaties tussen de exogene variabelen kun je beschouwen als te schatten onbekende effecten. Dus het model heeft evenveel parameters als dat er unieke correlaties zijn tussen de variabelen in het model, en daarmee is het model verzadigd. Dit betekent dat je met dit model de geobserveerde correlaties exact kunt reproduceren.
Wat gebeurt er met het effect van een variabele als je een andere variabele weghaalt
- x1 en x2 verklaren beide x3, ik haal x1 weg, wat gebeurt er met effect van x2
Het effect van de overgebleven variabelen wordt groter, de weggehaalde variabele had namelijk een confounder kunnen zijn
Multicollineariteit
De statistische term voor de correlaties tussen de exogene variabelen
Hoe bereken je het maximale conditionele effect aan de hand van regressievergelijkingen met interactieeffecten
Berken het interactie effect voor de laagst mogelijke score en vermenigvuldig dit met hoeveel scores er nog gehaald kunnen worden
–> dus van 1-5 schaal is 1 de laagste en kunnen er nog 4 scores gehaald worden
Hayes’ macro analyse
Verschil statistisch en conceptueel model
Conceptueel model is met moderator op de lijn, bij statistisch model worden alle effecten van de moderator op de variabele weergegeven
Hoeveel indicatoren zijn er bij PCA?
Evenveel indicatoren als dat er componenten zijn