Taak 7: causaliteit Flashcards
Causale uitspraken: soorten en maten
Causaliteit of causatie kun je zien als een causale keten van gebeurtenissen of variabelen waarbij optreden/afwezigheid van de ene gebeurtenis bepalend is voor het optreden van andere gebeurtenis. In theorie kan de causale keten oneindig lang worden. Dus A → B is een causale keten, evenals A → B → C en A → B → C → D, enzovoort.
Een belangrijk doel van een causaal verband vinden is vinden van oorzaken.
Causale effecten vereisen een vergelijking met de counterfactual
- Bij een contrafeitelijke uitspraak wordt geredeneerd vanuit een situatie die tegengesteld is aan de feitelijke situatie.
- Te herkennen aan ‘zou’.
- Soms onmogelijk om de contrafeitelijke uitkomst te kennen.
- Enorme complexiteit bij causale uitspraken: causale gevolgtrekkingen vereisen vergelijkingen tussen de feitelijke en contrafeitelijke uitkomst, maar de counterfactuals zijn niet geobserveerd.
Correlatie versus causaliteit
Correlatie – ook wel samenhang/associatie – wijst erop dat de kans dat de ene gebeurtenis optreedt afhankelijk is van het optreden van de andere gebeurtenis. Correlatie wijst op statistische afhankelijkheid tussen gebeurtenissen. Dit wijst echter niet automatisch op een causale relatie.
Een ander duidelijk verschil tussen correlatie en causatie is dat een correlatie symmetrisch is en causaliteit niet. Het maakt statistisch gezien niet uit in welke volgorde je de variabelen met elkaar correleert.
Causale relaties als difference-maker
Ideeën over causale relaties:
- Difference-making: ene gebeurtenis maakt verschil voor het optreden van de andere (wat causale mechanisme is, wordt niet op ingegaan)
oorzakelijke factor kan worden gemanipuleerd en daarmee een verandering in de uitkomstmaat teweegbrengen. Maar als je een variabele manipuleert die enkel geassocieerd is met een andere variabele (en dus niet causaal van invloed is daarop), dan zal dit geen verschil uitmaken voor de uitkomstmaat.
- Fysieke overdracht van energie (fysieke overdracht van energie vormt namelijk het causale mechanisme dat achter causale relaties schuilgaat)
Belang van causale mechanismen
Inzicht in causaal mechanisme:
1. Inhoudelijk relevant: Geeft inzicht in werking v/e proces
2. Praktisch relevant: biedt handvatten voor interventie
De praktische relevantie die het kennen van causale processen te bieden heeft, heeft ook een keerzijde. We zijn zo gedreven geraakt in het ontdekken van patronen dat we ook patronen menen te zien waar deze niet bestaan.
Correlatie ≠ causatie
Alle correlationele verbanden zijn een uiting van een specifieke configuratie van variabelen in een causaal model. O.b.v. het correlationele verband weet men vaak niet van welk causaal model dit correlationele verband een uiting is.
Om dit te begrijpen: helder overzicht van mogelijke causale modellen die aanleiding kunnen geven tot correlatie. Sommige van deze causale modellen bevatten een derde variabele.
Causale modellen
Beschrijft causale relaties die men tussen variabelen verwacht voor causale effect.
vb. Interesse in causale effect van zelfvertrouwen op zoenen: causale model bestaat uit causale effect van zelfvertrouwen op zoenen inclusief alle mogelijke derde variabele(n).
Vaak worden causale relaties gevisualiseerd met een causaal diagram, een ‘directed acyclic graph’ (DAG).
Een DAG geeft dus niet de geobserveerde verbanden tussen variabelen weer, maar de causale relaties tussen de verbanden die je als onderzoeker op basis van theorie en eerder onderzoek verwacht. Deze verwachte causale relaties worden niet alleen gevisualiseerd door pijlen tussen de variabelen, maar ook door het ontbreken van pijlen. Een ontbrekende pijl geeft aan dat je geen directe causale invloed verwacht van de ene variabele op de andere. Als een causaal model de werkelijkheid goed beschrijft, dan volgt hieruit welke variabelen met elkaar zullen correleren en welke niet.
Directe causatie
Bij een causaal model waarin de OV en AV in directe causatie met elkaar staan, is de ene variabele een directe oorzaak van de andere variabele. Bijvoorbeeld: causale effect van zelfvertrouwen naar zoenen, maar ook andersom, van zoenen naar zelfvertrouwen. Deze twee DAGs representeren dus twee verschillende causale modellen. Bij beide causale modellen wordt verwacht dat zelfvertrouwen en zoenen met elkaar correleren.
Indirecte causatie of mediatie
Potochnik et al. beschrijven dat er onderscheid gemaakt kan worden tussen proximale en distale oorzaken. Volgens een causaal model loopt er een causaal pad van zelfvertrouwen via het hebben van een romantische relatie naar zoenen, en is er dus sprake van een indirecte causale relatie tussen zelfvertrouwen en zoenen. In dit voorbeeld is zelfvertrouwen een distale oorzaak van zoenen, en het hebben van een romantische relatie een proximale oorzaak.
In de literatuur wordt het bovenstaande model dat een ‘keten’ (chain) van oorzaken verbindt, ook wel aangeduid als een mediatiemodel. Het hebben van een romantische relatie is dan de (inter)mediërende variabele, ook wel de mediator, in het verband tussen zelfvertrouwen en zoenen. Men zegt dan dat het hebben van een romantische relatie het verband tussen zelfvertrouwen en zoenen medieert. In dit voorbeeld is er sprake van één intermediërende variabele, maar zoals een keten van oorzaken kan langer zijn, dus meerdere intermediërende variabele bevatten.
Merk op dat ook wanneer er sprake is van een intermediërende variabele, het causale effect kan lopen van zelfvertrouwen via het hebben van een romantische relatie naar zoenen, maar in principe ook andersom. Dus dat het zoenen aanleiding geeft tot het aangaan van een romantische relatie, waardoor je zelfvertrouwen groeit. Ook hier hebben we dus te maken met twee verschillende causale modellen.
Soms wordt een feedbackproces verondersteld tussen twee variabelen, waarbij – als we bij dit voorbeeld blijven – zelfvertrouwen niet alleen de kans bepaalt of iemand op een bepaalde leeftijd een romantische relatie aanknoopt, maar waarbij iemands ervaring met romantische relaties vervolgens ook van invloed is op diens zelfvertrouwen. Merk op dat het causale model met feedbackloop dat Bergstrom en West geven in feite een model is met indirecte causatie waarin voor elke meting een variabele is opgenomen.
Common cause of confounding
Het is mogelijk dat een correlatie kan worden verklaard door een derde variabele die een gemeenschappelijke oorzaak is van beide variabelen. Dus in dit model is het hebben van een romantische relatie causaal van invloed op zowel het zelfvertrouwen als op zoenen.
Een derde variabele die een gemeenschappelijke oorzaak is van zowel X als Y, wordt ook vaak een confounder genoemd. Deze variabele vertroebelt namelijk de correlatie tussen X en Y (zelfvertrouwen en zoenen). Als dit causale model geldt en je bekijkt in de gehele groep adolescenten de relatie tussen zelfvertrouwen en zoenen (dat is, als je de derde variabele - of iemand al dan niet een romantische relatie heeft - buiten beschouwing laat), dan zul je waarschijnlijk een correlatie vinden tussen zelfvertrouwen en zoenen.
Deze correlatie tussen zelfvertrouwen en zoenen is, uitgaande van dit model, echter geen uiting van een direct causaal verband tussen beide variabelen (merk op: de pijl zelfvertrouwen → zoenen ontbreekt), maar van het feit dat deze variabelen volgens dit causale model beiden beïnvloed worden door dezelfde derde variabele.
Colliding
Als je een correlatie vindt tussen zelfvertrouwen en zoenen, kan er ook sprake zijn van colliding. Het causale model waarin het hebben van een romantische relatie een collider is, wordt niet door Bergstrom en West besproken en is daarmee ook geen tentamenstof.
Mogelijke verklaringen voor een gevonden correlatie
Zoals zojuist besproken, kan een correlatie ook via indirecte causatie worden verklaard, of via colliding. Wanneer je dus een correlatie tussen variabelen X en Y vindt, is het zinvol om erbij stil te staan in hoeverre elk van de hierboven besproken causale modellen aanleiding kunnen hebben gegeven tot de gevonden correlatie. Kort samengevat kunnen de volgende modellen dus van toepassing zijn.
Directe causatie (X → Y)
Directe causatie (Y → X)
Indirecte causatie/mediatie (X → C → Y)
Indirecte causatie/mediatie (Y → C → X)
Common cause/confounding (X ← C → Y)
Colliding (X → C ← Y) wanneer geconditioneerd wordt op C [dit model vormt geen tentamenstof]
Uiteraard zijn de bovenstaande zes modellen een versimpeling van zaken. In werkelijkheid zullen causale modellen bestaan uit een combinatie van bovengenoemde causale structuren en dus zowel directe als indirecte effecten, als common causes (en colliders) bevatten.
Daarnaast zullen er altijd meerdere ‘derde’ variabelen een rol spelen, waardoor het aantal mogelijke causale modellen dat aanleiding kan hebben gegeven tot een gevonden correlatie verder zal uitbreiden. Om goed na te kunnen nadenken over verschillende (alternatieve) verklaringen van een gevonden correlatie, vormen de bovenstaande causale modellen echter een zeer belangrijk startpunt.
Spurieuze correlatie
Hierboven wordt een enkele keer een verband of correlatie als ‘spurieus’ bestempeld. Het is zinvol om te weten dat in de literatuur verschillende dingen worden bedoeld met de term spurieuze correlatie. Potochnik et al. (2019) evenals Bergstrom en West (2021) verwijzen met de term spurieuze correlatie naar onzincorrelaties die bijvoorbeeld verschijnen als je maar lang genoeg in de data speurt. Zie hier voor een aantal ludieke voorbeelden.
Binnen de literatuur rondom causale inferentie (het afleiden van causale effecten uit data) worden met spurieuze effecten alle niet-causale paden bedoeld die een eventueel causaal effect tussen de onafhankelijke en afhankelijke variabele vertroebelen (Pearl et al., 2016). Vanuit dat gezichtspunt leidt de aanwezigheid van een derde variabele die een gemeenschappelijke oorzaak vormt van X en Y tot een spurieuze correlatie tussen X en Y als niet voor die derde variabele wordt gecontroleerd. (Vanuit dit gezichtspunt zou ook het controleren voor een derde variabele die een collider vormt, leiden tot een spurieuze correlatie - dit vormt echter geen tentamenstof.)
Bottom-line is dat wanneer er gesproken wordt over spurieuze verbanden of correlaties je goed moet nagaan wat er precies wordt bedoeld, omdat de betekenis die aan deze term wordt gegeven kan verschillen.
Benaderingen van causaliteit gebaseerd op difference-making
Zoals de voorgaande sectie liet zien kan een correlatie tussen twee variabelen (bijv. zelfvertrouwen en zoenen) een uiting zijn van zeer verschillende causale processen. Enkel een correlatie tussen twee variabelen of gebeurtenissen geeft weinig houvast wat hier als oorzaak gezien moet worden. Zorgt een groter zelfvertrouwen ervoor dat iemand eerder zal zoenen? Of vormt het zoenen juist de oorzaak van een toegenomen zelfvertrouwen? Of speelt een derde variabele een rol zoals de andere causale modellen uit de voorgaande sectie naar voren gebracht?
Als mens, maar zeker als wetenschapper wil je graag weten wanneer je iets als oorzaak-gevolgrelatie kunt bestempelen. Roken is bijvoorbeeld geassocieerd met longkanker. Maar naar welke informatie moet je kijken je als je wilt weten of roken daadwerkelijk als veroorzaker van longkanker kan worden gezien?
In de afgelopen eeuwen is causaliteit vanuit verschillende gezichtspunten benaderd. In deze en de volgende sectie wordt een aantal gezichtspunten op causaliteit belicht en beschreven aan welke voorwaarden gebeurtenissen moeten voldoen om – vanuit dat gezichtspunt – als oorzaakgevolgrelatie bestempeld te worden.
In deze sectie staan regelmatigheidstheorieën (‘regularity theories’) van causaliteit centraal (en reacties daarop). Binnen de regelmatigheidsbenadering worden causale relaties gezien als een speciaal soort regelmatigheden. Om te bepalen of een bepaalde factor (bijvoorbeeld roken) inderdaad als oorzaak gezien kan worden van een bepaalde uitkomst (longkanker) wordt gekeken of de veronderstelde oorzaak-gevolgrelatie aan een aantal voorwaarden voldoet.
Er zijn verschillende regelmatigheidstheorieën die elk op een eigen manier voorwaarden specificeren waaraan een oorzaak-gevolgrelatie moet voldoen. Deze komen hieronder aan bod (evenals de probabilistische benadering van causaliteit die als reactie gezien kan worden op de regelmatigheidstheorieën zoals die hieronder naar voren worden gebracht).
In de volgende sectie komt de interventiebenadering (manipulability theories of causation) van causaliteit aan bod. Zowel de regelmatigheidsbenadering als de interventiebenadering zijn gebaseerd op het idee van difference-making: dat oorzaken een verschil maken voor hun effect. Merk op dat we in deze verdere studietaak causale theorieën die gebaseerd op het idee dat een fysieke overdracht van energie kenmerkend is voor causale relaties (zoals causal process theories; Walsh & Sloman, 2011) buiten beschouwing zullen laten.
Hume’s regelmatigheidsbenadering
Volgens Hume is causaliteit niets anders dan het observeren van een constante associatie tussen twee gebeurtenissen die na elkaar plaatsvinden. Hoewel we geneigd zijn het aanstoten van de ene biljardbal te zien als een oorzaak van het gaan rollen van de andere biljardbal, zijn er volgens Hume geen causale relaties in de wereld. Het enige wat we kunnen waarnemen, is een serie van gebeurtenissen waarbij de ene gebeurtenis volgt op de andere gebeurtenis (Potochnik et al., 2019).
Hume’s regelmatigheidsbenadering van causaliteit, dus de theorieën over causaliteit die op dit regelmatigheidsprincipe van Hume zijn gebaseerd, spreekt over een oorzaak-gevolgrelatie van X op Y als aan de volgende voorwaarden wordt voldaan (Andreas & Guenther, 2021).
spatiotemporele nabijheid: X (contact met brandnetel) en Y (uitslag) moeten nabij zijn in tijd en locatie.
temporele prioriteit: X moet voorafgaan aan Y (eerst val je in de brandnetels, daarna ontstaat de uitslag).
constante associatie: elke X moet worden vergezeld van Y (telkens wanneer je in de brandnetels valt, krijg je uitslag).
Binnen deze opvatting worden causale relaties gelijkgesteld aan regelmatigheden (regularities) tussen gebeurtenissen. Deze opvatting van causaliteit heeft als voordeel dat geen filosofische uitwerking van het begrip causaliteit nodig is (hierin kun je de invloed terugzien van het logisch positivisme dat weg wilde blijven van alle metafysica).
Daarnaast biedt deze opvatting duidelijke voorwaarden waaraan moet worden voldaan om te spreken van een oorzaak-gevolgrelatie. Het identificeren van oorzaken wordt hiermee vergemakkelijkt; dit reduceert namelijk tot het identificeren van regelmatigheden tussen gebeurtenissen die voldoen aan bovenstaande voorwaarden.
De voorwaarde van temporele prioriteit laat zien dat causaliteit een asymmetrisch proces is (zoals in de voorgaande sectie reeds naar voren gebracht). De oorzaak gaat vooraf aan het gevolg. Dit geeft een aanknopingspunt om af te leiden wat de oorzaak is en wat het gevolg bij een constante regelmatigheid van twee variabelen (die nabij zijn in tijd en ruimte) (Andreas & Guenther, 2021).
Deze opvatting van causaliteit heeft echter ook nadelen. Ten eerste wordt in de derde voorwaarde gesproken over een constante associatie. De samenhang tussen veel gebeurtenissen die we als oorzaakgevolgrelaties bestempelen, volgt echter niet dit principe. Denk aan roken dat als oorzaak wordt gezien van longkanker, maar niet bij iedereen tot longkanker leidt. Volgens bovenstaande drie voorwaarden zou roken niet gezien kunnen worden als oorzaak van longkanker, omdat niet iedereen longkanker ontwikkelt na roken (Andreas & Guenther, 2021).
Een ander probleem die deze opvatting van causaliteit oplevert, is dat niet elke regelmatigheid tussen X en Y wijst op een oorzaakgevolgrelatie. Dit is het geval wanneer er sprake is van een derde variabele die geldt als een gemeenschappelijke oorzaak (common cause) van zowel X als Y (Andreas & Guenther, 2021). Dit wordt in de volgende sectie over de interventiebenadering van causaliteit verder uitgewerkt.