Week 1 - Causal Inference Flashcards

1
Q

Wat is een path/pad?

A

Connectie (route) tussen een outcome en een exposure Deze hoeft niet de route van de pijl te volgen!

A => Y

A => V => Y

A <= L => Y

A => W <= Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is een backdoor path?

A

Pad die niet de richting van de pijlen volgt

A => W <= Y

A <= L => Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is een causal path?

A

Pad die wel de richting van de pijlen volgt

A => Y

A => V => Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is een open path?

A

Alle paden zijn open, tenzij ze ergens botsen

Treatment – Costs open

Treatment – Age – Costs open

Treatment – Age – Severity – Costs open

Treatment – Age – Severity – Sex – Costs gesloten

Treatment – Severity – Costs open

Treatment – Severity – Age – Costs open

Treatment – Severity – Sex – Costs open

Treatment – Sex – Costs open

Treatment – Sex – Severtiy – Costs open

Treatment – Sex – Severity – Age – Costs gesloten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is een closed path?

A

Een pad waar de pijlen botsen

Treatment – Age – Severity – Sex – Costs gesloten

Treatment – Sex – Severity – Age – Costs gesloten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is confounding?

Wat is een confounder?

A

Bias veroorzaakt door een gemeenschappelijke exposure en outcome.

Een variabele die zowel de afhankelijke als de onafhankelijke variabele beïnvloedt.

Leeftijd is in dit geval een confounder. Deze beïnvloedt of je rookt en het beïnvloedt longkanker.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is een collider en noem een voorbeeld?

A

Variabele waar twee pijlen in een DAG botsen

(Dieet en ziekte zijn beide van invloed op gewichtsverlies)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is blocking?

A

Het verwijderen van een backdoor path van een associatie door middel van het adjusten voor een variabele op dat pad (de variabele kan geen collider zijn)

Met blokken kijk je naar het directe effect.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is unblocking?

A

Het openen van een backdoor path door het adjusten voor een collider op dat pad

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wanneer teken je een pijl in een DAG en wanneer niet?

A

Als je zeker weet dat er geen causaal verband is teken je geen pijl en als het mogelijk is dat er een causaal verband is teken je wel een pijl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wanneer komt selection bias (collider bias) voor en wanneer confounding?

A

Selection bias komt voor wanneer je adjust voor een collider (een gemeenschappelijk effect van exposure en outcome, of een gemeenschappelijk effect van voorgangers van exposure en outcome).

Confounding komt voor wanneer exposure en outcome een gemeenschappelijke oorzaak hebben waar je niet voor adjust hebt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welke soorten bias zijn er?

A
  • Selection bias
  • Publication bias
  • Recall bias
  • Survivorship bias
  • Healthy user bias
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is selection bias?

A

Er is sprake van selectionbias wanneer groepen in een studie niet vergelijkbaar zijn. Hierbij wordt geen randomizatie behaald. Bijvoorbeeld: Rutten kan niet gewonnen hebben, ik ken niemand die op hem gestemd heeft. Of: Onderzoek naar besteedbaar inkomen op een vliegveld (mensen die vliegen hebben hoogstwaarschijnlijk meer dan te besteden dan gemiddelde mensen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is publication bias?

A

Positieve bevindingen worden vaker gepubliceerd dan negatieve bevindingen. Negatieve bevindingen zijn niet echt interessant. Let op: Als je 100 studies doet, dan is het aannemelijk dat er 1 studie bij zit waarvan het resultaat pure onzin is (puur door toeval). Bijvoorbeeld: Uit je onderzoek komt naar voren dat het spelen van video games niet dikke darm kanker voorkomt. Ook al is het onderzoek perfect uitgevoerd, het is niet waarschijnlijk dat een prestigieus medisch tijdschrift dit gaat publiceren. Het is niet echt interessant dat iets het hebben van dikke darm kanker niet voorkomt. Het meeste voorkomt dat namelijk niet. 1 op de 100 studies zal door toeval een positief verband vinden tussen het spelen van video games en het voorkomen van kanker. Dit onderzoek wordt waarschijnlijk gepubliceerd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is recall bias?

A

Verstoring van de resultaten omdat patiënten zich bepaalde zaken anders herinneren dan de manier waarop ze in werkelijkheid gebeurd zijn. Daarom prefereren we longitudinaal onderzoek boven cross-sectioneel onderzoek. Bv: Bepaalde groep heeft allemaal 15 jaar geleden een dieet gehad die hoog in vet zat. Meeste personen met borstkanker herinneren zich dit. De mensen zonder zijn dit bijna allemaal alweer vergeten. Als je dan onderzoek doet en je vraagt naar hun dieetgewoonten van vroeger krijg je geen goede resultaten omdat alleen de mensen met borstkanker zich het herinneren, maar dit zegt niets over hoe het daadwerkelijk zat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is survivorship bias?

A

Als observaties uit het sample verdwijnen Survivor bias is een fout in onze redenering, omdat we ons focussesn op de overlevenden, waardoor analyses een vertekend beeld kunnen geven. Bv: tweede wereldoorlog. Analyseren waar de vliegtuigen het meest geraakt werden en daar bepantsering aanbrengen. Het gaat juist om waar ze niet geraakt werden, want deze vliegtuigen keerden allemaal terug.

17
Q

Wat is healthy user bias?

A

Mensen die regelmatig vitaminen nemen, zijn waarschijnlijk gezonder dan mensen die ze niet nemen. Omdat ze het soort mensen zijn die vitaminen nemen.

18
Q

Welke eisen zijn er voor een causale conclusie?

A
  • Positivity
  • Consistency
  • Exchangeability
19
Q

Wat is positivity?

A

Er is een controlegroep. Je moet weten wat er gebeurd was als … Dus bijvoorbeeld een groep mensen met een aansteker, en een groep mensen zonder een aansteker. We hebben resultaten nodig van alle ‘treatment groups’ in alle lagen van de ‘adjustment variables’.

20
Q

Wat is consistency?

A

De ‘treatment’ is goed gedefinieerd. Het definiëren van de ‘if’. Bijvoorbeeld: is water dodelijk? Waar vergelijk je het mee? Nooit meer water? Andere manier van consumeren? Etc.

Drinken van een glas water is niet dodelijk

Een tsunami wel

21
Q

Wat is exchangeability?

A

Het resultaat blijft hetzelfde als de ‘treatment groups’ gewisseld worden. Dit kan worden bereikt door statistische aanpassingen. Uitwisselbaarheid; je kan groepen wisselen zonder dat dit effect heeft op de uitkomst. De potentiële uitkomst is onafhankelijk van de behandeling die is ontvangen. => Het moet niet uitmaken wie de behandeling krijgt. Kan zijn dat je hiervoor moet adjusten

22
Q

Wat kan je zeggen over probability-related errors?

A

Onwaarschijnlijke dingen gebeuren. Sterker, over een periode die lang genoeg is zijn ze niet eens zo onwaarschijnlijk. Mensen worden bijvoorbeeld continue geraakt door de bliksem.

23
Q

Welke probability-related errors zijn er?

A
  • Aanname dat gebeurtenissen onafhankelijk zijn, terwijl ze dat niet zijn.
  • Niet snappen wanneer gebeurtenissen WEL onafhankelijk zijn
  • Clusters gebeuren
  • Terugvallen op het gemiddelde
  • Statistische discriminatie
24
Q

Wat kan je zeggen over de aanname dat gebeurtenissen onafhankelijk zijn, terwijl ze dat niet zijn?

A

Bijv; Kans op engine failure van een vliegtuig is 1 op 100.000 =>Veel vluchten; dus geen acceptabel risico => Twee motoren dus kans dat beide motoren uitvallen is 100.000^2 => Klopt niet, bv motor gaat kapot door slecht onderhoud, als de ene kapot gaat is het niet onwaarschijnlijk dat de ander ook kapot gaat.

25
Q

Wat kan je zeggen over het niet snappen wanneer gebeurtenissen WEL onafhankelijk zijn?

A

Patronen zien, terwijl ze eigenlijk niet bestaann. Bijv ‘gamers falacy’ Als je 100 keer een munt opgooit en je krijgt 100 keer kop, dan is de kans dat als je de volgende keer een munt opgooit 50% dat het weer kop is.

26
Q

Wat kan je zeggen over ‘clusters happen’?

A

Statistisch gezien is het onwaarschijnlijk dat een aantal mensen in een bepaald gebied een zeldzame vorm van kanker hebben. Maar dit kan wel puur toeval zijn. Bv; Kans is niet groot dat iemand 6 keer achter elkaar munt gooit. Maar laat een groep van 1000 mensen muntjes opgooien en de kans is ineens aannemelijk dat er iemand tussen zit die het gelukt is.

27
Q

Wat kan je zeggen over het terugvallen op het gemiddelde?

A

Geen pech nadat iemand op de cover van Sports Illustrated is gekomen dat hij terugvalt in performance. Je komt op de cover omdat je ‘on fire’ bent. Dus je gaat gewoon weer terug naar je gemiddelde. Iemand die 6 keer achter elkaar munt gooit een 10-jarig contract aanbieden voor 1 miljoen per jaar => kans is aannemelijk dat hij aan het eind van die 10 jaar ongeveer 50% kop en 50% munt heeft gegooid.

28
Q

Wat kan je zeggen over statistische discriminatie

A

Als we een model kunnen ontwikkelen dat drugssmokelaars 80 van de 100 keer goed kan identificeren; wat gebeurt er met de 20% de arme 20%. Want door ons model worden die mensen steeds opnieuw lastig gevallen.

29
Q

Wat is een RCT? (Randomised controlled experiment)

A

Onderzoek waarbij er een ‘treatment group’ en ‘control group’ is gecreëerd.

30
Q

Welke uitdaginen kent een RCT?

A

* Ethiek: Veel experimenten kunnen we niet op mensen toepassen. => Alleen experimenten waarvan we verwachten dat er een mogelijk positieve uitkomst is.

* Variatie: Er is veel meer variatie tussen mensen dan laboratorium ratten => Lange, korte, zieke, gezonde mensen, mannen, vrouwen, alcoholisten, criminelen etc.

31
Q

Met welke oplossing kan men de variatie in de populatie van een RCT oplossen/verminderen?

A

Willekeurig mensen in de treatment en control Group plaatsen. => Hierdoor worden non-treatment-gerelateerde variabelen min of meer gelijk verdeeld over de twee groepen. Hoe groter de samples, hoe effectiever de randomization zal zijn in het creëren van twee vrijwel gelijke groepen.

32
Q

Wat is het nadeel van een RCT?

A

Kost vaak veel geld

33
Q

Wat is een natural experiment?

A

Een controlled experiment, dat mogelijk wordt gemaakt door gebeurtenissen in het verleden. Bv: Effect van educatie op levensverwachting. In Amerika zijn in verschillende staten op verschillende tijdstippen wetgevingen ingesteld over hoe lang kinderen leerplichtig zijn. Ze vergeleek deze met staten die niet hun wetgeving veranderden.

34
Q

Wat is een nonequivalent control?

A

Bv: Heeft naar een prestigieuze school gaan een positief effect op je levensverwachting? Kunnen niet random assignen, weinig studenten zullen dat willen (ook scholen niet). Mensen die wel zijn aangenomen op Harvard, maar voor een minder prestigiezue school kozen als control Group gebruiken.

35
Q

Wat is difference in differences?

A

Beste manier om te kijken naar oorzaak en gevolg is iets te doen en te kijken wat er gebeurt. Eerst kijk je naar de before and after data van de groep die de ‘treatment’ heeft gehad. Dan vergelijk je de before and after data van de groep die dat niet heeft gehad. Belangrijk is de assumptie dat deze groepen redelijk overeenkomen behalve de behandeling.

36
Q

Wat is een discontinuity analyse?

A

Manier om treatment en control Group te creëren is om het deel dat de schifting net haalde te vergelijken met degene die het net niet haalde. Bv: Summer school voor studenten die moeite hebben. Vergelijk niet de resultaten van de mensen die summer school gehad hebben met degene die geen summer school gehad hebben. Maar de mensen die net in aanmerking kwamen voor summer school, met degene die het net niet nodig hadden. Studenten die een 5,4 halen (en niet slagen) verschillen niet erg van studenten die een 5,5 halen (en wel slagen).