Week 2 - Significance & Mediation Flashcards

1
Q

Op welke manieren kan je adjusten?

A

Door middel van:

  • Stratificatie
  • Regressie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat houdt stratificatie in?

A

Onderzoekspopulatie in één of meerdere subcategorieën verdelen volgens bepaalde criteria (bv leeftijd, geslacht, sociale status etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn de voor- en nadelen van stratificatie?

A
  • *Voordelen**:
  • Makkelijk, te interpreteren
  • *Nadelen**:
  • Kan het alleen in bepaalde situaties doen (beperkt aantal confounders)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat houdt regressie in?

A

Wordt gebruikt voor het adjusten van verschillende confounders op hetzelfde moment. Het beschrijft mathematische relaties tussen uitkomst en een of meerdere variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat kan je zeggen over ‘moderation analysis’?

A

Een variabele kan een verschillend effect hebben op verschillende outcomes. Bijvoorbeeld lengte kan een ander effect hebben op het gewicht van mannen dan bij vrouwen. Dit kunnen we analyseren door het gebruiken van een interaction term.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wanneer zou je ‘moderation analysis’ toepassen en wanneer niet?

A

Als je het effect van bepaalde subgroepen wil weten doe je dit in je regressieanalyse.

Als je het gemiddelde effect wil weten dan doe je dit er niet in.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welke waarschuwingen geeft Wheelan over regressie analyse?

A
  • Non-linearity
  • Multicollinearity
  • Extrapoleren buiten de data
  • Reverse causality
  • Omitted variable bias
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat kan je zeggen over non-linearity als waarschuwing bij regressie analyse?

A

Gebruik geen regressie analyse wanneer er geen lineair verband is tussen de variabelen die je onderzoekt. Een relatie tussen twee variabelen kan lineair zijn, maar dit hoeft niet het geval te zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat kan je zeggen over multicollinearity als waarschuwing bij regressie analyse?

A

Variabelen in je regressieanalyse die sterk aan elkaar gerelateerd zijn.

Bijvoorbeeld: het effect van cocaïne en heroïne op een test. Grote waarschijnlijkheid dat de groepen beide drugs gebruiken en niet slechts 1 drugs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat kan je zeggen over extrapoleren buiten de data als waarschuwing bij regressie analyse?

A

Resultaten gelden alleen voor de data die je geanalyseerd hebt. De resultaten zijn alleen geldig voor de populatie die gelijk is aan de sample.

Voorbeeld: effect van lengte op gewicht.
Sample is van volwassenen.
Je kan dit niet toepassen op pasgeborenen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat kan je zeggen over reverse causality als waarschuwing bij regressie analyse?

A

Wat als lengte niet het gewicht bepaald maar andersom? (gebruik een DAG!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat kan je zeggen over omitted variable bias als waarschuwing bij regressie analyse?

A

Het falen in het adjusten voor alles waar je wel voor had moeten adjusten.

Bv: Golfers hebben een hogere incidentie van hartziekten, kanker en artritis. => Een analyse die leeftijd als explanatory variabele weglaat, mist het feit dat golfers gemiddeld ouder zijn dan niet-golfers. => Golfen maakt mensen niet dood, ouder worden wel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kan je een Ordinary Least Square alleen gebruiken als er een lineaire relatie is?

A

Nee ook bij een non-lineaire relatie.

Bijvoorbeeld: uitgaven zorgkosten. In plaats van age gebruik je age^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hoe bepaal je wat je in een regressie analyse doet?

A

Er is geen duidelijk antwoord.

Je start met een DAG en gebruik die variabelen in je regressieanalyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat kan je zeggen over mediation analyse?

A

Je kan kiezen om voor een mediator te adjusten of niet. Een mediator is een variabele die op een causaal pad zit tussen de exposure en outcome. Voorbeeld mediator:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wanneer adjust je wel en wanneer niet?

A
  • Je moet adjusten voor confounders
  • Je moet doorgaans NIET adjusten voor colliders
  • Of je adjust voor mediators hangt af van je onderzoeksvraag.
17
Q

Wat is mediator-outcome confounding?

A

Er is een confounder op de relatie tussen mediator en outcome. Dus een variabele die zowel je mediator als je outcome beïnvloedt.

18
Q

Hoe kan je het directe effect weten bij mediator-outcome confounding?

A

Als je adjust voor de mediator en de variabele die zowel de mediator als de outcome beïnvloedt.

In het voorbeeld dus voor Antidepressant use (mediator)

en voor U (variabele die zowel mediator als outcome beïnvloedt)

19
Q

Wat kan je zeggen over P-waardes?

A

Zijn stom, useless, wordt misbruik van gemaakt etc.

Wordt gebruikt bij het testen van de nulhypothese: Kunnen we de nulhypothese verwerpen of niet?

20
Q

Wat is de betekenis van de P-waarde?

A

De kans dat je DEZE associatie vindt (of sterker) in een sample, als er in het echt GEEN associatie is.

Dus: Als er in het echt geen verschil in lengte zit tussen mensen uit Rotterdam en Amsterdam. Hoe groot is de kans dat we een verschil van 1 centimeter vinden in onze sample?

21
Q

Wanneer is je significant finding meer waarschijnlijk?

A

Als je ‘power’ hoog is Als je ‘prior probability’ hoog is

22
Q

Hoe krijg je een hogere ‘power’?

A
  • Grotere sample size
  • Een hoge ‘assumed association’ => Als het echt verschil 30cm is dan vind je waarschijnlijker een significant verschil, dan wanneer het echte verschil 1cm is.
23
Q

Wat betekent ‘statistical significance’?

A

Worthy of attention

24
Q

Welke verbeteringen zijn er op het gebied van kwantitatief onderzoek?

A
  • Prior probability omhoog krijgen
  • Schatten (estimates) in plaats van testen => Niet; is er een verschil (ja/nee), Wel; hoe groot is het verschil en hoe onzeker ben je over dat verschil?
25
Q

Hoe kan je je prior probability omhoog krijgen?

A

Theoretical foundation toepassen => Niet alleen naar de data kijken, maar een doordacht plan, ondersteund door theorie.

26
Q

Wat is een confidence interval?

A

Kan je gebruiken om te zien of iets statistical significant is. Wordt gebruikt om te zien hoe zeker je bent. Bijvoorbeeld: Gemiddeld verschil in lengte is 3 cm. (95% CI = 1-5) dan is het aannemelijk dat het echte gemiddelde verschil tussen de 1 en 5 cm ligt.

27
Q

Hoe bereken je een confidence interval?

A

Lower bound: gemiddelde - 1.96 * s.e. Upper bound: gemiddelde + 1.96 * s.e.

28
Q

Hoe bereken je de standard error?

A

S.e. = s / √n

s= standaardafwijking
n= aantal observaties
29
Q

Wat is een Type I error?

A

False positive: Als de nulhypothese waar is, maar toch wordt verworpen

30
Q

Wat is een Type II error?

A

False negative: Lat zo hoog leggen dat we misschien iets missen

31
Q

Wanneer accepteren we Type I errors en wanneer Type II errors?

A

Type I error: bij het diagnosticeren van kanker; liever dat je een keer zegt dat iemand kanker heeft terwijl het niet zo is, dan andersom.

Type II errors: Spam filters,

32
Q

Waar heb je interesse in bij een regressie?

A
  • Sign: teken (positief of negatief)op het coëfficiënt voor een onafhankelijke variabele vertelt ons de richting van de associatie met de afhankelijke variabele. (bv lengte op gewicht is positief, dus een grotere lengte betekent een groter gewicht).
  • Size: Hoe groot is het effect tussen de onafhankelijke en de afhankelijke variabelen? Is het van een omvang die ertoe doet? (in het geval van lengte op gewicht is dat het geval).
  • Significance: Reflecteert het een betekenisvolle associatie, welke aannemelijk is dat deze voor de gehele populatie geobserveerd wordt.
33
Q

Wat houdt socially insignificant in?

A

Er is wel een statistical significant effect, maar dit is zo klein dat het bijna geen invloed heeft.

34
Q

Wat kan je zeggen over het confidence interval?

A

Als 0 niet in het confidence interval zit, kunnen we de nul hypothese verwerpen (bv er is geen associatie tussen lengte en gewicht). Bij een 95% confidence interval betekent dat er 5% kans is dat we de nulhypothese verwerpen terwijl dit niet zo is.

35
Q

Wat vertelt R² ons?

A

Hoeveel variatie er is rond het gemiddelde die alleen met een variabele (bv alleen met lengte) geassocieerd is. Als dit 0.25 is, dan betekent dit dat 25% van de variatie in gewicht wordt verklaard door lengte.

36
Q

Wat is een multiple regression analyse?

A

Regressie analyse wanneer er meer is dan een explanatory variabele.

Bijv. factoren die gewicht verklaren (leeftijd, lengte, geslacht, dieet, sporten etc.)

37
Q

Wat is P-hacking?

A

Verschillende dingen proberen tot je het gewenste resultaat hebt.

38
Q

Waarvoor is de P-waarde bedoeld?

A

Niet als definitieve test, maar als informele manier om te beoordelen of bewijs significant genoeg is om nog eens naar te kijken.

39
Q

Wanneer kan je spreken van een causal claim?

A

Als woorden als ‘influenced’ gebruikt worden