Week 3 - Logistic regression and fallacies Flashcards

1
Q

Wat is het verschil tussen een logistische regressie en een OLS regressie?

A
  • Outcome variabele: dichotomous (logistische regressie) of continious (OLS)
  • Voorspellen van uitkomst (OLS) of de kans dat iets gebeurt (logistische regressie)
  • Verschilt in interpretatie van de coëfficiënt => In OLS als we gewicht analyseren dan is het coëfficiënt ook in gewicht (kg).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welke overeenkomsten hebben een logistische regressie en een OLS?

A
  • Allebei een regressie analyse
  • Allebei een outcome variabele
  • Allebei een of meer explanatory variabelen
  • Allebei komen ze met P-waarden en confidence intervals
  • Ze hebben coëfficiënten die je in een regressievergelijking kan zetten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hoe interpreteer je de resultaten van een logistische regressie en OLS?

A

Ordinary Least Square: 1 cm langer wordt geassocieerd met 800 gram extra gewicht.

Logistische regressie: De kans op zwaarder zijn wordt groter door lengte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat kan je zeggen over de coëfficiënten van een OLS regressie?

A

In een OLS kan je 800 gram direct uit de regressie output terugvinden. Want het heeft de coëfficiënt van 0.8 op de schaal van kg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat kan je zeggen over de coëfficiënten van een logistische regressie?

A

We hebben coëfficiënten in een logistische regressie, maar ze betekenen niet de probability.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is relative risk / risk ratio?

A

Stel: proportion of mannen die naar de dokter gaan voor een consult is 10% proportion of vrouwen die naar de dokter gaan voor een consult is 5%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat kan je zeggen over het verschil als er in procenten wordt gemeten? (risk difference)

A

Dan gaat het over procent-punten.
Dus stel:
-proportion van mannen met overgewicht in NL is 53%
-proportion van vrouwen met overgewicht in NL is 47%
Dan is het verschil 6%-punten

Het relatieve verschil is 53% / 47% = 1.13

Dus: Bij een man is het 13% meer waarschijnlijk dat hij griep krijgt dan een vrouw.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe bereken je het relative risk ratio?

A

Kruistabel maken en proporties delen door elkaar

Bijv:
Mannen hebben 20% kans op een burn-out
Vrouwen hebben 15% kans op een burn-out

Vraag: Hoeveel meer kans heeft een man op een burn-out dan een vrouw?

100 * 20 / 15 = 133.33 = 33,33% meer kans op een burn-out dan vrouwen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is het verschil tussen risk difference en risk ratio/relative risk?

A

RD: verschil tussen proporties / probabilities

RR: ratio van proportions / probabilities

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat kan je zeggen over de coëfficiënten in een regression equation bij een logistische regressie?

A

Positief coëfficiënt (β): hogere X betekent een hogere probability p

Negatief coëfficiënt (β): hogere X betekent een lagere probability p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat zijn odds ratios?

A

De ratio van de kans dat iets gebeurt, gedeeld door de kans dat het niet gebeurt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hoe interpreteer je een odds ratio?

A

Stel:

  • Aantal mannen groter dan 1.80m 50%
  • Aantal vrouwen groter dan 1.80m 20%

RD = 30% point

RRMvsF = 2.5

ORMvsF = 4

Odds voor mannen om groter te zijn dan 1.80m zijn 4 keer de odds voor vrouwen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wanneer kunnen de odds ratio en relative risk vrijwel gelijk zijn?

A

Als de probabilities klein zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat kan je zeggen over de odds ratios?

A

Niet erg informatief.

Overestimate van de relative risk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hoe krijg je wat je wil na een RCT?

A

RR / RD berekenen aan de hand van geobserveerde proporties

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Moet je in een RCT adjusten?

A

Nee, want exchangebility is al verwacht.

17
Q

Wat is de marginal OR, RR, RD?

A

Niet geïnteresseerd in de individuele uitkomsten, maar in die van de gehele groep.

18
Q

Waarom blokkeren we paden?

A

We willen exchangeability bereiken:

-Verwijderen van uncausal elementen van de associatie.

19
Q

Waarom heet het de table 2 fallacy?

A

In table 2 worden vaak de resultaten van een analyse gepresenteerd

(Tabel 1 wordt gebruikt voor een beschrijving van de data.)

20
Q

Wat is de table 2 fallacy?

A

Het interpreteren van alle coëfficiënten uit een regressiemodel als ‘unbiased’ en als een schatting van het totale effect.

21
Q

Wat zeggen open paden?

A

Die geven een associatie door. Deze associaties kunnen worden uitgedrukt als regressie coëfficiënten

22
Q

Als we het directe effect van HIV op stroke willen weten; is het een probleem dat we voor U niet kunnen adjusten (het is een unmeasured confounder)?

A

Nee, we blokken het pad door te adjusten voor smoking

Als we geïnteresseerd zijn in het effect van roken
Roken was een partial effect op stroke, maar het is niet meer unbiased omdat er een extra backdoorpath is door U.
Nu noemen we het een ‘biased estimate of a partial effect’.

23
Q

Uit welke fases bestaat een onderzoek?

A

Fase 1: Je initieert een onderzoek: je wil een effect onderzoeken

Fase 2: Je ontwerpt je onderzoek

Fase 3: Het interpreteren van de resultaten

Fase 4: Conclusies trekken

24
Q

Hoe ziet fase 1 er uit van een onderzoek?

A

Je moet je realiseren wat een causaal effect is (Causal theory);

=> Causaal effect is als de uitkomst onder treatment 1 anders is dan onder treatment 2.

Je moet subject knowledge hebben;

Een idee hoe je exposure van invloed is op je outcome. Je moet een reden hebben om de studie te doen.

Statistical theory;

Er is altijd een kans dat je iets vindt wat niet waarschijnlijk is => zelfs als er geen effect is, betekent dat niet dat je geen effect gaat vinden.

25
Q

Hoe ziet fase 2 er uit van een onderzoek?

A

Causal theory:

Ben je geïnteresseerd in het volledige effect of het deeleffect?
Ga je mediation analysis toepassen?
Voer je een RCT uit of een observational study?

Combineren van causale theorie met subject knowledge:

Uitwerken van je assumpties, voordat je conclusies maakt (bv DAG)
Is je exposure consistent? Weet je wat je ermee bedoelt?
Op basis van de DAG, welke adjustments zijn nodig en welke verpesten je onderzoek?

Statistical theory en subject knowledge:

Vertelt je of je OLS of logistische regressive o.i.d. moet uitvoeren
Welke outcome measures heb je nodig? (gemiddelden, risk ratio etc.)

26
Q

Hoe ziet fase 3 er uit van een onderzoek?

A

Combineren van causale theorie met subject knowledge:

Zijn de resultaten een volledig effect of een deeleffect?

Beide gecombineerd met statistical theory

Wat betekenen deze coëfficiënten?
Welke coëfficiënten zijn ‘unbiased’?

Statistical theory

Hoeveel onzekerheid zit er tussen estimates?

27
Q

Hoe ziet fase 4 er uit van een onderzoek?

A

Combineren van causale theorie met subject knowledge:

Hoe zeker ben je dat je door je design een causale conclusie kan trekken?

Beide gecombineerd met statistical theory

Hoe zeker ben je van je bevindingen?

Subject knowledge

Hoe relevant zijn je bevindingen?
Hoe relateren je bevindingen aan je theorie?
Hoe relateren je bevindingen aan andere studies?

28
Q

Welke risico’s heb jij een observational studie als je geen gebruik maakt van randomization?

A
  • Confounding bias
  • Selection bias
  • Lack of consistency (exposure may not be consistent)
  • Statistical errors
  • Table 2 fallacy
  • Chance findings

Dus: Dit is allemaal EVIDENCE… geen PROOF!

29
Q

Welke risico’s heb je bij een RCT?

A
  • Statistical errors
  • Table 2 fallacy
  • Chance findings
  • Generalisability (je kan het niet generaliseren => vertelt je niks over dezelfde exposure in een andere context)
30
Q

Nog een keer; wat is een p-waarde?

A

Als er geen associatie is in de populatie, hoe groot is dan de kans dat we deze associatie in de sample vinden?

Kans van het vinden van deze data; onder voorwaarde dat de nulhypothese waar is.

31
Q

Wat kan je het best doen met de resultaten van een onderzoek?

A

Kijken naar de ‘estimates’, niet naar de test (hoe groot is het verschil, niet: is er een effect); kijk naar de coëfficiënten.

Confidence interval is ook niet perfect, maar wel beter dan het gebruik van P-values.

32
Q

Wanneer is een estimate unbiased?

A

Als alle relevante causal paths open zijn

EN

alle backdoor paths gesloten zijn

33
Q

Wat is het verschil tussen causation and assocation?

A

Causation: THEORETICAL CONCEPT

Wat zou zijn gebeurd als iedereen behandeld werd / wat zou zijn gebeurd als niemand behandeld werd?

Association: OBSERVED RELATIONSHIP

Wat is er gebeurd met mensen die behandeld zijn / wat is er gebeurd met mensen die niet behandeld zijn?