Lastig Flashcards
Wat is selection bias?
Er is sprake van selectionbias wanneer groepen in een studie niet vergelijkbaar zijn. Hierbij wordt geen randomizatie behaald. Bijvoorbeeld: Rutten kan niet gewonnen hebben, ik ken niemand die op hem gestemd heeft. Of: Onderzoek naar besteedbaar inkomen op een vliegveld (mensen die vliegen hebben hoogstwaarschijnlijk meer dan te besteden dan gemiddelde mensen) (plaatje)
Wat is survivorship bias?
Als observaties uit het sample verdwijnen.
Survivor bias is een fout in onze redenering, omdat we ons focussesn op de overlevenden, waardoor analyses een vertekend beeld kunnen geven.
Bv: tweede wereldoorlog. Analyseren waar de vliegtuigen het meest geraakt werden en daar bepantsering aanbrengen. Het gaat juist om waar ze niet geraakt werden, want deze vliegtuigen keerden allemaal terug.
Check macbook Plaatje
Wat kan je zeggen over ‘clusters happen’?
Statistisch gezien is het onwaarschijnlijk dat een aantal mensen in een bepaald gebied een zeldzame vorm van kanker hebben. Maar dit kan wel puur toeval zijn.
Bv; Kans is niet groot dat iemand 6 keer achter elkaar munt gooit. Maar laat een groep van 1000 mensen muntjes opgooien en de kans is ineens aannemelijk dat er iemand tussen zit die het gelukt is.
Wat is een natural experiment?
Een controlled experiment, dat mogelijk wordt gemaakt door gebeurtenissen in het verleden.
Bv: Effect van educatie op levensverwachting. In Amerika zijn in verschillende staten op verschillende tijdstippen wetgevingen ingesteld over hoe lang kinderen leerplichtig zijn. Ze vergeleek deze met staten die niet hun wetgeving veranderden.
Wat houdt regressie in?
Wordt gebruikt voor het adjusten van verschillende confounders op hetzelfde moment.
Het beschrijft mathematische relaties tussen uitkomst en een of meerdere variabelen.
Wat kan je zeggen over mediation analyse?
Je kan kiezen om voor een mediator te adjusten of niet.
Een mediator is een variabele die op een causaal pad zit tussen de exposure en outcome.
Voorbeeld mediator:
Welke verbeteringen zijn er op het gebied van kwantitatief onderzoek?
- Prior probability omhoog krijgen
- Schatten (estimates) in plaats van testen => Niet; is er een verschil (ja/nee), Wel; hoe groot is het verschil en hoe onzeker ben je over dat verschil?
Wat is een confidence interval?
Kan je gebruiken om te zien of iets statistical significant is.
Wordt gebruikt om te zien hoe zeker je bent.
Bijvoorbeeld: Gemiddeld verschil in lengte is 3 cm. (95% CI = 1-5) dan is het aannemelijk dat het echte gemiddelde verschil tussen de 1 en 5 cm ligt.
Wat vertelt R² ons?
Hoeveel variatie er is rond het gemiddelde die alleen met een variabele (bv alleen met lengte) geassocieerd is.
Als dit 0.25 is, dan betekent dit dat 25% van de variatie in gewicht wordt verklaard door lengte.
Wat is een multiple regression analyse?
Regressie analyse wanneer er meer is dan 1 explanatory variabele.
Bijv. factoren die gewicht verklaren (leeftijd, lengte, geslacht, dieet, sporten etc.)
Wat is P-hacking?
Verschillende dingen proberen tot je het gewenste resultaat hebt.
Waarvoor is de P-waarde bedoeld?
Niet als definitieve test, maar als informele manier om te beoordelen of bewijs significant genoeg is om nog eens naar te kijken.
Waar heb je interesse in bij een regressie? (welke 3 kenmerken?)
- Sign: teken (positief of negatief) op het coëfficiënt voor een onafhankelijke variabele vertelt ons de richting van de associatie met de afhankelijke variabele. (bv lengte op gewicht is positief, dus een grotere lengte betekent een groter gewicht).
- Size: Hoe groot is het effect tussen de onafhankelijke en de afhankelijke variabelen? Is het van een omvang die ertoe doet? (in het geval van lengte op gewicht is dat het geval)
- Significance: Reflecteert het een betekenisvolle associatie, welke aannemelijk is dat deze voor de gehele populatie geobserveerd wordt?
Wat kan je zeggen over het confidence interval?
Als 0 niet in het confidence interval zit, kunnen we de nulhypothese verwerpen (bv er is geen associatie tussen lengte en gewicht). Bij een 95% confidence interval betekent dat er 5% kans is dat we de nul hypothese verwerpen terwijl dit niet zo is.
Wat kan je zeggen over de coëfficiënten van een logistische regressie?
We hebben coëfficiënten in een logistische regressie, maar ze betekenen niet de probability.
Wat is het verschil tussen risk difference en risk ratio/relative risk?
RD: verschil tussen proporties / probabilities
RR: ratio van proportions / probabilities
Wat kan je zeggen over de coëfficiënten in een regression equation bij een logistische regressie?
Positief coëfficiënt (β): hogere X betekent een hogere probability p
Negatief coëfficiënt (β): hogere X betekent een lagere probability p
Hoe interpreteer je een odds ratio?
Stel:
- Aantal mannen groter dan 1.80m 50%
- Aantal vrouwen groter dan 1.80m 20%
RD = 30% point RRMvsF = 2.5 ORMvsF = 4
Odds voor mannen om groter te zijn dan 1.80m zijn 4 keer de odds voor vrouwen.
Wat kan je zeggen over de odds ratios?
Zijn ze informatief?
Niet erg informatief.
Overestimate van de relative risk
Hoe krijg je wat je wil na een RCT?
RR / RD berekenen aan de hand van geobserveerde proporties
Waarom blokkeren we paden?
We willen exchangeability bereiken:
-Verwijderen van uncausal elementen van de associatie.
Wat is de table 2 fallacy?
Het interpreteren van alle coëfficiënten uit een regressiemodel als ‘unbiased’ en als een schatting van het totale effect.
Waarom heet het de table 2 fallacy?
In table 2 worden vaak de resultaten van een analyse gepresenteerd
(Tabel 1 wordt gebruikt voor een beschrijving van de data.)
Wat zeggen open paden?
Die geven een associatie door.
Deze associaties kunnen worden uitgedrukt als regressie coëfficiënten
Als we het directe effect van HIV op stroke willen weten; is het een probleem dat we voor U niet kunnen adjusten (het is een unmeasured confounder)?
Nee, we blokken het pad door te adjusten voor smoking Als we geïnteresseerd zijn in het effect van roken Roken was een partial effect op stroke, maar het is niet meer unbiased omdat er een extra backdoorpath is door U. Nu noemen we het een ‘biased estimate of a partial effect’.
Uit welke fases bestaat een onderzoek?
Fase 1: Je initieert een onderzoek: je wil een effect onderzoeken
Fase 2: Je ontwerpt je onderzoek
Fase 3: Het interpreteren van de resultaten
Fase 4: Conclusies trekken
Hoe ziet fase 1 er uit van een onderzoek?
Je moet je realiseren wat een causaal effect is (Causal theory);
=> Causaal effect is als de uitkomst onder treatment 1 anders is dan onder treatment 2.
Je moet subject knowledge hebben;
Een idee hoe je exposure van invloed is op je outcome. Je moet een reden hebben om de studie te doen.
Statistical theory;
Er is altijd een kans dat je iets vindt wat niet waarschijnlijk is => zelfs als er geen effect is, betekent dat niet dat je geen effect gaat vinden.