W12 HC.2 Statistische begrippen Flashcards
3 demonen vd wetenschap:
- Dataduivel: data slecht gearchiveerd.
- Replicatieprobleem: studieresultaten moeten door andere studies gecheckt worden.
- Verificatiekramp: te hard proberen het gewenste resultaat te krijgen.
Waar moet je op letten bij verzamelen van gegevens?
- compleetheid
- nauwkeurigheid
-> meetprotocollen
-> één observer/ gegevens over inter-observervariatie - reproduceerbaarheid
- validiteit
Vermijd:
- toevallige meetfouten (door meetonnauwkeurigheid van instrument of waarnemer veroorzaken onnodige ‘ruis’)
- systemische meetfouten (door fouten in meetinstrument
- differentiële systematische meetfouten (in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep)
Meetniveau van variabelen
Numerieke/kwantitatieve variabelen
- Discreet: hele getallen (aantal dagen ziek, aantal kinderen)
- Continue: reële getallen (lengte, gewicht, bloeddruk, inkomen)
Categorische variabelen
- Nominaal: geen ordening (geslacht, soort OK, klacht)
- Ordinaal: wel rangorde (ernst ziekte, stagering tumor)
Waarom is meetniveau van belang?
Bepaalt hoe gegevens gepresenteerd kunnen worden
Numerieke variabelen:
- mean, mediaan
- SD, interkwartielafstand
- histogram, boxplot
Bepaalt hoe gegevens geanalyseerd moeten worden
A. Numerieke (continue) uitkomst variabele
- T-test
- Lineaire regressie-analyse
B. Categorische uitkomstvariabele
- Chi-kwadraattoets
- Logische regressie-analyse
Variantie?
SD?
Variantie = (optelsom van (Xi-Xgem)^2)/(n-1)
SD = Wortel(variantie)
Wat is inferentiële statistiek?
Als je op basis van de steekproef iets probeert te zeggen over de populatie.
Als:
- Populatiegemiddelde = rho
- Populatiestandaarddeviatie = ohm
- Steekproefgrootte = n
wat is de standaardafwijking?
ohm/(wortel(n))