Statistische begrippen Flashcards
dataduivel
data is slecht gearchiveerd
- data verzamelen, meetkwaliteit, meetniveau
replicatieprobleem
studieresultaten moeten door andere studies gecheckt worden
verificatiekramp
te hard proberen het gewenste resultaat te krijgen
Wat is belangrijk bij gegevens verzamelen
- Compleetheid
- Nauwkeurigheid
o Meetprotocollen
o één observer/gegevens over inter-observervariatie - Reproduceerbaarheid (goed laten zien wat er is gedaan zodat iedereen het onderzoek na kan doen)
- Validiteit (meet je wat je wil meten)
toevallige meetfout
door meetonnauwkeurigeheid van een instrument of waarnemer die onnodige ‘ruis’ veroorzaken. Worden altijd gemaakt, maar je wilt de kans zo klein mogelijk maken.
systematische meetfouten
door fouten in meetinstrumenten, denk hierbij aan een fout geijkte weegschaal. Deze vormen een probleem bij de reproduceerbaarheid.
differentiële systematische meetfouten
in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep. Hierdoor kan een verschil worden aangetoond die er helemaal niet is.
numerieke variabelen
hoeveelheden; discreet en continu
discreet
gehele getallen (aantal dagen ziek, aantal kinderen)
continu
reële getallen (lengte, gewicht, bloeddruk, inkomen)
categorische variabelen
nominaal en ordinaal
nominaal
geen ordening (geslacht, soort OK, klacht)
ordinaal
wel randorde (ernst ziekte, stagering tumor)
Waarom is meetniveau van belang?
bepaalt hoe gegevens gepresenteerd en geanalyseerd moeten worden
presentatie numerieke variabelen
Gemiddelde of mediaan
Standaarddeviatie (spreidingsmaat) of interkwartielafstand (afstand van de middelste 50% zichtbaar in boxplot)
Histogram, boxplot
presentatie categorische variabelen
Percentages in de categorieën
Taartdiagram
T-test
hiermee kun je onafhankelijke groepen analyseren; bij numeriek
lineaire regressie analyse
welke factoren de grootte van de daling bepalen kan hiermee geanalyseerd worden. Alleen verklarende variabelen kunnen gebruikt worden
Chi-kwadraattoets (X2)
Komt hypertensie tijdens zwangerschap vaker voor bij vrouwen van niet-westerse afkomst?
bij nominale variabelen
logistische regressie analyse
dichotome uitkomsten (wel/niet) kunnen worden gerelateerd aan één of meer factoren
gewone regressie analyse
kan gebruikt worden voor continue variabele
Waarom is statistiek nodig?
- Spreiding/variabiliteit in gegevens.
- Fysieke/medische/psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten.
standaarddeviatie
o Hoe ver liggen de individuele waarden van het gemiddelde af?
o Nadeel: erg gevoelig voor extreme waarden
o Alle afwijkingen worden in het kwadraat gedaan, zodat er geen negatieve waarden meer zijn, anders kan SD 0 worden.
Variantie
je neemt van elk individu een verschilscore tov gemiddelde, die tel je op en deelt door aantal personen – 1.