H12.2: Statistische begrippen Flashcards
3 demonen in wetenschap
- de dataduivel (het moet goed gearchiveerd zijn)
- het replicatieprobleem (studieresultaten moeten door andere studies gecheckt worden)
- verificatiekramp (te hard proberen het gewenste resultaat te krijgen; zoeken totdat je iets significants vindt)
wat is van belang bij gegevens voor wetenscchappelijk onderzoek?
- compleetheid
- nauwkeurigheid
=meetprotocollen
=1 observer/gegevens over inter-observariatie - reproduceerbaarheid
- validiteit
type fouten
- toevallige meetfouten: door meetonnauwkeurigheid van instrument of waarnemer => onnodige ‘ruis’
- systematische meetfouten: door fouten in meetinstrument (het verschil zal hetzelfde zijn omdat in beide groepen dezelfde systematische fout wordt gemaakt)
- differentiele systematische meetfouten: in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep
meetniveau van variabelen
- numeriek/kwantitatief
- categorische variabelen
numerieke;kwantitatieve variabelen onderverdeling
- discreet: gehele getallen (aantal dagen ziek, aantal kinderen)
- continu: reële getallen (lengte, gewicht, bloeddruk, inkomen)
categorische variabelen onderverdeling
- nominaal: geen ranordening (geslacht, soort OK, klacht)
- ordinaal: wel rangorde (ernst ziekte, stagering tumor)
waarom is meetniveau van belang?
- bepaalt hoe gegevens gepresenteerd kunnen worden
- bepaalt hoe gegevens geanalyseerd moeten worden
wat kan je doen bij numerieke variabelen?
- gemiddelde of mediaan
- SD of interkwartielafstand
- histogram, boxplot
wat kan je met categorische variabelen?
- % in de categorien
- taartdiagram
numerieke analyse methoden
- t-test
- lineaire regressie-analyse
categorische variabelen analyse methode
GEEN t-test
- chi-kwadraattoets
- logistische regressie-analyse
variantie =
kwadraat van SD
bekijk even het berekenen van variantie en SD
populatie parameters
onbekende numerieke karakteristieken van een populatie
je zegt iets over de populatie
met griekse letters zoals delta
aanname bij statistische theorie
de steekproef is aselect: iedereen in de populatie heeft evenveel kans om in de steekproef te komen
praktijk: men HOOPT dat de studiegroep even goed is als een echte aselecte steekproef
toevallige fout is te voorkomen?
nee. systematisch wel
inferentiele statistiek
wat kunnen we obv de steekproef zeggen over de waarde van de onbekende populatieparameters?
waarvan is de spreiding afhankelijk?
- spreiding vd individuele waarden (populatieSD)
- grootte vd steekproef
hoe bereken je hoe gespreid de gemiddelden binnen verschillende steekproeven zijn?
SD/wortel van populatiegrootte
standard error
hoe dichtbij zitten we iegenlijk bij de populatiegemiddelde (wat voor gemiddelde fout kunnen we maken als we 100 mensen uit de populatie hebben getorkken)