Basisbegrippen uit methodologie en statistiek Flashcards
vraagstelling
over een waargenomen proces of verschijnsel + vermoeden over mogelijke oplossing
Theorie
geheel aan samenhangende en niet onderlinge strijdige uitspraken over een waargenomen verschijnsel of proces
Hypothese
uit de theorie voortvloeiende voorspelling die getoetst kan worden, precies geformuleerd en falsifieerbaar
Experiment
verzamelen gegevens/data om hypothese te toetsen. Validiteit en betrouwbaarheid.
Analyse
gaan aan de hand van meetgegevens of de voorspelling uitkomt.
Hypothese juist: verificatie/confirmatie; onjuist: falsificatie.
validiteit
dat je instrument meet wat je zegt te meten.
- criterion validity: instrumentarium meet wat je wilt meten.
- content validity: bij meten alle facetten aanwezig
- test-retest reliability: bij opnieuw meten dezelfde waarden uitkomen
Between design
verschillende groepen deelnemers worden verdeeld over verschillende condities, allemaal 1 conditie ondergaan
Within design
alle deelnemers ondergaan alle condities.
randomisatie
volgorde van deelnemers wordt geheel willekeurig bepaald
Counterbalancing
volgorde waarin deelnemers worden getest kan verschillen om practice effects en/of boredom effects te verminderen
Normaalverdeling
frequentie die het meest voortkomt is ook de gemiddelde waarde en de centrale waarde; heeft bekende vorm van de belshaped curve
Skewness
scheef, gebrek aan symmetrie
- positief, negatief
Kurtosis
piekvromigheid, verdeling heeft een hoge of lage piek
- leptokurtic: hoge scores en heel stijl
- platykurtic: lage scores en wat vlakker
Modus (mode)
waarde die het meeste voortkomt; waarde met de hoogste frequentie
Mediaan
middelste score als de lijst van waarde op volgorde staat
range
grootte spreiding in een verdeling; hoogste minimus laagste waarde in de verdeling
z-score
transformeren van waarden naar normaalscoren
Nulhypothese (H0)
hypothese die stelt dat er geen effect waargenomen zal worden
Alternatieve hypothese (H1)
hypothese die stelt dat er wel een effect waargenomen zal worden
Populație (population)
µ en ∂
steekproef (sample)
x met streepje en s
fit van het model
mate waarin model overeenkomt met de werkelijkheid
Spreidingsmaten
SS (sum of squares): kwadrateren deviatie.
variantie = delen door N
> overschat door kwadrateren, dus wortel hiervan = standaarddeviatie
SD = wortel(variantie)
Vrijheidsgraden, df
aantal observaties die kunnen variëren, N-1.
Schatten SEm
Sem = s/sqrt(N)
SD = SE/Sem
Central limit theorem
bij grotere samples (>30) heeft de sampleverdeling een normaalverdeling met een gemiddelde gelijk aan populatiegemiddelde en SD gelijk aan SEm. Steekproef zal relatief representatief zijn voor de populatie.
Betrouwbaarheidsinterval
interval waarbinnen het echte gemiddelde met bepaald percentage zekerheid ligt.
[x-1.96xSem, x+1.96xSem]
x = gemiddelde.
Lower boundary en upper boundary confidence interval
[X-(z((1-p)/2)SE] en [X+(z((1-p)/2)SE)]
p-waarde geeft de waarschijnlijkheid van het interval
lower en upper boundary bij kleine samples (<30)
[X-(t(n-1)SE)] en [X+(t(n-1)SE)]
error bar
weergave van het betrouwbaarheidsinterval.
Informatie over de grenzen waarbinnen het populatiegemiddelde waarschijnlijk zal vallen.
Samples vergelijken geeft een idee of de gemiddelden uit de dezelfde populaties komen.
Toetsingsgrootheid
Fitten van statistisch model die de hypothese representeert kan met de kans worden beoordeeld of het effect is toe te schrijven aan manipulatie of aan toeval.
Systematic en unsystematic variation met elkaar vergelijken.
Test statistic = systematisch/onsystematisch = effect/error.
Goed is > 1.
kans <0,05 is significant, de nulhypothese kan worden verworpen.
Experimenteel onderzoek
kijken waar een manipulatie toe leidt; zoek naar verschillen, afhankelijke en onafhankelijke variabele
Correlationeel onderzoek
geen manipulaties van de onderzoeker; op zoek naar verbanden
Onsystematische variatie
gevolg van toevallige factoren tussen experimentele condities
systematische variatie
experimentator heeft in een bepaalde groep de condities veranderd
Geïdealiseerde frequentieverdeling
kansverdeling. De meest voorkomende waarde ligt in het midden en is het gemiddelde.
Statistisch model
model dat de werkelijkheid weergeeft
Steekproefverdeling
normaalverdeling van een random geselecteerde groep uit een populatie, steekproef. SEm geeft de standaarddeviatie aan van deze steekproef
Significantie
waargenomen effect of correlatie is significant Als het onaannemelijk is dat het gevonden effect op toeval berust. De kans is groot dat het effect toe te schrijven is aan manipulatie.
p-waarde <0,05.
One-tailed test
statistisch model waarbij een directionele hypothese getoetst wordt
- richting effect
- uiteinde vanaf 0,05
two-tailed test
statistisch model waarbij een non-directionele hypothese getoetst wordt
- uitkomst positief of negatief, beide uiteinden bekeken
- uiteinden vanaf 0,025
power
kans om effect aan te tonen
- steekproefgrootte N
-significantieniveau
- effect size r
parametrische toetsen
gebaseerd op normaalverdeling met het gemiddelde en de std als parameters.
Non-parametrische toetsen
wanneer er alleen categorische variabelen zijn of wanneer de numerieke variabelen niet voldoen aan de aannames
Normaliteit
varianties zijn normaal verdeeld (zolang de samples groot genoeg zijn)
Homogeniteit
variantie over de verschillende groepen moet ongeveer gelijk zijn
Getest met Levene’s test, die de nulhypothese toetst dat de verschillen in varianties nul zijn. Wanneer dit een significant resultaat geeft zijn de varianties dus niet gelijk en mag geen parametrische toets worden uitgevoerd.
Onafhankelijkheid
Afhankelijk van test. Het gedrag van de ene proefpersoon mag niet het gedrag van een andere proefpersoon beïnvloeden