H2 Power, effectgrootte en one-way ANOVA Flashcards

1
Q

Wat is power
- onderscheidend vermogen

A

Het onderscheidende vermogen (power) van een toets is de kans op het terecht verwerpen van de nulhypothese als deze in werkelijkheid dus niet waar is
- 1-beta (beta = type II fout) –> dus een zo laag mogelijke beta/type II fout = onterecht behouden van H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Liever een hoge of lage power?

A

Een hoge power is wenselijk, want het impliceert een hoge kans op het terecht verwerpen van een nulhypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Type I fout
- alfa

A

H0 verwerpen op basis van statistiek, terwijl H0 in de werkelijkheid waar is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Type II fout
- beta

A

H0 aanhouden op basis van statistiek, terwijl H0 in de werkelijkheid verworpen moet worden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Stappenplan power berekenen van een Z-toets

A
  1. bepaal de Z van de kritieke waarde onder H0
  2. bepaal het steekproefgemiddelde X dat bij Z hoort onder H0
  3. reken kritieke grenswaarde X om naar de Z-waarde van H1 onder H1
  4. de power is gelijk aan de kans P(Z>ZH1|H1)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

welke factoren zijn nodig voor een goede beslissing

A
  • kleine alfa = kleine kans op onterecht H0 verwerpen (type I fout)
  • hoge power (1-beta) = hoge kans op terecht verwerpen van H0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

4 factoren die power beïnvloeden

A
  • alfa: hogere alfa zorgt voor makkelijker type I fout
  • N (steekproefgrootte): hogere N zorgt voor een hoger Z en is makkelijker te verwerpen
  • sigma: standaarddeviatie in de populatie; kleinere waarde zorgt voor hogere Z
  • de ‘ware mu’ in de alternatieve hypothese
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Effectgrootte

A

Verwerpen van H0 leidt tot significantie
- maar ‘significant’ betekent niet: het is onomstotelijk bewezen dat er een systematisch effect is
- en… significant betekent ook niet per se dat het effect praktisch/klinisch sigificant is… zelf heel kleine - oninteressante verschillen - zijn significant als je heel grote steekproeven gebruikt
–> als N laag is, is het vermogen van de toets laag en statistisch niet significant, ook als het effect groot is
–> als N hoog is, is het vermogen van de toets hoog en statistisch wel significant, ook als het effect laag is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Twee belangrijke maten voor effectgrootte bij het vergelijken van gemiddelden

A
  • Cohen’s d (hoe groot is het relatieve verschil in groepen
  • (partiële) verklaarde variantie (etha^2)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Waardes van cohens d en verklaarde variantie voor effecten

A

klein: d=0.2 en etha^2= 0.01
middel: d=0.5 en etha^2=0.06
groot: d=0.8 en etha^2=0.14

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

klein effect

A

Verschil tussen gemiddelde van controle en experimentele groep is de cohen’s d (0.2)
–> 58% van de experimentele groep scoort hoger dan het gemiddelde van de controle groep (dmv Z-score)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Middelgroot effect

A

Verschil tussen gemiddelde van controle en experimentele groep is de cohen’s d (0.5)
–> 69% van de experimentele groep scoort hoger dan het gemiddelde van de controle groep (dmv Z-score)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Groot effect

A

Verschil tussen gemiddelde van controle en experimentele groep is de cohen’s d (0.8)
–> 79% van de experimentele groep scoort hoger dan het gemiddelde van de controle groep (dmv Z-score)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Rekenformules voor effectgrootte

A

d = t x wortel(1/N) –> één groep
d = t x wortel (1/n + 1/n) –> twee groepen
etha^2 = t^2/t^2 + dfw –> dfw is vrijheidsgraden = n1 + n2 - 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

ANOVA

A

ANalysis Of Variance (Variantie analyse)
- gemiddelden van (experimentele) groepen vergelijken
- onafhankelijke t-toets vergelijkt altijd twee gemiddelden, ANOVA kan er 2+ vergelijken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

between-subjects design

A

In elke conditie is er een onafhankelijke steekproef
- design met onafhankelijke groepen

16
Q

Within-subjects/repeated measures design

A

Proefpersonen kunnen blootgesteld worden aan meerdere condities
- design met herhaalde metingen

17
Q

Factoren

A

Categorische onafhankelijke variabelen
- categoriën zijn niveaus
- combinatie van niveaus is conditie

18
Q

Factorial design

A

Design met meerdere factoren

19
Q

Fully crossed factorial design

A

2 niveaus met elk 3 niveaus
- 3x3=9 condities

20
Q

Hypothesetoetsen in ANOVA

A

K = hoeveelheid groepen
- H0: mu1=mu2=muk=mu
- H0: alfak=muk-mu=0 –> alfak is treatmenteffect van groep k

21
Q

Hoveel t-toetsen zijn er nodig

A

K x (K-1)/2

22
Q

Waarom ANOVA gebruiken

A
  • meerdere toetsen uitvoeren leidt tot een grotere kans op type-1 fouten (onterecht verwerpen) –> ANOVA omnibus toets gaat dit tegen
    –> je kunt ook een aangepasta alfa gebruiken voor de individuele toetsen als je niet via ANOVA toetst
23
Q

Experiment wise type 1 fout

A

Kans op ten minste 1 type 1 fout bij vele testen
P = 1 - (1-0.05)^3 = 0.143
- ^3 = hoeveel testen

24
Q

Test wise type 1 fout

A

Risico op een type 1 fout voor een individuele toets

25
Q

Logica van ANOVA

A
  • je kunt niet kijken of gemiddelden van elkaar verschillen (t-toets)
    –> maat die spreiding van gemiddelden aangeeft nodig (= variantie van gemiddelden)
  • vergelijkt variantie tussen groepsgemiddelden met de variantie binnen groepen
    –> grotere tussen dan binnen groepsvariantie is een indicatie van een effect van de procedure
26
Q

Spreiding tussen groepen

A

Verschillen tussen het overkoepelende gemiddelde en groepsgemiddelden
–> dit is ook alfak = mu1-mu

27
Q

Spreiding binnen groepen

A

Verschillen in geobserveerde scores en het groepsgemiddelden