Thema 4 - Type 1-fouten en power / 4.6 - 4.7 Flashcards
wat is een type 1-fout?
- Een type 1-fout wordt gemaakt als de nulhypothese onterecht wordt verworpen, dus als er wordt geconcludeerd dat er in de populatie een verband bestaat terwijl dit eigenlijk niet zo is. => vals positief
- bij een alpha van .25 gebeurt dit in 25% van de getrokken steekproeven uit de populatie waar het betreffende verband niet bestaat
(12.5% laagste en 12.5% hoogste -> meest extreme correlaties) - bij een alpha van .05 verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2.5% of in de hoogste 2.5% valt
hoe kunnen we de kans op een type 1-fout verlagen?
- De kans op een type 1-fout kan alleen worden verlaagd door een lagere alpha te kiezen.
- Bij een alpha van .05 – de conventie in de psychologie – wordt in 5 % van de gevallen waarin een p-waarde wordt gebruikt om conclusies te trekken over een populatie, een type 1-fout gemaakt (onterecht de nulhypothese verwerpen).
welke twee gegevens gebruiken we voor de nulhypothese-significantietoetsing?
- steekproevenverdeling voor een populatiecorrelatie van r=0 (is een aanname)
- het aantal proefpersonen = n
welke redenering volgt de nulhypothese-significantietoetsing?
- steekproevenverdeling voor een populatiecorrelatie van r=0
- steekproefomvang van n met een steekproefcorrelatie van r=.30
- vervolgens de p-waarde berekenen en de p-waarde vergelijken met de alpha (=kritische p-waarde)
- als we een alpha van .05 kiezen dan verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2,5% of in de hoogste 2,5% valt
wat betekent een alpha van .05?
- als we een alpha van .05 kiezen dan verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2,5% of in de hoogste 2,5% valt
- ook als we de nulhypothese verwerpen, zal dit dus in 5% van de gevallen onterecht zijn (-> vals positief of een type 1-fout)
wat is een type 2-fout?
- bij een type 2-fout wordt de nulhypothese ten onrechte aangehouden
beschrijf het nadelige gevolg van de mechaniek van de NHST? en geef hiervoor een mogelijke oplossing?
- Dit is een nadelig gevolg van de mechaniek van NHST: als de alpha lager is, wordt de kans op een type 1-fout kleiner, maar de kans op een type 2-fout wordt groter.
- een oplossing is: de steekproefomvang vergroten.
==> door de steekproefomvang te vergroten is de kans dat we een relatief lage correlatie in onze steekproef vinden kleiner geworden, als de populatiecorrelatie inderdaad r= .40 is.==> de steekproevenverdeling waaruit onze steekproefcorrelatie uitkomt is door de grotere steekproef dan ook een stuk smaller
wat is de power van de nulhypothesetoets?
= de kans dat we een verband van een bepaalde omvang kunnen detecteren, aangenomen dat deze echt bestaat
welke stappen moeten we zetten in de procedure van de NHST?
- stel de alpha vast (bijv .05)
- neem een steekproef ve gegeven omvang (n) + meet de betreffende variabelen en bereken de maat van samenhang (bijv de correlatie)
- construeer op basis van de NHST (=in de populatie geldt r=0) en de steekproefomvang (n) de **steekproevenverdeling van Pearson’s r **volgens de nulhypothese
- bereken de p-waarde (oftewel de proportie vd steekproevenverdeling die correlaties betreft die even extreem of extremer zijn dan de correlatie die in de steekproef in stap 2 is gevonden
- vergelijk de p-waarde met de gekozen alpha (p-waarde < alpha dan verwerpen we de nulhypothese / p-waarde > alpha dan behouden we de nulhypothese)
welke twee fouten kunnen er tijdens de NHST worden gemaakt?
= type 1-fout, de nulhypothese wordt ten onrechte verworpen -> die kans is gelijk aan alpha
= type 2-fout, de nulhypothese wordt ten onrechte behouden -> de grootte van die kans hangt af vd de daadwerkelijke correlatie (die altijd onbekend is) en van de steekproefomvang
! het omgekeerde van de kans op een type 2-fout heet de POWER van een toets
Wat is het verband tss power en type 2- fout?
Er bestaat een omgekeerd evenredig verband tussen het risico op een Type II-fout en de statistische power van een toets. Hoe meer power een statistische toets heeft, hoe kleiner het risico dat je een Type II-fout maakt.
Wat is een poweranalyse?
Wat is de procedure van een poweranalyse?
- Een poweranalyse is een berekening om de minimale steekproefomvang voor het onderzoek te bepalen.
- Een poweranalyse bestaat uit vier hoofdcomponenten. Als je de waarde voor drie van deze componenten weet of kunt schatten, kun je de vierde component berekenen.
Statistische power = de waarschijnlijkheid dat een test een effect van een bepaalde grootte detecteert als het effect daadwerkelijk bestaat (meestal 80% of hoger).
Steekproefomvang = het minimale aantal waarnemingen dat nodig is om een effect van een bepaalde omvang bij een gegeven power-niveau te detecteren.
Significantieniveau (alfa) = het maximale risico op het onterecht verwerpen van de nulhypothese (meestal 5% of 1%).
Verwachte effectgrootte = een gestandaardiseerde manier om de omvang van het verwachte effect uit te drukken, meestal gebaseerd op vergelijkbare onderzoeken of een pilotonderzoek.
waar moet een onderzoeker rekening meehouden als hij data gaat verzamelen?
- eerst berekenen hoe groot de steekproef moet zijn
- als de NHST wordt gebruikt, dan wordt dit gedaan door powerberekeningen
- ! hiervoor is een aanname nodig, nl. die vd daadwerkelijke populatiecorrelatie -> dus eerst goed nadenken over hoe sterk het verband is dat ze hopen te vinden
- vervolgens besluiten hoe groot de gewenste kans op succes is
wat betekent het als een studie “underpowered” is?
wat is dan het extra gevaar?
- in die studies is de kans klein om de nulhypothese te verwerpen bij een daadwerkelijk verband in de populatie (dus hoge type 2-fout)?
- extra gevaar: naarmate de daadwerkelijke populatiecorrelatie groter is, is de power ve studie met een gegeven steekproefomvang hoger => want de correlatie die in de steekproef wordt gevonden, komt dan uit een populatie-steekproevenverdeling die steeds verder van de nulhypothese-steekproevenverdeling af ligt –> dit komt omdat steekproevenverdelingen bij kleine steekproeven heel breed zijn
- ==> bij underpowered studies is de kans redelijk groot dat er in een steekproev een relatief sterk verband wordt gevonden, terwijl er in de populatie helemaal geen verband is
wat is multiple testing?
- studies waarbij vaak meerdere verbanden tegelijk worden onderzocht, dan worden de variabelen die gemeten worden in een correlatiematrix gezet
-