Thema 4 - Type 1-fouten en power / 4.6 - 4.7 Flashcards

1
Q

wat is een type 1-fout?

A
  • Een type 1-fout wordt gemaakt als de nulhypothese onterecht wordt verworpen, dus als er wordt geconcludeerd dat er in de populatie een verband bestaat terwijl dit eigenlijk niet zo is. => vals positief
  • bij een alpha van .25 gebeurt dit in 25% van de getrokken steekproeven uit de populatie waar het betreffende verband niet bestaat
    (12.5% laagste en 12.5% hoogste -> meest extreme correlaties)
  • bij een alpha van .05 verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2.5% of in de hoogste 2.5% valt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

hoe kunnen we de kans op een type 1-fout verlagen?

A
  • De kans op een type 1-fout kan alleen worden verlaagd door een lagere alpha te kiezen.
  • Bij een alpha van .05 – de conventie in de psychologie – wordt in 5 % van de gevallen waarin een p-waarde wordt gebruikt om conclusies te trekken over een populatie, een type 1-fout gemaakt (onterecht de nulhypothese verwerpen).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

welke twee gegevens gebruiken we voor de nulhypothese-significantietoetsing?

A
  • steekproevenverdeling voor een populatiecorrelatie van r=0 (is een aanname)
  • het aantal proefpersonen = n
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

welke redenering volgt de nulhypothese-significantietoetsing?

A
  1. steekproevenverdeling voor een populatiecorrelatie van r=0
  2. steekproefomvang van n met een steekproefcorrelatie van r=.30
  3. vervolgens de p-waarde berekenen en de p-waarde vergelijken met de alpha (=kritische p-waarde)
  4. als we een alpha van .05 kiezen dan verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2,5% of in de hoogste 2,5% valt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

wat betekent een alpha van .05?

A
  • als we een alpha van .05 kiezen dan verwerpen we de nulhypothese (r=0) als onze steekproefcorrelatie in de laagste 2,5% of in de hoogste 2,5% valt
  • ook als we de nulhypothese verwerpen, zal dit dus in 5% van de gevallen onterecht zijn (-> vals positief of een type 1-fout)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

wat is een type 2-fout?

A
  • bij een type 2-fout wordt de nulhypothese ten onrechte aangehouden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

beschrijf het nadelige gevolg van de mechaniek van de NHST? en geef hiervoor een mogelijke oplossing?

A
  • Dit is een nadelig gevolg van de mechaniek van NHST: als de alpha lager is, wordt de kans op een type 1-fout kleiner, maar de kans op een type 2-fout wordt groter.
  • een oplossing is: de steekproefomvang vergroten.
    ==> door de steekproefomvang te vergroten is de kans dat we een relatief lage correlatie in onze steekproef vinden kleiner geworden, als de populatiecorrelatie inderdaad r= .40 is.
    ==> de steekproevenverdeling waaruit onze steekproefcorrelatie uitkomt is door de grotere steekproef dan ook een stuk smaller
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

wat is de power van de nulhypothesetoets?

A

= de kans dat we een verband van een bepaalde omvang kunnen detecteren, aangenomen dat deze echt bestaat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

welke stappen moeten we zetten in de procedure van de NHST?

A
  1. stel de alpha vast (bijv .05)
  2. neem een steekproef ve gegeven omvang (n) + meet de betreffende variabelen en bereken de maat van samenhang (bijv de correlatie)
  3. construeer op basis van de NHST (=in de populatie geldt r=0) en de steekproefomvang (n) de **steekproevenverdeling van Pearson’s r **volgens de nulhypothese
  4. bereken de p-waarde (oftewel de proportie vd steekproevenverdeling die correlaties betreft die even extreem of extremer zijn dan de correlatie die in de steekproef in stap 2 is gevonden
  5. vergelijk de p-waarde met de gekozen alpha (p-waarde < alpha dan verwerpen we de nulhypothese / p-waarde > alpha dan behouden we de nulhypothese)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

welke twee fouten kunnen er tijdens de NHST worden gemaakt?

A

= type 1-fout, de nulhypothese wordt ten onrechte verworpen -> die kans is gelijk aan alpha

= type 2-fout, de nulhypothese wordt ten onrechte behouden -> de grootte van die kans hangt af vd de daadwerkelijke correlatie (die altijd onbekend is) en van de steekproefomvang

! het omgekeerde van de kans op een type 2-fout heet de POWER van een toets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is het verband tss power en type 2- fout?

A

Er bestaat een omgekeerd evenredig verband tussen het risico op een Type II-fout en de statistische power van een toets. Hoe meer power een statistische toets heeft, hoe kleiner het risico dat je een Type II-fout maakt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is een poweranalyse?
Wat is de procedure van een poweranalyse?

A
  • Een poweranalyse is een berekening om de minimale steekproefomvang voor het onderzoek te bepalen.
  • Een poweranalyse bestaat uit vier hoofdcomponenten. Als je de waarde voor drie van deze componenten weet of kunt schatten, kun je de vierde component berekenen.

Statistische power = de waarschijnlijkheid dat een test een effect van een bepaalde grootte detecteert als het effect daadwerkelijk bestaat (meestal 80% of hoger).

Steekproefomvang = het minimale aantal waarnemingen dat nodig is om een effect van een bepaalde omvang bij een gegeven power-niveau te detecteren.

Significantieniveau (alfa) = het maximale risico op het onterecht verwerpen van de nulhypothese (meestal 5% of 1%).

Verwachte effectgrootte = een gestandaardiseerde manier om de omvang van het verwachte effect uit te drukken, meestal gebaseerd op vergelijkbare onderzoeken of een pilotonderzoek.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

waar moet een onderzoeker rekening meehouden als hij data gaat verzamelen?

A
  • eerst berekenen hoe groot de steekproef moet zijn
  • als de NHST wordt gebruikt, dan wordt dit gedaan door powerberekeningen
  • ! hiervoor is een aanname nodig, nl. die vd daadwerkelijke populatiecorrelatie -> dus eerst goed nadenken over hoe sterk het verband is dat ze hopen te vinden
  • vervolgens besluiten hoe groot de gewenste kans op succes is
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

wat betekent het als een studie “underpowered” is?
wat is dan het extra gevaar?

A
  • in die studies is de kans klein om de nulhypothese te verwerpen bij een daadwerkelijk verband in de populatie (dus hoge type 2-fout)?
  • extra gevaar: naarmate de daadwerkelijke populatiecorrelatie groter is, is de power ve studie met een gegeven steekproefomvang hoger => want de correlatie die in de steekproef wordt gevonden, komt dan uit een populatie-steekproevenverdeling die steeds verder van de nulhypothese-steekproevenverdeling af ligt –> dit komt omdat steekproevenverdelingen bij kleine steekproeven heel breed zijn
  • ==> bij underpowered studies is de kans redelijk groot dat er in een steekproev een relatief sterk verband wordt gevonden, terwijl er in de populatie helemaal geen verband is
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

wat is multiple testing?

A
  • studies waarbij vaak meerdere verbanden tegelijk worden onderzocht, dan worden de variabelen die gemeten worden in een correlatiematrix gezet

-

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

wat drukt de p-waarden uit in de correlatiematrix?

A
  • elke p-waarde drukt de kans uit dat de bijhorende steekproefcorrelatie (of extremer) wordt gevonden ervan uitgaande dat die steekproefcorrelatie uit een steekproevenverdeling komt voor ee,n daadwerkelijke populatiecorrelatie r=0 en de gegeven steekproefomvang
17
Q

wat betekent een p-waarde binnen de NHST?

A
  • binnen de NHST wordt de p-waarde vergeleken met de gekozen alpha (vaak 5%) om te besluiten of het waarschijnlijk is dat de bijbehorende variabelen in de populatie samenhangen ==> voor elke p-waarde is de kans op een type 1-fout (vals positief, verwerpen nulhypothese en wel verband zonder dat er een verband is in de populatie) gelijk aan 5%
18
Q

hoe bereken je de kans op minstens één type 1-fout in een correlatiematrix?

A
  • kans dat er geen type 1-fout wordt gemaakt bij alpha van .05 = .95 tot de macht van het aantal p-waarden
  • de kans dat we dan minimaal één type 1-fout maken is dan 1 - (.95 tot de macht vh aantal p-waarden)

==> daarom de p-waarden uit de correlatiematrix corrigeren volgens de Bonferroni-correctie

19
Q

wat is het gevolg van de correctie van de p-waarden in een correlatiematrix volgens de Bonferroni-correctie?

A
  • het verkleinen van de p-waarde, verkleinen van de kans op een type 1-fout betekent dat de kans op het maken van een type 2-fout toeneemt

=> de correctie van de p-waarden heeft dus de power verlaagd, waardoor onze toets niet goed in staat is om populatiecorrelaties die afwijken van 0 te detecteren

==> de noodzaak om te corrigeren voor multiple testing resulteert in een lagere power -> dat moet gecompenseerd worde met grotere steekproeven om de kans op type 2-fouten acceptabel te houden

20
Q

noem twee methodes om te corrigeren voor multiple testing

A
  • Bonferroni methode
  • False Detection Rate control
21
Q

wat is een foutenmarge? en wat is het belang van een foutenmarge voor onderzoekers?

A
  • foutenmarge = de helft van het betrouwbaarheidsinterval, dat is de afstand van de puntschatting tot de rand van het interval
  • belang = onderzoekers willen een betrouwbaarheidsinterval met een gegeven maximale breedte verkrijgen rondom hun schatting van een correlatie

=> nadeel van brede intervallen is dat de populatiecorrelatie dan zowel een zwak verband, als een sterk verband zou kunnen zijn -> dus conclusies te trekken

22
Q

wat is de proportie verklaarde variantie?

A

de proportie verklaarde variantie = het kwadraat van de correlatiecoëfficiënt

23
Q

geef de 8 stappen weer die nodig zijn bij de analyse van een verband tussen variabelen

A
  1. teken het conceptuele of structurele model
  2. formuleer de onderzoeksvraag of hypothese
  3. bepaal de meetniveaus van de variabelen voor het verband
  4. voer univariate analyses uit voor elk van de twee variabelen
    -> bestudeer de histogrammen of staafdiagrammen
    -> bestudeer de beschrijvingsmaten en/of de frequentietabellen
    5. visualeer het verband met een plot
    6. bereken de puntschatting en het BI voor de effectmaat die dat verband representeert (bv Pearson’s r)
    7. bereken de** p-waarde**
    8. bepaal wat gezegd kan worden over dat verband op basis van de uitkomsten