1: Eén groep, power & effectgrootte Flashcards
p-waarde
Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
Samenvatting van data: (2)
1) Parameter
* Numerieke samenvatting van de populatie
* Vaak onbekend
* Meet je eigenlijk nooit, gebruik je statistic voor
* PP- parameter, populatie
* Gemiddelde (μ) en standaard deviatie (σ)
2) Statistic (steekproefwaarde)
* Numerieke samenvatting van een steekproef uit de populatie
* SS-Statistic, steekproef
* Gemiddelde (x ̅) en standaard deviatie (s)
* Hoe groter de steekproef, hoe beter de voorspelling
* Grote variatie in populatie zorgt voor minder precieze voorspelling
–> Samenvattende waarde, zoals gemiddelde, modus of mediaan
Stappen:
Hypothesetoetsing 1 categorische variabele- z-toets voor 1 proportie
1) Assumpties checken
* De variabele is categorisch (bijv. wel of niet)
* De steekproef is willekeurig getrokken
* Normaal benaderd kan worden np ≥15 en n(1−p_0 )≥15 of tweezijdig
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:p=p_0
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:p>p_0 of H_A:p<p_0
□ Tweezijdig: H_A:p≠p_0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter z-score, hoe verder er vanaf dat H0 waar is
* Als H0 waar is, dan is z-score 0
* z= (p ̂−p_0)/〖se〗_0
* 〖se〗_0=√((p_0 (1−p_0))/n)
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij z-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
* Anders verwerp je de nulhypothese niet (niet accepteren!)
* Bij verwerpen: Gevonden resultaat verschilt statisch significant van de waarde van de nulhypothese
Stappen:
Hypothesetoetsing 1 kwantitatieve variabele- t-toets voor 1 gemiddelde
1) Assumpties checken
* De variabele is kwantitatief
* De steekproef is willekeurig getrokken
* De populatieverdeling is normaal
- Vooral belangrijk bij kleine steekproef en eenzijdig toetsen
- N>30, dan robuust
- Tweezijdig, dan robuust
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:μ=μ_0
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:μ>μ_0 of H_A:μ<μ_0
□ Tweezijdig: H_A:μ≠μ_0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter t-score, hoe verder er vanaf dat H0 waar is
* t=(x ̅ −μ_0)/〖se〗_x ̅
* 〖se〗_x ̅ = (s )/√n
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij t-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
* Df=N-1
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Power
Kans op correct weerleggen van nulhypothese. Kans = 1−β
Type 1 en 2 fout
Type 1 fout
(Vals positief)
Kans = α
wel verwerpen, H0 wel waar
Type 2 fout
(Vals negatief)
Kans = β
niet verwerpen, H0 niet waar
Stappenplan Power uitrekenen (bij proportie) (7)
1) Bepaal kritieke z-waarde die hoort bij significantieniveau (α) (H0)
- p> rechteroverschrijdingskans van alfa (1- α)
- p< linker overschrijdingskans van alfa
- p ̂ moet minimaal z-score se0 boven/onder P0 liggen
2) Standaardfout berekenen (H0)
- SE=√((p_0 (1−p_0))/n)
3) Welke steekproefproportie (p ̂) hoort bij de kritieke z-waarde? Wanneer wordt p ̂ dus verworpen (H0)
- 〖p ̂=p〗_0+z−score ∗SE
4) Hoeveel standaardfouten p ̂ af van de werkelijke p? p wordt gegeven. (HA)
- Hoe groter p afligt van p0, hoe groter de power
- SE=√((p(1−p))/n)
5) Welke z-waarde hoort bij hoort bij de steekproefproportie (HA)
- z=(p ̂−p)/se
- P>P0= linkeroverschrijdingskans
- P<P0= rechteroverschrijdingskans
6) Kans op type 2 fout (β): (HA)
- P-waarde opzoeken bij z-score
7) Power= 1-Type 2 fout (β) (HA)
- Kans om een effect te vinden in de toets
- Al tevreden bij 0.80
Onderscheidingsvermogen
- Kans dat de nulhypothese terecht wordt verworpen. Zelfde als power
- Bij klein onderscheidingsvermogen, zal een toets niet snel tot significante uitkomsten leiden, ook al is de nulhypothese onjuist
- Kans = 1−β
- De kans om nulhypothese te verwerpen wanneer deze daadwerkelijk onwaar is
- De kans om een ´significant´ resultaat te vinden wanneer in populatie effect bestaat
Soorten hypothesen (2)
- Nulhypothese (H0)
- Geeft 1 specifieke waarde voor parameter aan (proportie of gemiddelde) (=)
- Representeert meestal de situatie als er geen effect/verschil is
- Op basis van steekproefgegevens beslissen of deze moet worden verworpen
§ Wanneer overschreidingskans van gebruikte statistische toetsingsgrootheid kleiner is dan gekozen significantieniveau (alfa) - Nooit kunnen zeggen dat deze waar is, tenzij je gehele populatie meet
- Alternatieve hypothese (HA of H1)
- Geeft range van alternatieve waarden voor parameter aan (proportie of gemiddelde) (<, >, ≠)
- Representeert meestal de situatie als er wel effect/verschil is
Effectgroottes
W (Chi-kwadraat)
F (variantie-analyse)
Rxy (correlatie)
D (Cohen’s d)
W
□ Klein effect: 0.1
□ Middelmatig effect: 0.23
□ Groot effect: 0.5
F
□ Klein effect: 0.1
□ Middelmatig effect: 0.25
□ Groot effect: 0.4
Rxy
□ Klein effect: 0.1
□ Middelmatig effect: 0.3
□ Groot effect: 0.5
D (difference) (arbitrair)
□ Klein effect: 0.2
□ Middelmatig effect: 0.5
□ Groot effect: 0.8
Onderscheidingsvermogen wordt beïnvloed door (5)
1) Steekproefgrootte
- Hoe groter steekproef, hoe kleiner standaardfout, hoe kleiner kans type 2 fout, dus kleiner onderscheidingsvermogen
- Groot effect in kleine sample kan door toeval zijn ontstaan
- Elk klein verschil kan statisch significant worden door grote steekproeven
2) Standaarddeviatie verkleinen
- Bijvoorbeeld gebruik betrouwbaardere instrumenten
3) Significantieniveau
- Grotere alfa gemakkelijker om significant resultaat vinden
- Grotere alfa, groter significantieniveau
4) Effectgrootte
- Hoe groter effect, hoe gemakkelijker effect te vinden, dus groter onderscheidingsvermogen
- Cohen’s d
- Correlatie
- Variantieanalyse (F)
- Chi-kwadraat (W)
5) Aard van toets
- Eenzijdig toetsen groter onderscheidingsvermogen dan tweezijdig
- Non-parametisch toetsen
§ Moeilijk om onderscheidingsvermogen te berekenen
§ Niet uitgaan van normaalverdeling
§ Afhankelijk van onbekende verdeling
§ Kleiner onderscheidingsvermogen dan parametrische toets
Standaardfout
- Afkorting: se (Standarderror)
- Geschatte standaarddeviatie van een steekproevenverdeling
- Afhankelijk van steekproefgrootte
- Proportie: se=√(p ̂ (1−p ̂)/n)
- Gemiddelde: se=s/√n
s= standaarddeviatie steekproef
Betrouwbaarheidsinterval voor categorische variabelen (Steekproevenverdeling van proportie/kansverdeling)
1) 90% betrouwbaarheidsinterval
○ p ̂±1.645(se)
○ Error probability (α) 0.10
2) 95% betrouwbaarheidssinterval
○ Proporties: p ̂±1.96(se)
§ np ̂≥15 & n(1−p ̂ )≥15
§ Minstens 15 ‘failures’ en 15 successen
○ Voor populatiegemiddelde (μ): § x ̅± t_0.025 (se)
3) 99% betrouwbaarheidsinterval
○ p ̂±2.58(se)
○ Error probability (α) 0.10
4) 100% betrouwbaarheidsinterval
* Betrouwbaarheidsinterval moet alle mogelijke waarden bevatten voor de parameter
* Breedst van allemaal; bevat meeste waarden
5) Betrouwbaarheidsinterval voor een proportie
* Foutenmarge: za/2 * SE
* p ̂±z−waarde∗se →se=(√(p ̂ (1−p ̂)/n))
* z−waarde=((α=100−confinceinterval))/2→opzoeken in tabel
De margin of error voor een betrouwbaarheidsinterval neemt toe/af: (2)
- Neemt toe naarmate het betrouwbaarheidsniveau toeneemt.
- Neemt af naarmate de steekproefomvang toeneemt
Vereiste steekproefgrootte bepalen (4)
1) Gewenste foutmarge kiezen
- Hoe dicht steekproefproportie bij populatieproportie
- Hoe dichterbij, hoe kleiner foutenmarge nodig
- Hoe kleiner foutenmarge, hoe groter n
2) Betrouwbaarheidsniveau kiezen
- Vaak 95%
- Hoe groter gewenste betrouwbaarheidsniveau, hoe groter n
3) Afhankelijk van budget
4) Formule:
a. Bij proporties: (categorisch)
- m= foutenmarge
- z= z-score (passend bij betrouwbaarheidsniveau)
- p= Schatting uit eerder onderzoek, anders 0.50
□ Hoe dichter bij 0.50, hoe groter n
- Antwoord altijd naar boven afronden!
- n=(p ̂−(1−p ̂ ) z^2)/m^2
b. Bij gemiddelde (kwantitatieve variabele) - m= foutenmarge - z= z-score (passend bij betrouwbaarheidsniveau) - σ= Schatting uit eerder onderzoek, anders: range/6 □ Hoe meer spreiding, hoe groter σ, hoe groter n - Antwoord altijd naar boven afronden! - n=(σ^2 z^2)/m^2