Week 3 Flashcards
Wat zijn de 5 algemene stappen om significantie te testen?
- Aannames definiëren.
- Hypotheses opstellen
- Toetsingsgrootheid berekenen
- p-waarde berekenen
- Conclusie trekken
Wat is de toetsingsgrootheid bij gemiddeldes en proporties?
Bij gemiddelde is het de t-score en bij proporties is het de z-score
Wat is de type I en type II fout en wat is de kans hierop? Wat voor “false …” is dit
- Type I fout is de kans dat de nul hypothese waar is, maar je verwerpt hem. Deze kans staat gelijk aan ⍺.
Dit is false positive - Type II foutis de kans dat de nul hypothese wel waar is maar je verwerpt hem niet. De kans hierop is 1 - power/onderscheidend vermogen.
Dit is false negative
Welke 3 factoren horen bij een lage power/onderscheidingsvermogen?
- Een kleine steekproef
- Een klein werkelijk effect (kleine effect grootte)
- Grote spreding van observaties (s)
Wat zijn 4 mogelijke assumpties van toetsingsgrootheden?
- Type data: Kwalitatief of Kwantitatief.
- Randomisatie: Gaat uit van een steekproef die op aselecte manier verkregen is
- Populatie verdeling: Gaat uit van een bepaalde verdeling zoals een normaalverdeling
- Steekproefgrootte: Soms klopt een assumptie alleen vanaf een bepaalde steekproefgrootte.
Welk symbool geeft de standaardfout weer, en welke de geschatte standaardfout? En hoe bereken je de geschatte standaardfout (gemiddelde)?
- σȳ = echte standaardfout
- se is geschatte standaardfout
- se = s/√n
Hoe bereken je de t-score bij een nul hypothese (gemiddelde)?
t = ȳ - µ0 / se
Hoe bereken je de standaardfout en de z-score voor een enkele proportie bij nul hypothese?
- se0= √𝜋0(1-𝜋0) / n
- z= 𝜋ˆ-𝜋0 / se0
Wat is de formule van power? en de formule van de kans op een type II fout?
- Power = 1 - P(type II error)
- P(type II error) = 1 - Power
Hoe bereken je de z-score als je twee steekproefproporties vergelijkt op basis van de nul hypothese? En hoe bereken je de standaardfout?
z = 𝜋dˆ- 𝜋0 / se0
se0 = √𝜋0(1 - 𝜋0) /n1 + 𝜋0(1-𝜋0)/n2
Waar op moet je letten als je de z- of t-score p-waarde afleest in de tabel?
Dit is de p-waarde voor een eenzijdige toets dus je moet hem verdubbelen.
Waar staat β voor in de type twee fout.
β staat voor de kans op een type II fout.
Het staat gelijk aan 1 - power.
Waarom is statistische significantie niet altijd praktische significantie?
- Omdat je met nieuwe Big Data eigenlijk bij elk verschil een statistisch verschil hebt.
Hierdoor kan een verschil in de praktijk amper merkbaar zijn en toch significant.
Wat is p-hacking
Je doet meerdere toetsen in 1 studie en rapporteert alleen degene die significant zijn, terwijl de meeste niet significant zijn. Dan is de kans op toeval groot.
Waar staat de p-waarde voor?
De kans op een bepaalde waarde OF EXTREMER, gegeven dat de nul hypothese waar is.