H12 Flashcards
Inferentiële statistiek
Op basis van steekproeven uitspraken doen over de populatie
Significantieniveau
Getal zodanig dat we H0 verwerpen als de P-waarde kleiner is dan of gelijk is aan dat getal (vaak 0,05)
Inferentiële statistiek (2)
1) Betrouwbaarheidsintervallen
- Geven range van waarschijnlijke waarden voor een parameter
2) Hypothesetoetsing
- Leidt tot een beslissing
- De parameter is wel/niet significant groter dan 0.50
- Tweezijdig hypothesetoetsing voor het gemiddelde gerelateerd aan betrouwbaarheidsinterval voor gemiddelde
* Kijken of μ_0 in interval ligt. Als dat niet zo is, dan verwerpen
* Significantieniveau 0.05 komt overeen met betrouwbaarheidsniveau 95%
* Significantieniveau van 0.01 komt overeen met betrouwbaarheidsniveau 99%
Hypothesetoetsing bij proporties (5)
1) Assumpties checken
* Voldoen we aan de voorwaarden?
* De variabele is categorisch (bijv. wel of niet)
* De steekproef is willekeurig getrokken
* De steekproef is groot genoeg dat de steekproevenverdeling van de steekproefproportie (onder Ho) normaal benaderd kan worden np ≥15 en n(1−p_0 )≥15
- Bij 2-zijdig toetsen is robuust, dus maakt de formule niet uit
2) Hypothesen opstellen
* Wat verwacht je als er wel iets gebeurt en wat als er niet iets gebeurt
* Twee hypothesen bij hypothesetoets
- Nulhypothese (H0)
□ Geeft 1 specifieke waarde voor parameter aan (proportie) (=)
□ H_0:p=p_0
□ Representeert meestal de situatie als er geen effect/verschil is
- Alternatieve hypothese (HA of H1)
□ Geeft range van alternatieve waarden voor parameter aan (proportie of gemiddelde) (<, >, ≠)
□ Representeert meestal de situatie als er wel effect/verschil is
□ Niet gebaseerd op data, maar gerelateerd aan populatie parameters
* Hypothese één- of tweezijdig
- Eenzijdig
□ Wanneer je eenzijdig toetst, ga je uit van een bestaand verschil, bijvoorbeeld dat Nederlandse mannen gemiddeld langer dan 181 cm zijn.
□ Omdat je uitgaat van een positief verschil toets je rechtszijdig. Je verwerpt de nulhypothese als de steekproefuitkomst extreem hoog is.
□ Als je wil testen of Nederlandse mannen gemiddeld korter dan 181cm zijn, toets je linkszijdig.
□ One sided: H_A:p>p_0 of H_A:p<p_0
- Tweezijdig
□ Toets je tweezijdig, dan verwerp je de nulhypothese als de steekproefuitkomst erg hoog of erg laag is.
□ Het verwerpingsgebied bestaat dan uit twee delen en is dus twee keer zo hoog als wanneer je eenzijdig toetst
□ Wordt meest gedaan; rekening gehouden met beide opties
□ Minder snel nulhypothese kunnen verwerpen
□ Bij afwijking/verschil van nulhypothese
□ Two sided: H_A:p≠p_0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Beschrijft hoe ver de steekproefproportie P ̂ valt van de verwachte waarde als H0 waar zou zijn
* Hoeveel standaardfout boven/onder de waarde van nulhypothese ligt
* Hoe groter z-score, hoe verder er vanaf dat H0 waar is
* Als H0 waar is, dan is z-score 0
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij z-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïnteresseerd in beide kanten dus 2p (p-waarde verdubbelen)
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
* Anders verwerp je de nulhypothese niet (niet accepteren!)
* Bij verwerpen: Gevonden resultaat verschilt statisch significant van de waarde van de nulhypothese
Hypothesetoetsing bij gemiddelden (5)
1) Assumpties checken
* Voldoen we aan de voorwaarden?
* De variabele is kwantitatief
* De steekproef is willekeurig getrokken
* De populatieverdeling is normaal
- Vooral belangrijk bij kleine steekproef en eenzijdig toetsen
- N>30, dan robuust
- Tweezijdig toetsen, dan robuust
2) Hypothesen opstellen
* Wat verwacht je als er wel iets gebeurt en wat als er niet iets gebeurt
* Twee hypothesen bij hypothesetoets
- Nulhypothese (H0)
□ Geeft 1 specifieke waarde voor parameter aan (gemiddelde) (=)
□ H_0:μ=μ_0
□ Representeert meestal de situatie als er geen effect/verschil is
- Alternatieve hypothese (HA of H1)
□ Geeft range van alternatieve waarden voor parameter aan (proportie of gemiddelde) (<, >, ≠)
□ Representeert meestal de situatie als er wel effect/verschil is
* Hypothese één- of tweezijdig
- Eenzijdig
□ Wanneer je eenzijdig toetst, ga je uit van een bestaand verschil, bijvoorbeeld dat Nederlandse mannen gemiddeld langer dan 181 cm zijn.
□ Omdat je uitgaat van een positief verschil toets je rechtszijdig. Je verwerpt de nulhypothese als de steekproefuitkomst extreem hoog is.
□ Als je wil testen of Nederlandse mannen gemiddeld korter dan 181cm zijn, toets je linkszijdig.
□ One sided: H_A:μ>μ_0 of H_A:μ<μ_0
- Tweezijdig
□ Toets je tweezijdig, dan verwerp je de nulhypothese als de steekproefuitkomst erg hoog of erg laag is.
□ Het verwerpingsgebied bestaat dan uit twee delen en is dus twee keer zo hoog als wanneer je eenzijdig toetst.
□ Two sided: H_A:μ≠μ_0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Aantal standaardfouten tussen steekproefgemiddelde (x ̅)en verwachte gemiddelde onder nulhypothese (μ_0)
* Hoe groter t-score, hoe verder er vanaf dat H0 waar is
* Als H0 waar is, dan is t-score 0
4) P-waarde opzoeken
* P-waarde: De kans op gevonden toetsingsgrootheid of een extremere waarde, onder de nulhypothese
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Passend bij t-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Df=N-1=50. In tabel tussen P=0.005 en
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
P-waarde hypothesetoetsing
De kans op gevonden toetsingsgrootheid of een extremere waarde, onder de nulhypothese