13: Non-parametische toetsen Flashcards
Niet-parametrische statistische methoden: (distribution free method)
Gebruiken bij (2), vooral nuttig als (4)
- Inferentiële methoden die geen specifieke vorm van distributie voor de populatieverdeling veronderstellen (zoals een normaalverdeling)
- Verschil parametisch toetsen (gemiddelden)
- Alleen volgorde telt, niet afstanden op schaal
- Aanname over exacte vorm populatieverdeling onnodig
§ Dus minder assumpties
§ Meer robuust tegen schendingen
- Gebruiken bij:
- Ordinale afhankelijke variabele
- Interval afhankelijke variabele met kleine N + scheef + eenzijdige toets en/of outliers
- Vooral nuttig als:
1) Wanneer verdeling onbekend is of geen normaal verdeling is (gewone statistische methode is niet robuust schendingen normaliteitsaanname)
2) Kleine steekproef
3) Geen parametrische toets beschikbaar is
4) Verkeerd meetniveau
- Wanneer gegevens een rang zijn voor onderwerpen in plaats van kwantitatieve metingen - Vergelijken van twee groepen door ranking
- Hele steekproef rangordenen, ongeacht groep
- Verschil gemiddelde (of som van) rangnummers tussen groepen
- Bij gelijk cijfer
- Gemiddelde rangnummer, bijvoorbeeld plek 3 en 4 krijgen dus beide 3.5
- Som van rangen moeten altijd hetzelfde zijn
- Rank sum: Som vaan de rangen
- Mean ranks: Rank sum/aantal waarnemingen
- Altijd aangeven of het kleinste of grootste groep is!
groep)
- We vatten de uitkomst van het experiment samen door de gemiddelde rang voor elke groep te vinden en hun verschil te nemen
Nadelen non-parametisch testen (3)
- Minder Power
- Meer data of groter effect nodig om nulhypothese te verwerpen
- Dus als assumpties voldoen altijd parametrische methode kiezen
Mogelijkheden Wilcoxen test: (3)
1) Hypothesetoetsen
2) Betrouwbaarheidsinterval
* Kijken naar mediaan
* Alle mogelijke combinaties langs en verschil berekenen
* Mediaan nemen van de verschillen
* Als nul erin zit niet verwerpen
3) Vergelijken aan de hand van lijnen
* Punten op volgorde zetten van de waarnemingen en verbinden met lijnen
* 4/6 lijnen zijn is rood meer dan blauw
* P: 4/6=0,6667 dat rood een hoger cijfer geeft dan blauw
Stappen:
Hypothesetoetsing 2 onafhankelijke variabelen - Wilcoxon toest/ Mann-Whitney toets
1) Assumpties checken
- Onafhankelijke steekproeven van de twee groepen
- Afhankelijk variabele is minimaal ordinaal (dus kwantitatief kan ook)
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:Identieke populatieverdeling voor de 2 groepen
□ Impliceert gelijke mean ranks
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A: Grotere mean rank voor een bepaalde groep
□ Tweezijdig: H_A:Ongelijke mean ranks
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Verschil tussen steekproefgemiddelde ranks voor de twee groepen
Stappen manier 1
1) Schrijf voor 1 alle mogelijke rangen uit (steekproevenverdeling) en de kans hierop
2) Bereken bij de som en bijbehorende kansen
* Maakt niet uit welke groep je kiest
Stappen manier 2:
1) Schrijf alle mogelijke rangen uit
2) Bereken het gemiddelde rang verschil en de kans hierop (mean rank klein- mean rank groot)
3) Bereken bij elk verschil de bijbehorende kans
4) Verschil in ranks steekproef: Mean rank klein- Mean rank groot
Stappen bij grote steekproef
- R1= som rangnummers kleinste steekproef
- Binominaal verdeling
4) P-waarde opzoeken
* Vergelijken van ranksum met kanstabel. Kans op … en hoger/lager
* Altijd zelfde kans, als je maar rekening houdt met hypothese
* Bij tweezijdig kans x2
* Bij grote steekproef
- Opzoeken in Z-tabel
- Eenzijdig kleinste steekproef lager, geïnteresseerd in rechterkant, dus 1-P
- Eenzijdig kleinste steekproef hoger, geïnteresseerd in linkerkant, dus P
- Tweezijdig is 2xP
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Kruskal-Wallis test:
- Vergelijkbaar met ANOVA-test, alleen minder assumpties
- Hoeft niet normaal verdeeld te zijn
- Kan ook gebruikt worden bij ordinale variabelen
- Uitbreiding Wilcoxon
- Vergelijken ranks sum (mean ranks) van g (meer dan 2) onafhankelijke groepen
Stappen:
Hypothesetoetsing meerdere onafhankelijke ordinale variabelen - Kruskal-Wallis test
1) Assumpties checken
- Onafhankelijke steekproeven van de groepen
- Afhankelijk variabele is minimaal ordinaal
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:Identieke populatieverdeling voor de g groepen
Alternatieve hypothese (HA of H1)
□ Tweezijdig: H_A:Geen identieke populatieverdeling voor de g groepen
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* X^2=(12/n(n+1) )∑24_(j=1)^g▒〖n_j (r ̅_j−r ̅ )^2 〗
* r ̅_j = Sample mean rank voor groep j
* r ̅ = Sample mean rank voor de combinatie van de groepen
4) P-waarde opzoeken
* Passend bij X^2-waarde in tabel
* Altijd rechtseenzijdige toets, en je kijkt automatisch tweezijdig
* Df=g-1
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Stappen:
Hypothesetoetsing twee afhankelijke ordinale variabelen - Tekentoets
1) Assumpties checken
- Onafhankelijke steekproef van gepaarde waarnemingen, waarbij 2 variabelen zinvol vergeleken kunnen worden
- Np en n(1-p)≥15
○ Anders binominale verdeling
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0: p=.50
Alternatieve hypothese (HA of H1)
□ Tweezijdig: H_A: p ≠0.50
□ Rechtszijdig: H_A: p > 0.50
□ Linkszijdig: H_A: p <0.50
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* z=(p ̂−.50)/se
* se= √(.25/N)
* Binominale verdeling
4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij z-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Wilcoxon’s rangtekentoets
- Helpt bij bepalen welke variabele meer geprefereerd wordt en hoeveel meer
- Hoeveel meer deed tekentoets niet
- Twee gepaarde waarnemingen
- Waarnemingen met gelijke scores worden weggelaten
Stappen:
Hypothesetoetsing twee afhankelijke ordinale variabelen - Wilcoxon’s rangrekentoets
1) Assumpties checken
- Onafhankelijke steekproef van gepaarde waarnemingen, waarbij 2 variabelen zinvol vergeleken kunnen worden
- Verschillen symmetrisch verdeeld zijn, en gerangordend kunnen worden
- (N>15, exact als dit niet zo is)
2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0: Mediaan van de verschilscores in de populatie is 0
Alternatieve hypothese (HA of H1)
□ Tweezijdig: H_A: Mediaan van de verschilscores in de populatie is ongelijk 0
□ Rechtszijdig: H_A: Mediaan is groter dan 0
□ Linkszijdig: H_A: Mediaan is kleiner dan 0
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* W_+=∑r_(d_i )
* r_(d_i )= Rangscore van positieve verschilscore i
* Negatieve getallen worden niet meegenomen
4) P-waarde opzoeken
* Tabel niet in deze cursus
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Voor gepaarde waarnemingen: (4)
1) Wilcoxon’s rangtekentoets
- Meerdere afhankelijke ordinale variabelen met afhankelijke steekproef
- Vergelijkbaar met t-test, alleen kijken naar mediaan i.p.v. gemiddelde
- Voordelen:
* Hoge power
* Robuust tegen outliers
* Hoe groot verschil in rangen
- Nadelen
* Assumptie symmetrische verdeling
2) Tekentoets
- Voordelen:
* Ordinaal en kwantitatieve waarnemingen
* Elke verdeling is mogelijk
* Voor kleine steekproeven
* Veel power voor kleine steekproeven
* Weinig assumpties
- Nadelen
* Lage power grote steekproeven
* Alleen verschil, maar niet hoe groot het verschil is
3) T-toets voor gepaarde waarnemingen
- Twee afhankelijke kwantitatieve variabelen
- Nadelen:
* Meer assumpties
4) McNemar´s test
- Twee afhankelijke nominale variabelen
–>
- Qua informatie: (3) beter dan (1) beter dan (2)
- Qua assumpties: (2) beter dan (1) beter dan (3)