11/12: Variantieanalyse Flashcards
Stappen:
Hypothesetoetsing meer dan 2 onafhankelijke, kwantitatieve variabelen- One-way ANOVA
1) Assumpties checken
- Kwantitatieve variabelen
- Meer dan 2 onafhankelijke steekproeven (randomisatie/experiment)
- In alle groepen (g) normaal verdeeld
§ Homoscedasticity
§ Y is normaal verdeeld met zelfde σ
§ Robuust bij N>20
§ Redelijk robuust, behalve bij grote scheefheid
- Gelijke varianties
§ ANOVA robuust
§ Behalve bij ongelijke N, als grootste sd 2x zo groot is als kleinste sd
2) Hypothesen opstellen
Nulhypothese (H0)
* H_0:μ_1=μ_2=μ_3
□ Between variantie= within variantie
□ F=1
□ H_0:μ_1−μ_3=0 en μ_2−μ_3=0
Alternatieve hypothese (HA of H1)
□ H_A:Tenminste 2 populatiegemiddelden zijn ongelijk
□ Between variantie > Within variantie
□ F>1
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* F= (MSbetween variantie (group))/(MSwithin variantie (error))
* SStot=SSwithin+SSbetween
4) P-waarde opzoeken
* Als within variantie kleiner is dan between variantie, heb je meer bewijs tegen H0
* Grotere F is meer bewijs tegen H0
* DF
* Df 1(teller/group)= g-1
* Df 2(noemer/error)= N-g
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
ANOVA
- Analysis Of Variance (variantie analyse)
- Gebruiken bij experimenten
- 3 groepen
- Factor= Onafhankelijke variabele
- Uitspraak over verschillen tussen gemiddelden
- Via varianties binnen en tussen groepen
- Bij grote verschillen tussen groepen is het gemakkelijker
- Waarom niet 3 keer t-toets aanvullen
- Hoe meer groepen, hoe groter de kans op type 1 fout
- g= aantal groepen
- Vergelijkbaar met enkelvoudige regressie
Betrouwbaarheidsinterval verschil in gemiddelden variantie-analyse (Fisher’s methode)
- y ̅i−y ̅j±t_(a/2(df=n−g))∗s√(1/ni +1/nj )
- Df=n-g
- S=√MSwithin
- Wanneer betrouwbaarheidsinterval 0 bevat, dan populatiegemiddelden verschillend
- y ̅_i−y ̅_j
- Kan je groepen mee vergelijken
- Gemiddelde van de groepen die je wilt vergelijken
- Grote kans op type 1 fout
Multiple comparison methodes
- Vergelijken paren van gemiddeldes met betrouwbaarheidsniveau dat gelijktijdig van toepassing is op gehele set van vergelijkingen i.p.v. afzonderlijke vergelijking
- Turkey’s HSD method
- Ontworpen om algemeen betrouwbaarheidsniveau te geven dat zeer dicht bij gewenste waarde ligt (.95)
- Controleert op type 1 fouten
- HSD: Honestly Significant Difference test
- Bredere betrouwbaarheidsintervallen
- Geen zin als je geen effect vindt in je onderzoek!
ANOVA en regressie
- Nulhypothesen ANOVA en regressie met dummy variabelen zijn identiek. F-toets ook
- Regressie met dummievariabelen x1 en x2
- μ_y=α+β_1 x_1+β_2 x_2
- α=μ_3 (controlegroep)
- β1=μ1−μ3
- β2=μ2−μ3
- H0=β1=β2=0
Stappen
Hypothesetoetsing meer dan 2 onafhankelijke, kwantitatieve variabelen - Two-way ANOVA
1) Assumpties checken
- Kwantitatieve variabelen
- Meer dan 2 onafhankelijke steekproeven (randomisatie/experiment)
- In alle cellen (a*b) normaal verdeeld
§ Homoscedasticity
§ Y is normaal verdeeld met zelfde σ
§ Robuust bij N>20
§ Redelijk robuust, behalve bij grote scheefheid
- Gelijke varianties
§ ANOVA robuust
§ Behalve bij ongelijke N, als grootste sd 2x zo groot is als kleinste sd
2) Hypothesen opstellen
Nulhypothese (H0)
□ Factor A: H0:μ(.1)=μ(.2)
□ Factor B: H0:μ(1.)=μ(2.)
□ Interactie: H0:μ11−μ12=μ21−μ22
Alternatieve hypothese (HA of H1)
□ Factor A: Ha:μ(.1)≠μ(.2)
□ Factor B: Ha:μ(1.)≠μ(2.)
□ Interactie: Ha:μ11−μ12≠μ21−μ22
3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* F: MSfactor/MSerror
4) P-waarde opzoeken
* Als within variantie kleiner is dan between variantie, heb je meer bewijs tegen H0
* Grotere F is meer bewijs tegen H0
* DF Hoofdeffect A
* Df 1=a-1 (a=aantal niveaus van A)
* Df 2 (dfA, dferror)=n-ab
* DF Hoofdeffect B
* Df 1=b-1 (b=aantal niveaus van B)
* Df 2 (dfB, dferror)=n-ab
* DF interactie AxB
* Df 1=(a-1)(b-1)
* Df 2 (dfAB, dferror)=n-ab
5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
Factoren
Onafhankelijke variabelen
Sswithin
Residual, Mswithin= s2
Two-way anova:
- Meer dan 2 groepen
- Kwantitatief
- Kan je combineren met regressie (meervoudige regressie)
- Extra nominale variabelen in vergelijking tot one-way anova
- Waarom two-way:
- Betere verklaring scores afhankelijke variabelen
- Meer power:
§ Verminderen van residuele variantie
§ De within variantie wordt kleiner - Wisselwerking tussen 2 factoren te onderzoeken
- Twee nominale predictoren
- Meer verklaren
§ Beide nominale predictoren hebben direct effect op y
§ Ruis wegfilteren - Moderator (anders verklaren)
§ Zorgt voor een sterker of zwakker resultaat
§ Een van de nominale predictoren beïnvloedt de relatie van de ander
- Meer verklaren
Factorial designs:
- Meerdere onderzoeksgroepen, minimaal 4
- Onderzoeksgroepen zijn gesplitst aan de hand van een kenmerk (bijvoorbeeld gender)
- Meerdere onafhankelijke variabelen (factoren) gelijktijdig onderzoeken
- Eén afhankelijke variabele
- Geen effect: Iedereen scoort hetzelfde. Overal hetzelfde getal
- Hoofd effect: De effecten van het factor apart, gemiddeld over niveaus van de andere factor
- Interaction effect: De gecombineerde effecten van de factoren, hangt van andere factoren af
- Two way interaction effect: Combineren van 2 factoren (zoals hieronder)
- Three way interaction: Combineren van 3 factoren
- Meerdere factoren kan ook –> hogere orde effecten –> ingewikkelder
- Moderator variable: Een onafhankelijke variabele (factor) dat effect heeft op de correlatie tussen een andere onafhankelijke variabele (factor) en afhankelijke variabele
- Simple effect: Het effect van een factor kijkend naar slechts één niveau van een andere factor
- Uit onderzoek kan je afleiden wat de dosis doet met migraine, wie er meer last heeft van migraine en het verschil tussen man en vrouw bij de dosis
Factorial design- two way anova
1 hoofdeffect, geen interactie
- Hoofdeffect bij setting (gemiddelde verschilt)
- Lijn horizontaal bij uur (geen hoofdeffect)
- Lijnen lopen parallel (geen interactie)
- Geen verschillen in verschillen (allebei 0 & -2) –> geen interactie
Factorial design- two way anova
2 hoofdeffecten, geen interactie
- Gemiddelde nergens hetzelfde
- Lijnen lineair (beide hoofdeffect)
- Lijnen lopen parallel (geen interactie)
- Geen verschillen in verschillen (allebei 2 & 4) –> geen interactie
Factorial design- two way anova
Interactie-effect, zonder hoofdeffect
- Verschillen tussen groepen
- Gemiddelde hetzelfde –> geen hoofdeffect (Lijn horizontaal)
- Lijnen lopen niet parallel (interactie)
- Wel verschillen in verschillen (4&-4) –> interactie
Factorial design- two way anova
Interactie-effect en hoofdeffect
- Verschil in gemiddelde (hoofdeffect)
- Verschil tussen groepen
- Lijnen lopen niet parallel (interactie)
- Wel verschillen in verschillen (-4&0, 0&4) –> interactie
Regressie:
- Vergelijkbaar meervoudige regressie
- Alleen hoofdeffecten, geen interactie
- Is wel mogelijk
- Dummies maken met 0 en 1
- Vergelijking opstellen
- Omzetten in cellen
SPSS: Niet alles van nodig