Variantieanalyse - week 1 Flashcards
Variantieanalyse
= verschillenanalyse met de variantie als maat voor spreiding rondom gemiddelden in groepen
notatie
populatie: : µ, σ en σ2 (mu en sigma)
steekproef: x ̅, S en S2 (x-gemiddeld, standaardafwijking S)
Yi - Y streep
= individuele waarneming voor individu i - het overall gemiddelde
N
= steekproefgrootte
Doel variantieanalyse
= uitspraak doen over de vraag of de gemiddelden van een zekere variabele Y in meer dan 2 populaties gelijk zouden kunnen zijn
wanneer kun en mag je een variantieanalyse toepassen?
- afhankelijk van de onderzoeksvraag
- > 2 groepen vergelijken (bij 2 groepen vergelijken, t-toets)
- Y is een kwantitatieve variabele (je moet het kunnen vervangen voor een getal)
- De factor (variabele op basis waarvan we groepen indelen) is een kwantitatieve variabele (nominaal meetniveau) bijv.. medicijn A,B,C
Waarom geen t-toetsen uitvoeren en paarsgewijs gemiddelden vergelijken?
= de kans op het vinden van een statistisch significant verschil stijgt met het aantal onderlinge vergelijkingen
Stel je wilt 15 steekproeven onderling vergelijken, dan moet je 105 t-toetsen uitvoeren, elke keer met 5% kans om H0 ten onrechte te verwerpen
Dat betekent naar verwachting 0.05x105 = 5 foute conclussies
3 voorwaarden voor variantieanalyse
- populaties zijn normaal verdeeld
- steekproeven hebben gelijk aantal waarnemingen
- populaties hebben gelijke variantie
Toets voor gelijkheid varianties (voorwaarde 3)
Hmax toets
A en M
a = aantal groepen
m = aantal waarnemingen binnen groepen
Stappenplan
- hypothesen opstellen
- toetsingsgrootheid en verdeling
- kritieke grens
- conclusie
Wanneer H0 verwerpen en behouden?
- gevonden waarde < kritieke grens? H0 behouden
- gevonden waarde > kritieke grens? H0 verwerpen
KS(tussen)
= gemiddelde van de groep - overall gemiddelde (LETOP: vermenigvuldig met het aantal in de steekproef)
KS(binnen)
= individuele waarneming - groepsmiddelde (voor elk individu voor elke behandeling)
KS(binnen) onbekend?
GKS binnen berekenen
= (S1 + S2 + S3)/ aantal varianties
–>
KS(binnen)= GKS(binnen)xd.f.
Waarom zijn onderstaande nulhypothesen incorrect
H0: x ̅_1=x ̅_2=x ̅_3
H0: µ1 = µ2 = µ3 = 0
- betreft steekproefgemiddelde, we willen juist iets zeggen over de populatie
- gemiddelden moeten (on)gelijk aan elkaar zijn, niet aan 0
Relatie tussen spreiding binnen groepen
veel versus weinig spreiding
Als er … spreiding is binnen groepen, is de F-waarde relatief … De p-waarde is relatief … De kans op het vinden van statistisch significante verschillen is dan relatief ….
Als er veel spreiding is binnen groepen, is de F-waarde relatief klein. De p-waarde is relatief groot. Als er meer spreiding is binnen groepen, dan is de kans op het vinden van significante verschillen tussen groepen relatief klein
Als er weinig spreiding is binnen groepen, is de F-waarde relatief groot. De p-waarde is relatief klein. De kans op het vinden van statistisch significante verschillen is dan relatief groot.
DUS: hoe meer waarnemingen, hoe groter de kans op significante verschillen tussen de groepen
Verschillen tussen groepen
ANOVA geeft alleen aan dat er verschillen bestaan, maar geeft geen richting
Methode onderlinge vergelijking steekproeven: Tukey’s H(onestly) S(ignficant) D(ifferences)-toets
Interactieeffect
= simultaan effect factor 1 en 2, combinatie effect
geen interactie? hoofdeffecten beschrijven accuraat wat er speelt in data
wel interactie? hoofdeffecten kunnen maskeren wat er daadwerkelijk speelt