Föreläsning 3 - ANOVA Flashcards
F-värdet
Det statistiska värdet för hur stora skillnaderna är mellan grupper. Jämför variationen inom grupperna med variationen mellan grupperna.
F = skillnaden mellan gruppernas medelvärden, delat på avvikelsevärdet (sum of squares).
F-värde över 3 är oftast signifikant.
Sum of Squares
Avståndet från det observerade värdet till medelvärdet (?)
Medelvärde som modell
Medelvärde är inte ett observerat värde utan en ”modell” som vi beräknar. Om alla värden hade legat på medelvärdet hade modellen varit ”perfekt”. Inte önskvärt dock eftersom det då blir meningslöst att ha en modell.
En bra modell är en modell där summan av observationernas avstånd till medelvärdet är litet.
Förklara principen bakom ANOVA
I en ANOVA delas observationer in i separata grupper. Ett medelvärde beräknas sedan för varje grupp. Blir summan av avstånden till linjen (medelvärdet) kortare när vi använder separata medelvärden för alla grupper än om vi använder det stora medelvärdet (det som beräknas utifrån alla observationer)?
Totalvarians
Då man utgår från ett enda medelvärde. Tittar på den kvadrerade summan av avstånden från alla observationer mot medelvärdeslinjen/baslinjen (stora medelvärdet). Systematisk varians + felvarians.
Systematisk varians
Skillnaden mellan gruppernas medelvärden. Kallas också förklarad varians.
Felvarians
Summan av de kvadrerade avstånden mellan observation och linje (då vi har delat upp medelvärdena efter grupperna).
Frihetsgrader
Anger hur många värden som har frihet att variera. När vi har lagt in alla värden förutom det sista, och vet slutsumman, har det sista värdet inte frihet att variera (för då blir det ju inte rätt slutsumma). Används bland annat i ANOVA.
Vilka slutsatser kan dras av en signifikant ANOVA?
- Antyder att det finns en skillnad mellan minst två av grupperna, dvs deltagarna i grupperna kommer från olika populationen
- Men får ingen information om mellan vilka grupper skillnaden finns. Det måste utforskas med kontraster (á priori eller post hoc).
3 steg för dataanalys (ANOVA)
- Illustrera data grafiskt
- Genomför ANOVA
- Eftertest (om signifikant ANOVA)
Kriterier för att ANOVA ska vara lämpligt
o Den beroende variabeln ska vara på minst intervallskala (kanske ordinalskala om det är hyfsat normalfördelat)
o Homogen varians (om mätt olika grupper får standardavvikelsen inte skilja sig för mycket i de olika grupperna)
o Normalfördelad data
o Datapunkterna ska vara oberoende (den ena gruppen ska inte påverka den andra etc)
Tre typer av eftertest (ANOVA)
- Kontrast
- Trend
- Simple effects
Kontrasttest
Ett sätt att testa nollhypotesen.
Á priori: ensidig prövning. Kan användas när du har en riktad hypotes. Ökar risken för att begå typ I-fel.
Post hoc:
o Parvisa jämförelser av medelvärden mellan olika grupper (typ som t-test).
o Signifikansnivån korrigeras för att komma runt problemet med multipla jämförelser.
o Problem: massignifikansproblemet. Om vi gör fler t-test ökar risken att vi hittar minst ett slumpmässigt signifikant resultat.
o Bonferroni’s t-test: välanvänt test. Lösning på massignifikansproblemet
Trendtest
Kan användas i stället för att jämföra medelvärden mellan grupper. Om grafen följer ett visst mönster/trend.