Variansanalys Flashcards
Vad säger standardavvikelse om medelvärde som modell för att beskriva data?
Standardavvikelse = ett mått på hur samlade observationerna är kring gruppens medelvärde
- Stor variation = stor osäkerhet kring medelvärdet som modell för att beskriva data
- Liten variation = stor säkerhet kring medelvärdet som modell för att beskriva data
- Ingen variation = vår modell är perfekt (och därmed oanvändbar)
Hur räknar man ut standardavvikelsen?
- Mät avståndet mellan observationen och medelvärdet och kvadrera subtraktionen
- Gör detta för samtliga observationer i gruppen
- Summera gruppens kvadrerade subtraktioner
- Dela på antalet individer i gruppen för att få ett kvadrerat genomsnitt
- Ta kvadratroten ur svaret på 4
Varians
Två innebörder
1. Variation i observationer
2. Specifikt mått på variation (standardavvikelse)
Vad indikerar en bra modell? (ANOVA)
När summan av observationernas avstånd till medelvärdet är litet (högt f-värde)
F-värdet
- Det statistiska värdet för hur stora skillnaderna mellan grupperna är
- Skillnaden mellan gruppernas medelvärdet, delat på avvikelsemåttet (sum of
squares) - Systematisk varians/felvarians
- F-värde över 3 är ofta signifikanta
Vad är principen för ANOVA?
En modell som gör summan av avstånden till linjen kortare än om vi använder medelvärdet för alla observationer
- Jämför om modellen där vi använder baslinjens medelvärde är bättre än modellen där vi använder gruppernas separata medelvärden
Vad är fördelen med att utgå ifrån gruppernas medelvärden istället för att använda det stora medelvärdet?
Avstånden från respektive grupps observationer till gruppens medelvärde blir oftast kortare jämfört med basmodellen samt att felvariansen ofta minskar (standardavvikelsen blir lägre)
Olika sorters varians
- Total varians
- Systematisk varians (explained variance)
- Felvarians (unexplained variance)
Total varians
När de totala medelvärdet används som baslinje
Systematisk varians
Skillnaden mellan gruppernas medelvärden
Felvarians
Summan av avstånden mellan observation och linje (vid användning av gruppernas separata medelvärden)
Hur jämförs de olika varianserna vid en ANOVA?
Systematisk varians och felvarians jämförs totalvarians och är systematisk och felvarians bättre så är det statistiskt signifikant (vill se om avstånden blir kortare eller inte när vi använder de olika medelvärderna)
Vilka slutsatser kan dras från en signifikant ANOVA?
- En signifikant ANOVA betyder att det finns en skillnad mellan minst två av grupperna, vilket betyder att deltagarna i grupperna kommer från olika populationer
- En ANOVA ger oss ingen information om mellan vilka grupper skillnaden finns. Detta måste utforskas med kontraster (a priori eller post hoc)
Vilka tre analyssteg bör man göra vid en ANOVA?
- Illustrera data grafiskt
- Genomföra ANOVA
- Eftertest (endast om ANOVA är statistiskt signifikant)
Vilka fyra punkter bör vara uppfyllda för att en ANOVA ska vara ett lämpligt analysverktyg?
- Den beroende variabeln skall vara på “minst” intervallskala (möjligtvis ordinalskala)
- Homogen varians
- Normalfördelad dara
- Datapunkterna skall vara oberoende