ANOVA Flashcards

1
Q

När används envägs variansanalys?

A

ANOVA är en statistisk metod som används för att ta reda på om stickprovsmedelvärden skiljer signifikant från från varandra. Vid envägs variansanalys studeras effekterna av en oberoende variabel på en beroende variabel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad säger noll- respektive alternativhypotesen vid envägs variansanalys?

A

H0: μ1 = μ2 = μ3 (det finns ingen skillnad)
H1: μ1 ≠ μ2 ≠ μ3 (det finns en skillnad)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad anger den s.k. F-kvoten?

A

F-kvoten räknas ut genom att man dividerar Mean square between med Mean sqaure within.

Om F-kvoten är större än den kritiska gränsen så kan vi förkasta nollhypotesen. Den kritiska gränsen är beroende av den alfanivå och frihetsgrader som vi använt oss av.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Om nollhypotesen stämmer vid envägs variansanalys, vad förväntas F-kvoten bli?

A

1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hur ser förhållandet mellan F-kvoten och sannolikheten för att nollhypotesen stämmer ut?

A

Ju högre F-kvoten är desto mindre är sannolikheten att H0 är sann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

SS total

A

Total variation i datamaterialet. Summan av alla individers kvadrerade avvikelser från totalmedelvärdet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

SS between

A

Mellangruppsvariation. Om man har olika många personer i de olika grupperna beräknar man för varje grupp produkten av antalet personer i gruppen och gruppmedelvärdets kvadrerade avvikelse från totalmedelvärdet. Sen lägger man ihop alla dessa produkter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

SS within

A

Inomgruppsvariation. Summan av alla individers kvadrerade avvikelser från sina gruppmedelvärden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Df between

A

Antalet grupper minus ett

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Df within

A

Antalet individer minus antalet grupper

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Df total

A

Antalet individer minus ett

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mean square (between)

A

Medelkvadratsumman mellan grupper. Ju större detta värde blir desto större är mellangruppsvariationen. Dividera SS Between med frihetsgraderna J - 1, där J är antalet grupper.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Mean square (within)

A

Medelkvadratsumman inom grupperna. Ju större detta värde blir desto större är inomgruppsvariationen. Dividera SS within med frihetsgraderna Σ(n-1), där n är antalet individer inom en specifik grupp.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad anger sig.-värdet?

A

Sannolikheten för att skillnaden mellan grupperna beror på slumpen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Varför utförs s.k. Post Hoc test ofta i samband med variansanalys? Nämn namnet på minst två olika Post Hoc test.

A

ANOVA mäter bara om det finns en skillnad mellan grupperna, man får ingen vidare, mer detaljerad, information om hur de skillnaderna ser ut. Post Hoc-test ger möjligheten att se tydligare info om skillnaden mellan grupperna.

Exempel: Fischer’s LSD, Tukey HSD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Beskriv tre antaganden vid variansanalys.

A
  1. Antagandet om normalfördelade populationer - Egenskapen som mäts antas vara normalfördelad i populationen. För att få tillförlitliga resultat (alltså att typ-1 fel inte är större än den alfa-nivå man bestämt) måste stickproven också vara representativa för resten av populationen om man ska kunna generalisera sitt resultat. Dock fungerar envägs oberoende ANOVA relativt bra även vid stora avvikelser från normalfördelningen.
  2. Antagandet om homogena populationsvarianser - Vilket innebär att variansen på den aktuella beroende variabeln är densamma i alla populationer.
  3. Antagandet om observationer ska vara oberoende. Man ska inte mäta samma individer flera gånger och inte heller dela upp individerna med hjälp av någon bakgrundsvariabel och sedan gruppera individer med liknande värden på den bakgrundsvariabeln i subgrupper (såvida det inte just är effekten av denna bakgrundsvariabel man vill testa!).
17
Q

Vad menas med ”fixed” respektive ”random” oberoende variabler?

A

Fixed:

  • Om vi bara har bestämt nivåerna i OV
  • Om vi bara “tagit vad vi får”
  • Om vi använt alla nivåer som är av intresse

Random:
- Om vi valt nivåerna slumpmässigt ur populationen av alla möjliga nivåer

Att slumpmässigt avgöra nivåer på OV minskar risken för att vi ska välja värden som ger en bild på ett samband som egentligen inte finns/ser ut på ett annat sätt. Fixed nivåer på OV ökar t.ex.risken för att icke-linjära samband ser linjära ut.

18
Q

Vad (ungefär) anger effektstorleken vid variansanalys? Ange två olika effektmått.

A

Hur mycket (i procent) av variansen mellan individer som kan förklaras av vilken grupp de tillhör.

Effektmått: Eta- squared (samma sak som R² i regressionsanalys).
Omega- squared (mindre biased än föregående, men mer konservativt).
Eta-squared har som mest bias vid små och många stickprov. Med få, stora stickprov blir skillnaden mot omega-squared mindre.

19
Q

När används tvåvägs ANOVA?

A

Vid faktoriell design, där individer tillhör olika kombinationer av grupper på två olika oberoende variabler.

20
Q

Huvudeffekter

A

Hur värden i den beroende variabeln (här livsglädje) varierar mellan nivåerna på den oberoende variabeln X (här kön) över alla nivåer på den oberoende variabeln Y (alla andra oberoende variabler som är med).

T.ex. om vi ska kolla på huvudeffekten av kön på t.ex. livsglädje, så kollar vi hur kön påverkar livsglädje (oavsett alla andra variabler t.ex. behandling)

21
Q

Enkla effekter

A

Hur värdena i den beroende variabeln varierar mellan nivåerna på den oberoende variabeln X (kön) för en viss nivå på den oberoended variabeln Y (här behandling)

T.ex. Hur påverkar behandling livsglädje endast för kvinnor?

22
Q

Interaktionseffekter

A

Om den enkla effekten av den oberoende variabeln X ser olika ut för olika nivåer av den andra oberoende variabeln Y så sägs X och Y interagera i sin effekt på den beroende variabeln.

T.ex. effekten av behandling ser olika ut för kvinnor och män, blir en interaktionseffekt av kön och behandling.

23
Q

Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas interaktionen mellan de oberoende variablerna vid en tvåvägs ANOVA. Ge ett konkret exempel.

A

SS Kön x Beh = SS Cell – SS Kön ‐ SS Beh

24
Q

Vad brukar inträffa med F-kvoten för effekten av en viss oberoende variabel om man tar med ytterligare en oberoende variabel i analysen? Varför?

A

F-värdet brukar bli högre.

Varför? Genom att ta hänsyn till ännu en oberoende variabel samt interaktionen mellan de oberoende variablerna så sjunker felvariansen (vi får lägre error vid tvåvägsanalys). Då blir F-värdet för effekten av behandling högre (analysen får högre power).

25
Q

Hur många effekter räknas fram vid en trevägs ANOVA?

A

Sju: tre huvudeffekter och fyra interaktionseffekter (AxB, AxC, BxC, AxBxC)

26
Q

Beskriv vad som menas med en trevägsinteraktion.

A

Tvåvägsinteraktionen ser olika ut beroende på vad man har för värde på den tredje OV. T.ex. interaktionen mellan behandling och kön ser olika ut för olika nivåer av ålder.

27
Q

Säg att du vid en trevägs ANOVA finner att de tre oberoende variablerna A, B och C interagerar signifikant i sin effekt på den beroende variabeln D. Beskriv hur du skulle gå vidare med analysen.

A

Då kan jag gå vidare och göra en tvåvägs-ANOVA för dem som fått behandling A och en för dem som fått behandling B och så kan jämför hur huvudeffekter och interaktionseffekten för ålder kön skiljer sig. Om det finns en interaktionseffekt vill vi undersöka den närmare. Det gör vi genom att göra envägs-ANOVOR för aktuella grupper.

Vid dikotoma OV behöver vi inga post hoc-test. Då räcker ANOVA.

28
Q

När används ANOVA för beroende mätningar?

A

När man har en inomindividsdesign, det vill säga då vi mäter BV för samma individer vid flera mätillfällen.

29
Q

Vad är fördelen med upprepade mätningar?

A

Effekten av individuell variation kan beräknas, vilket minskar mätfel och därmed ökar powern. Om vi bara har ett värde per person vet vi inte om det har att göra med OV eller om personens generellt tenderar att ligga där. Om vi har flera värden för samma person kan vi räkna ut ett individuellt medelvärde över alla mätningar. Vi kan räkna bort individuell effekt från effekten av tid (behandling) och får då ett renare mått på effekten av behandling.

30
Q

Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas mättillfälle vid en ANOVA för beroende mätningar. Ge ett konkret exempel.

A

Ex. Åtta personer har fått ange grad av depression vid tre mättillfällen, en gång innan behandling, en gång under behandling och en gång efter avslutad behandling. För varje mättillfälle räknas ett medelvärde ut för de åtta personerna depressionsgrad. För varje person tar vi då mättilfällets medelvärde – totala medelvärdet över alla mätningar och kvadrerar det och summerar = SS(mättillfälle)

För att räkna ut Mean Squares dividerar vi SS(mättillfälle) med df (antal mätningar – 1)

31
Q

Beskriv det ”extra antagande” som gäller för ANOVA för beroende mätningar som inte gäller för ANOVA för oberoende mätningar.

A

Sfäriskhet – homogena varianser för alla differenser. Alltså, värdena ska skilja sig ungefär lika mycket mellan mättillfällen för alla individer i populationen.

Kan testas t.ex. genom ”Mauchly’s Test of Sphericity” – testar om det finns en signifikant skillnad i varians för differenserna.

32
Q

När används Mixed ANOVA?

A

Används när vi har upprepade mättillfällen av BV hos samma personer OCH vi har en eller flera OV som varierar mellan personer (olika grupper).

33
Q

Vad innebär en signifikant interaktion vid en ANOVA för upprepade mätningar med en mellanindividsvariabel? Ge ett konkret exempel.

A

Effekten av tid (dvs förändringen över tid) ser olika ut för de olika grupperna.

Ex. Depressionsgrad i två behandlingsgrupper har mätts innan och efter behandling. Det finns en interaktionseffekt: tid*behandling. = Effekten av tidpunkt på depressionsgrad varierar med behandlingsgrupp.

34
Q

När används Multivariat ANOVA (MANOVA)?

A

När man har flera BV.

35
Q

Beskriv vilka antaganden som gäller vid MANOVA.

A
  • Homogena varianser och kovarianser: Variansen för alla BV och korrelationer mellan alla BV är samma i alla populationer
  • Multivariat normalfördelning: ”Varje möjlig linjär kombination av BV är normalfördelad”
  • Observationer är oberoende
  • BV bör ha ett visst samband med varandra, men inte för starkt