ANOVA Flashcards
Hva blir ulike t-tester til i ANOVA?
uavhengig t-test til ANOVA, ANCOVA, factorial (two-way, n-way) designs
fra avheng t-test til repeated measures ANOVA
og så har vi mixed (between-within subjects) deisgn hvor vi tester ulike grupper på forskjellig tid
Hva står ANOVA for?
analysis of variance
Hva er en variansanalyse?
Den studerer forskjeller mellom grupper på en kontinuerlig avhengig variabel.
* Brukes blant annet til å analysere resultatene fra eksperimenter.
Variansanalysemetoden sammenligner gjennomsnitt for flere grupper
* La g betegne antall grupper..
* Gjennomsnittet av responsvariabelen for g-populasjonene er angitt med 𝛍𝟏,𝛍𝟐, …𝛍𝐠.
Variansanalysen er en signifikanstest av nullhypotese om like populasjonsgjennomsnitt
* H0: 𝛍𝟏= 𝛍𝟐 = ⋯ = 𝛍𝐠 (alle gjennomsnitt er like)
Den alternative hypotesen er:
* Ha: det er minst to gjennomsnitt som er ulike
Det er mange forskjellige analyseteknikker.
Hvilke forskjellige analyseteknikker har vi i variansanalyse?
- Analyseteknikker
– T-testen (to grupper) (dårlig)
– Enveis variansanalyse (ANOVA)- bare en grupperingsvariabel
– Enveis variansanalyse med kovariater (ANCOVA)
– Flerveis variansanalyse (Factorial ANOVA) - flere grupperingsvariabler
– ANOVA med repeterte målinger (RANOVA)
Hvilke forutsetninger må være til stede for å bruke ANOVA?
Statistisk uavhengighet - verdien for en observasjon forteller ingenting om andre verdier
sjekk: datainnsamling&forskningsdesign
eks. uavhengig tilfeldig utvalg(randomisering)
Lik varians på tvers av gruppene– Levene’s test, se på SDene + welch
sjekk: datainnsamling&forskningsdesign
Normalfordelte data innad i gruppene– QQ-plott, Normalitetstester (e.g., Shapiro-Wilk test eller Kolmogoroff-Smirnov test)
ANOVA - hvordan skiller den seg fra t-test og hva gjør den?
- I stedet for å sammenlikne en og en gruppe, se på variansen av gruppegjennomsnittene
- Er denne variansen større enn man forventer av tilfeldighet?
Det er viktig å skille mellom systematisk varians og feilvarians
Hvilke typer varians har vi i ANOVA og hvorfor er det viktig?
Hvor mye varians er systematisk (pga gruppetilhørighet) og hvor mye er «tilfeldig» feilvarians?
Hvis eksperimentet er vellykket, da vil modellen forklare mer varians (systematisk varians) enn den ikke kan forklare (uforklart varians/feilvarians)
Det kan testes med F-testen
Hva er F-testen?
F=(MSm)/(MSr)
MSm= SSm/dfM
MSr = SSr/dfR
MS =mean squares of
SS= sum of squares, (her: varians)
Utvalgsfordelingen (F) er avhengig av to typer frihetsgrader (“degrees of freedom”)
* hvor mange grupper? (dfM= antall grupper - 1)
* hvor mange deltakere i studien? (dfR = antall deltaker – antall grupper)
Hvis eksperimentet er vellykket, da vil modellen forklare mer varians (systematisk varians) enn den ikke kan forklare (uforklart varians/feilvarians)
En ANOVA sammenligner to typer varianser:
i. Varians innad i gruppene (tilfeldig varians, feilvarians)
ii. Varians mellom gruppene (systematisk varians hopefully)
Hva er formelen for KStotal?
KSmellomgruppe? KSinnengruppe?
=kvadratsum = SS
KStotal = Summen av (datapunkt-gjennomsnitt)^2
- total varians i data
KSmellomgruppe = Summen av (gruppegj.snitt - gj.snitt)^2
KSinnengruppe = Summen av (datapnkt- gruppegj.snitt)^2
KStotal = KSmellomgruppe + KSinnengruppe
Hva er GM?
Grand Mean, Ggjennomsnittet
gjennomsnittet over alle UV på AV
Hva er greia med SSt?
SSt = total varians i data
er alle avvikene fra GM
KStotal = summen av (datapunkt xi-gj.snitt)
SSt=S^2grand(N-1)
Kvadratsumogvarianser relatert
Hva er greia med SSm?
Model Sum of Squares, SSM = Variability due to the model (systematisk varians)
avvikene av gruppegjennomsnittet fra GM
KSmellomgruppe = Summen av (gruppegj.snitt - gj.snitt)^2
Bruker vi gruppetilhørighet i tillegg så er den forventede verdien ikke lenger Grand Mean, men gruppegjennomsnittet
Hva er greia med SSr?
Residual Sum of Squares, SSR = Variability due to extraneous factors
Avvikene fra gruppegjennomsnittet
KSinnengruppe = summen av (datapunkt-gruppegjennomsnitt)^2
Hvilke Mean Squares har vi?
Mean Squares, MS
Average variation due to model (systematisk varians)
Average variation due to error (feilvarians)
MERK: ikke KS som er bare varians og ikke gjennomsnittlig
Hvis vi deler nå kvadratsummene på deres frihetsgrader så får vi «average» varianser * …er en slags ”gjennomsnittlige” kvadratsummer * i variansanalysen kalles disse varianser ”mean squares” (MS)
MSm=SSm/dfm
MSr=SSr/dfr
Hvordan kan frihetsgrader i en variansanalyse oppdeles?
Slik som SS:
dftotal = df𝑚𝑒𝑙𝑙𝑜𝑚𝑔𝑟𝑢𝑝𝑝𝑒 + df𝑖𝑛𝑛𝑒𝑛𝑔𝑟𝑢𝑝𝑝𝑒
- dftotal = N - 1 =dft
df𝑚𝑒𝑙𝑙𝑜𝑚𝑔𝑟𝑢𝑝𝑝𝑒= k – 1 = dfm
df𝑖𝑛𝑛𝑒𝑛𝑔𝑟𝑢𝑝𝑝𝑒 = N – k = dfgrp1+dfrp2+…+dfgrpn = dfr
herfra kan man snu også…
dfT = antall deltagere - 1=dfm+dfr
dfm = antall grupper - 1
dfr = antall deltagere - antall grupper