ANOVA Flashcards
Hva blir ulike t-tester til i ANOVA?
uavhengig t-test til ANOVA, ANCOVA, factorial (two-way, n-way) designs
fra avheng t-test til repeated measures ANOVA
og så har vi mixed (between-within subjects) deisgn hvor vi tester ulike grupper på forskjellig tid
Hva står ANOVA for?
analysis of variance
Hva er en variansanalyse?
Den studerer forskjeller mellom grupper på en kontinuerlig avhengig variabel.
* Brukes blant annet til å analysere resultatene fra eksperimenter.
Variansanalysemetoden sammenligner gjennomsnitt for flere grupper
* La g betegne antall grupper..
* Gjennomsnittet av responsvariabelen for g-populasjonene er angitt med 𝛍𝟏,𝛍𝟐, …𝛍𝐠.
Variansanalysen er en signifikanstest av nullhypotese om like populasjonsgjennomsnitt
* H0: 𝛍𝟏= 𝛍𝟐 = ⋯ = 𝛍𝐠 (alle gjennomsnitt er like)
Den alternative hypotesen er:
* Ha: det er minst to gjennomsnitt som er ulike
Det er mange forskjellige analyseteknikker.
Hvilke forskjellige analyseteknikker har vi i variansanalyse?
- Analyseteknikker
– T-testen (to grupper) (dårlig)
– Enveis variansanalyse (ANOVA)- bare en grupperingsvariabel
– Enveis variansanalyse med kovariater (ANCOVA)
– Flerveis variansanalyse (Factorial ANOVA) - flere grupperingsvariabler
– ANOVA med repeterte målinger (RANOVA)
Hvilke forutsetninger må være til stede for å bruke ANOVA?
Statistisk uavhengighet - verdien for en observasjon forteller ingenting om andre verdier
sjekk: datainnsamling&forskningsdesign
eks. uavhengig tilfeldig utvalg(randomisering)
Lik varians på tvers av gruppene– Levene’s test, se på SDene + welch
sjekk: datainnsamling&forskningsdesign
Normalfordelte data innad i gruppene– QQ-plott, Normalitetstester (e.g., Shapiro-Wilk test eller Kolmogoroff-Smirnov test)
ANOVA - hvordan skiller den seg fra t-test og hva gjør den?
- I stedet for å sammenlikne en og en gruppe, se på variansen av gruppegjennomsnittene
- Er denne variansen større enn man forventer av tilfeldighet?
Det er viktig å skille mellom systematisk varians og feilvarians
Hvilke typer varians har vi i ANOVA og hvorfor er det viktig?
Hvor mye varians er systematisk (pga gruppetilhørighet) og hvor mye er «tilfeldig» feilvarians?
Hvis eksperimentet er vellykket, da vil modellen forklare mer varians (systematisk varians) enn den ikke kan forklare (uforklart varians/feilvarians)
Det kan testes med F-testen
Hva er F-testen?
F=(MSm)/(MSr)
MSm= SSm/dfM
MSr = SSr/dfR
MS =mean squares of
SS= sum of squares, (her: varians)
Utvalgsfordelingen (F) er avhengig av to typer frihetsgrader (“degrees of freedom”)
* hvor mange grupper? (dfM= antall grupper - 1)
* hvor mange deltakere i studien? (dfR = antall deltaker – antall grupper)
Hvis eksperimentet er vellykket, da vil modellen forklare mer varians (systematisk varians) enn den ikke kan forklare (uforklart varians/feilvarians)
En ANOVA sammenligner to typer varianser:
i. Varians innad i gruppene (tilfeldig varians, feilvarians)
ii. Varians mellom gruppene (systematisk varians hopefully)
Hva er formelen for KStotal?
KSmellomgruppe? KSinnengruppe?
=kvadratsum = SS
KStotal = Summen av (datapunkt-gjennomsnitt)^2
- total varians i data
KSmellomgruppe = Summen av (gruppegj.snitt - gj.snitt)^2
KSinnengruppe = Summen av (datapnkt- gruppegj.snitt)^2
KStotal = KSmellomgruppe + KSinnengruppe
Hva er GM?
Grand Mean, Ggjennomsnittet
gjennomsnittet over alle UV på AV
Hva er greia med SSt?
SSt = total varians i data
er alle avvikene fra GM
KStotal = summen av (datapunkt xi-gj.snitt)
SSt=S^2grand(N-1)
Kvadratsumogvarianser relatert
Hva er greia med SSm?
Model Sum of Squares, SSM = Variability due to the model (systematisk varians)
avvikene av gruppegjennomsnittet fra GM
KSmellomgruppe = Summen av (gruppegj.snitt - gj.snitt)^2
Bruker vi gruppetilhørighet i tillegg så er den forventede verdien ikke lenger Grand Mean, men gruppegjennomsnittet
Hva er greia med SSr?
Residual Sum of Squares, SSR = Variability due to extraneous factors
Avvikene fra gruppegjennomsnittet
KSinnengruppe = summen av (datapunkt-gruppegjennomsnitt)^2
Hvilke Mean Squares har vi?
Mean Squares, MS
Average variation due to model (systematisk varians)
Average variation due to error (feilvarians)
MERK: ikke KS som er bare varians og ikke gjennomsnittlig
Hvis vi deler nå kvadratsummene på deres frihetsgrader så får vi «average» varianser * …er en slags ”gjennomsnittlige” kvadratsummer * i variansanalysen kalles disse varianser ”mean squares” (MS)
MSm=SSm/dfm
MSr=SSr/dfr
Hvordan kan frihetsgrader i en variansanalyse oppdeles?
Slik som SS:
dftotal = df𝑚𝑒𝑙𝑙𝑜𝑚𝑔𝑟𝑢𝑝𝑝𝑒 + df𝑖𝑛𝑛𝑒𝑛𝑔𝑟𝑢𝑝𝑝𝑒
- dftotal = N - 1 =dft
df𝑚𝑒𝑙𝑙𝑜𝑚𝑔𝑟𝑢𝑝𝑝𝑒= k – 1 = dfm
df𝑖𝑛𝑛𝑒𝑛𝑔𝑟𝑢𝑝𝑝𝑒 = N – k = dfgrp1+dfrp2+…+dfgrpn = dfr
herfra kan man snu også…
dfT = antall deltagere - 1=dfm+dfr
dfm = antall grupper - 1
dfr = antall deltagere - antall grupper
Hva er omega squared?
ω2 = (SSeffect – (dfeffect)(MSerror)) / MSerror + SStotal
En effektstørrels = graden av assosiasjon for en populasjon
This formula cannot be used for repeated measures designs.
For multi-factor, completely randomized design, Keppel (1991) recommends the partial omega squared (or alternatively, the partial eta-squared). The partial ω2 formula is:
partial omega squared
ω2 can have values between ± 1.
Zero indicates no effect.
If the observed F is less than one, ω2 will be negative.
.01 = liten
.06 medium
.14 stor
Kritikk: kan være misledende, ikke bruk om forskningsdesign inneholder blocking faktor
Blocking is where you control sources of variation (“nuisance variables“) in your experimental results by creating blocks (homogeneous groups).
Hvordan kan man rapportere et resultat fra ANOVA?
A one-way ANOVA revealed that there [was or was not] a statistically significant difference in [dependent variable] between at least two groups (F(between groups df, within groups df) = [F-value], p = [p-value]), omega squared = [lowest, highest].
There was no significant effect of viagra dose on libidio, F(2, 17.33) = 2.57, p = 0.106, ω² = .23 [0.00, 0.29]
Dersom p-verdien < .05, og vi konkluderte med at det eksisterer forskjeller mellom de tre gruppene. Da må vi spesifikt spørre hvilke gruppegjennomsnitt som skiller seg fra hvilke?-ANCOVA
Merk: F,df innenfor og mellomgruppe i rad: Welch!!!
Hva er multiple comparisons?
ANCOVA
Tester forskjeller mel. grupper
Hvorfor trenger vi multiple comparisons?
– ANOVA er en omnibus-test som bare tester at ikke alle μ (populasjonsgjennomsnitt) er like
– Vi vet ikke hvilke μ som er forskjellige
- Planlagte kontraster
– Planned contrasts skal være planlagt på forhånd, og tar utgangspunkt i en spesifikk hypotese som man hadde før startet analysen (kanskje basert på tidligere resultater). - Post hoc tester for forskjeller
– Ikke planlagt (ingen spesifikke hypoteser)
– Er praktisk talt t-tester mellom alle mulige grupper.
* Men det kontrolleres for økt sjanse for type 1 feil ved å korrigere signifikansnivået.
* Det finnes mange forskjellige post-hoc tester– For eksempel, Bonferroni (den vanligste), Tukey, osv. » Scheffe, mer komplisert og mer konservativ
Hva skjer med signifikansen når vi gjør mange parvise tester?
* Problemet med multiple tester er at sannsynligheten for α-feil øker
* Derfor må α-nivå korrigeres hvis man bruker flere tester
Hva står ANCOVA for?
Analysis of Covariance
Når bruker man ANCOVA?
Kan uforklarlig varians reduseres ved å kontrollere for noen kjente «extraneous variables»?
ANCOVA –Nåroghvorfor
* Brukes til å kontrollere for kjente extraneous variables.
* For å teste forskjeller mellom gruppegjennomsnitt når vi vet at en extraneous variable(s) påvirker utfallsvariabelen.
Comparing means adjusted for other predictors
planned contrasts en type multiple comparisons
Hva er fordeler med ANCOVA?
NCOVA –Fordeler
* Reduserer uforklart varians(feilvarians)
* Ved å forklare noe av den uforklarte variansen (SSR) kan feilvariansen i modellen reduseres.
- Størreeksperimentellkontroll:
- Ved å kontrollere kjente extraneous variables får vi større innsikt i effekten av prediktorvariabelen
* Covariate should be independent (not related) to the IV
- Ved å kontrollere kjente extraneous variables får vi større innsikt i effekten av prediktorvariabelen
Hva er forskjell i hypotese i planlagt kontrast og post-hoc multiple comparisons?
For å demonstrereplanlagt kontrastvil vi starte med spesifikke hypoteser
* post-hoc multiple comparisons: ikke planlagt (ingen spesifikke hypoteser)
Hva er regler for planned contrasts?
Regel 1: Velg logiske sammenligninger. Du kan kun sammenlige to «chunks» av gangen. Når en gruppe er alene i en sammenligning, skal den ekskluderes fra de resterende gruppene.
Regel 2: Grupper med positive vekter vil bli sammenlignet med grupper med negative vekter. (eks høy og lav dose)
Regel 3: Summen av vekten skal alltid bli null
Regel 4: Grupper som blir vektet 0 blir ikke med i sammenligningen.
Regel 5: Vektingen i den ene «chunken» skal tilsvare antall grupper i den andre «chunken»
Eksempel på hvordan kan man rapportere fra ANCOVA?
The covariate, partner libido, was significantly related to the participant’s libido, F(1, 26) = 4.96, p = 0.035, ω²p = 0.12. There was also a significant effect of Viagra dose on levels of libido after controlling for the effect of partner libido, F(2, 26) = 4.14, p = 0.027, ω²p = 0.17. Planned contrasts revealed that having any dose of Viagra significantly increased participants libido compared to having a placebo, t(26) = 2.79, p = 0.01, representing a large-sized effect d = 2.30, 95% CI [0.48, 4.12], but having a high dose of Viagra did not significantly increase libido compared to having a low dose, t(26) = 0.54, p = 0.59.
Kovariaten sin påvirkning på AV med F(
Hva er faktoriell ANOVA?
Factorial design
– More than one independent/predictor (factors) variable has been manipulated
Ser på oppdelin systematisk varians
- The number of independent/predictor variables manipulated
– n-way= npredictors/independent variables (factors) , for example: - Two-way = 2 independent variables (e.g., alcohol, gender)
- Three-way = 3 independent variables (e.g., alcohol, gender, age)
Eksempel:
Field(2009):Testingtheeffectsofalcoholandgenderon‘the beer-goggleseffect’: Factor1(Alcohol):Levels=None,4pints Factor2(Gender):Levels=Male,Female
Dette er et 𝟐×𝟐forskningsdesign og ANOVAen heter 𝟐×𝟐 faktoriell ANOVA. Her er det totalt 2 x 2 = 4 grupper!
Dependent variable (DV) was attractiveness of the partner selected at the end of the evening.
Når og hvorfor bruke toveis ANOVA
Nåroghvorfor
* 2 uavhengige variabler (faktorer)
* Prinsippet kan utvides til å inkludere flere, uavhengige faktorvariabler (“flerfaktoriell” ANOVA)!
* resultatene vanskeligere å tolke (interaksjonseffekter!)
Hva er fordeler med toveis ANOVA?
Fordeler
* Du lærer mer med en toveis ANOVA
* Vis hvordan effekten av en prediktor kan avhenge av effekten av en annen prediktor – interaksjonseffekt!
- Det er mer kostnadseffektivt å studere variablene sammen * i stedet for å kjøre to separate eksperimenter.
Hvordan kan man rapportere toveis ANOVA?
There was a significant main effect of gender on the attractiveness of selected mates, F(1, 28) = 6.540, p < .05, ω² = .06. There was a significant main effect of the amount of alcohol consumed at the nightclub, on the attractiveness of the mate that was selected, F(1, 28) = 31.652, p < .001, ω² = .35. There was a significant interaction effect between the amount of alcohol consumed and the gender of the person selecting a mate, on the attractiveness of the partner selected, F(1, 28) = 21.188, p < .001, ω² = .23.
1.UV1
2.UV2
3.Interaksjonsledd
4: effekten indikerer, se på forskjeller
This effect indicates that males and females were affected differently by the amount of alcohol consumed. Specifically, the attractiveness of partner was not significantly different between males (M = 66.88, SD = 10.33) and females (M = 60.63, SD = 4.96)who did not drink alcohol (p= .159); however, the attractiveness of partner was significantly different between males (M = 66.88, SD = 10.33)and females (M = 60.63, SD = 4.96) who drank four pints of alcohol (p< .001)
hvordan kan man skrive formler for ANOVA, ANCOVA og toveis ANOVA som regresjon?
ANOVA, ANCOVA og ToveisANOVA kan forstås som en spesiell form for multippel regresjon.
ANOVA
Libido𝒊= 𝑏𝟎+ 𝑏𝟏low𝒊 + 𝑏2high𝒊+ 𝒆𝒊
ANCOVA Libido𝑖=𝑏0+𝑏1lowi+𝑏2high𝑖+𝑏3partner′s libido𝑖+𝑒𝑖
ToveisANOVA
Attractiveness𝒊= 𝑏𝟎+ 𝑏𝟏gender𝒊 + 𝑏2alcohol𝒊+ 𝑏3alcohol*gender𝒊+𝒆𝒊
Hvor finner man stigningstallene til ANCOVA som regresjon?
Tabell: coefficients
Kolonne: unstandardized
Rad: M1/H1, men modell 1
Hvor finner man utfallet av regresjonsligningen til ANCOVA med regresjon
Tabell: marginal means - UV
Kolonne: marginal mean
Rad: variabel du skal knytte det til
ANCOVA Libido𝑖=𝑏0+𝑏1lowi+𝑏2high𝑖+𝑏3gj.snittsXpartner′s libido𝑖+𝑒𝑖
Gj.snitts Xen i ligningen x gj.snitt. av kovariabel