Lecture 10: ANOVA: F distribution and one way independent Flashcards
wat is de algemene vraag bij een ANOVA
verschillen de populatiegemiddelden van meer dan 2 groepen significant van elkaar?
wat is de gedetaileerde vraag bij ANOVA
krijg je meer predictive value als je kijkt naar het gemiddelde van de groepen, vergeleken met het grote gemiddelde van de hele steekproef? of maakt dat niet zoveel verschil?
verschil ANOVA en independent t test
bij ANOVA kan je meer dan 2 groepen met elkaar vergelijken. bij independent t test niet
wat doet de standaard deviatie/variance, wat is hun doel
om het verschil tussen de observatie en de grant mean te kwantificeren
total sum of squares algemene beschrijving =
sum all the distances between the observations and the grand means, and square them
wat betekent het dat de sum of squares minimized is
this will never get lower!! want de mean is de value die al het dichtste bij alle waarden zit. dus hij kan niet lager worden.
error sum of squares =
the difference between the observed value and the predicted value of the group mean. It is also called the sum of squares residual (SSR) as it is the sum of the squares of the residual, that is, the deviation of predicted values from the actual values.
dus welke sum of squares kijkt naar wat
total sum of squares= grant mean
error sum of squares = group mean
wat is total sum of squares - error sum of squares
model sum of squares, dit laat dus zien hoeveel het model in te brengen heeft in het verhaal. als er niet zo’n groot verschil zit tussen de total en error sum of squares, heeft de model sum of squares dus niet zoveel toe te voegen, want dan is die waarde klein.
adding an extra parameter to your model is ….
always going to lead to a etter approximation of the data!
but is it worth it????
als de TSS en ESS hetzelfde zijn…
dan is de MSS = 0, dus dan voegt het nieuwe model niks toe: de means of the groups are equal to the grant mean.
welk model wil je altijd kiezen
het meest simpele model. dus als er geen groot verschil is, dan wil je gewoon gaan voor de grant mean omdat dat het makkelijkste is.
one way independent ANOVA: wat meet je?
compare 2 or more independent groups.
assumptions ANOVA
- continous variable
- random sample
- normally distributed: shapiro wilk / Q Q plots
- equal varaince within the groups: Levene’s test
andere benaming voor SSerror=
SSwithin
andere benaming voor SSmodel=
SSbetween
hoe bereken je SSmodel in R
- n berekenen: length(group1) (gaat om het aantal participanten in de groep!!)
- mean(group1)
- mean(group)
vervolgens alles in de formule zetten, en voor elke group de SS berekenen. daarna summen
dus waar staat ng voor, of n1/n2 etc
aantal participanten per group!!!!
hoe kan je F visualizen in R
visualize.f(F, df_model, df_error, section=’upper’)
wat betekent een non significante Levene’s test
A non-significant p value of levene’s test show that the variences are indeed equal and there is no difference in variances of both groups
hoe worden de df van een ANOVA gerapporteerd
vanaf boven naar beneden: df model, daarna df error
hoe moet je de effecten van een ANOVA rapporteren
There was a/no significant effect of x level on the y level, with F(df model, df error)= … and p= …
According/Contrary to expectations, planned contrasts revealed that ____________
F= (2 formules)
MSmodel/MSerror, of SIGNAL / NOISE
waar staat MS voor
Mean Sum of Squares
dfmodel formule =
k-1
k= aantal condities
df error formule =
N - k
waar ligt de F distribution aan?
The F-distibution is different for different sample sizes and number of groups, because it depends on dfmodel (aantal condities) en dferror (aantal condities + sample size)
SSmodel formule
som:
nk*(x̄k - x̄)^2
nk = aantal participanten bij elke conditie
x̄k = mean van bepaalde conditie
x̄ = grant mean
formule SSerror=
som:
sk^2 * (nk - 1)
sk^2 = variance per groep
nk = aantal participanten per groep