Lecture 13: Independent Factorial ANOVA Flashcards
within group variance heet ook wel =
noise of MS error
between group variance heet ook wel =
signal of MS model
independent factorial ANOVA=
The independent factorial ANOVA analyses the variance of multiple independent variables (Factors) with two or more categories.
- Two or more independent variables with two or more categories. (=categorical)
- One continuous dependent variable (=continuous)
Assumptions van independent factorial ANOVA
- Continuous variable
- Random sample
- Normally distributed: Shapiro-Wilk test/Q-Q plot
- Equal variance within groups: Levene’s test/Ratio of observed sd’s
wat is anders bij deze vorm van ANOVA vergeleken met de andere (behalve bij ANCOVA)
we willen hier ook kijken naar een interactieeffect: als er een interactieeffect is kunnen we het main effect namelijk niet goed inschatten. daarom moet je altijd checken voor interactieeffecten!
wat is de correcte definitie van normality
de residuals zouden normaal verdeeld moeten zijn!
(= prediction error of your model)
als jouw dependent variable normaal is verdeeld, is de residuals ook normaal verdeeld tho. maar het gaat eigenlijk over de residuals
hoe krijg je de shapiro wilk test
via descriptives -> outcome bij dependent, split by independent -> statistics -> rechts
wat is een interactie effect
Er is sprake van interactie als het effect op de afhankelijke variabele van een onafhankelijke variabele afhangt van de waarde van een andere onafhankelijke variabele. Je kan het zien als een soort “turbo-effect”.
= when the effect of one of the predictor variables is influenced by the level of the other predictor variable
wat is het hele hoofddoel bij een anova
we kijken naar de variance van de dependent variable, en proberen hier predictor variables aan toe te voegen om deze variance te kunnen uitleggen.
-> partitioning of variance into model variance and error variance
hoe krijg je de squares
door de difference van observation-mean te nemen, en dat ^2
wat is voordeel aan squaren
meer robust tegen outliers, en samen = 0
hoe meer predictors je toevoegt, hoe kleiner …. en hoe groter …
hoe kleiner de error sum of squares
hoe groter de model sum of squares
we can keep adding predictor variables, it will always lead to a better prediction. but….
the question is: is this worth it?
wat is nog een extra stap die we maken bij een independent factorial ANOVA
naast dat we kijken naar het verschil in variance dat uitgelegd kan worden door het model vs error, kunnen we ook nog kijken naar de variance die uitgelegd wordt door independent factor A versus independent factor B
-> divide the improvement among these different sources. further partiction these sums of squares for the independent predictor variables
dus we willen bij independent anova ook nog kijken naar … (formules)
SSa, SSb en SSab