Lecture 12: ANCOVA Flashcards
ANCOVA: wat is het?
mix tussen ANOVA en regression. ANCOVA evaluates whether population means of a dependent variable (DV) are equal across levels of a categorical independent variable (IV) often called a treatment, while statistically controlling for the effects of other continuous variables that are not of primary interest, known as covariates (CV).
dus ANCOVA = ANOVA + controlling for covariates
wat voor variabelen heb je bij een ANCOVA
1 dependent variable
1 or more independent variables
1 or more covariates
By adding a covariate, we….
reduce error/residual in the model. (because a covariate can bias your results)
hypothesen bij ANCOVA
H0 = predict with the total mean
H1 = predict with the group means
als deze anders zijn is er een systematic difference between the groups
overfitting=
when you try to fit noise -> bijvoorbeeld als je er van uit gaat dat iedereen in een stoel op 5 mei jarig is, omdat een iemand die in die stoel zat op 5 mei jarig is
wat voor soort variabele is dependent bij ANCOVA
mean -> continuous
wat voor soort variabele is independent bij ANCOVA
categorical
least squares =
een lijn die het kleinste verschil vanaf de mean laat zien, dus de lijn die het beste past.
wat zijn de covariates altijd voor level
categorical!! (Net als independent)
assumptions ANCOVA=
ANOVA:
- continuous variable
- random sample
- normally distributed (shapiro wilk/QQ plots)
- equal variance within groups (levenes)
ANCOVA extra:
- independence of covariate and independent var
- homogeneity of regression slopes
hoe zie je independence of covariate and treatment effect
- No difference on ANOVA with covar and independent variable
- Matching experimental groups on the covariate
“no difference on ANOVA with covar and independent variable” waarom?
- When treatment groups differ on the covariate, putting the covariate into the analysis will not ‘control for’ or ‘balance out’ those differences
- This situation arises mostly when
participants are not randomly assigned to experimental treatment conditions - This problem can be avoided by randomizing participants to experimental groups, or by matching experimental groups on the covariate
hoe kan je homogeneity of regression slopes zien
- Visual: scatterplot dep var * covar per condition
- Testing: interaction indep. var * covar
waar moet je op letten bij het adden van covariates
you do not want to add the covariate if the variance of the covariate overlaps with variance of the independent variable -> dan krijg je niet het ‘pure’ effect van de independent variable (en dat is wat je wil doen met covariates)
wat wil je wel van een covariate
dat hij de unexplained variance uitlegt. (dus niet de variance explained by the indepenent variable)
wat is het doel van dummy variables
translate a categorical variable -> additional column in the data, variable encoded into 0 and 1. dan krijg je een binary division of your categorical variables.