Cours 6 - ANOVA Flashcards
Quelle différence entre le test T et l’ANOVA?
Tes t = test juste 2 moyennes
ANOVA : test plus de 2 moyennes, pas de restrictions sur le nbr de moyennes
Pourquoi faire une anova plutôt que plusieurs test t?
On pourrait faire pls test t pour comparer pls moyennes
MAIS, nous cause un prob de faire pls test t au lieu d’une anova : augmente le risque d’erreur → chaque test = + de risque de faire une erreur alpha
plus on répète le test = + le risque d’Erreur alpha augmente = mieux d’utiliser l’anova = 1 test qui test toutes les moyennes en même temps.
ET plus on fait de test = plus on a de chance de trouver une différence significative (EE)
Quelle est la technique statistique la plus utilisée en psychologie?
ANOVA
Comment on formule nos hypothèses dans le test d’hypothèse ANOVA?
H0 : μ1 = μ2 = … = μk (postule que pas d’effet autre que le hasard)
H1 : au moins une égalité est fausse (postule une différence significative d’au moins 1 moyenne par rapport aux autres, donc variabilité entre les échantillons plus grande que la variabilité naturelle)
Le test d’hypothèse nous permet de déterminer si au moins 1 des moyennes diffère de celle des autres,
MAIS ne nous permet pas de savoir laquelle
Qu’est-ce que l’ANOVA permet?
Permets de tester les effets de plusieurs variables indépendantes (facteurs ou critères de classification) et de vérifier les interactions
Qu’est-ce qu’une ANOVA à plans factoriels?
Lorsqu’il y a plusieurs VI
Quel est le principe d’une ANOVA?
L’analyse de variance (ANOVA) vise à déterminer si la variabilité naturelle (variabilité d’erreur ou effet du hasard, donc variabilité à l’intérieur de l’échantillon) permet d’expliquer la variabilité observée entre les échantillons (ou les mesures).
DONC, vérifier si la variabilité entre les groupes (variabilité inter groupe) est plus grande que la variabilité naturelle (variabilité intra groupe) ou si autre chose que le hasard explique les différences de moyennes.
Quel test est utilisé pour une ANOVA?
Le test-F (Fisher)
Nous permet de comparer deux sources de variance (variance inter/variance intra)
Plus la valeur du test est près de 1 et plus on se rapproche de l’hypothèse nulle (rien d’autre que le hasard)
Lorsqu’on dépasse la valeur critique (table), concluons à une différence significative de moyenne, car la variabilité entre les échantillons est plus grande que la variabilité naturelle
Quelle est la logique de l’ANOVA?
- Il y aura des différences de moyennes et de variances entre les groupes du seul fait de la variabilité inter-échantillonnalle
- On se demande est-ce que la variabilité entre les échantillons (inter échantillon) est plus grande que la variabilité dans les échantillons (intra échantillon) ?
- S’il n’y a que le hasard qui joue, ces deux variabilités devraient être approximativement égales
- si la variabilité entre les échantillons est significativement plus grande que la variabilité intra échantillon, il faut conclure qu’il y a autre chose que le hasard qui joue et qui provoque des différences de moyennes entre les échantillons
Comment on calcule l’ANOVA?
Nous comparons deux estimations des variances :
* Une variance inter échantillon
* Une variance intra échantillon
CALCUL
basé sur la somme des carrés (SC)
Pour calculé la somme des carrés = on utilise le numérateur du calcul de la variance
Ce qui fait du sens puisque l’ANOVA est une analyse de variance
** les sommes de carrés sont additives entre elles puisqu’on ne divise pas par les dl
RÉSULTAT
Si ne varie pas = viennent de la même population et la variabilité qu’on observe = juste dû au hasard
Si ça varie = probablement que viennent pas de la même population et dû à autre chose que le hasard
Quels sont des synonymes de variabilité inter et variabilité intra?
VARinter = Variabilité dû au traitement = Somme des carrés attribuable au traitement = SCtrait
VARintra = Variabilité attribuable au hasard = La somme des carrés de l’erreur = SCerreur
Qu’est-ce que la variabilité totale dans l’ANOVA?
La variabilité totale = la somme des carrés de toutes les observations
DONC: SCtotal = SCtrait + SCerreur
Sur quel modèle sous-jacent se base l’ANOVA?
Le modèle structurel (linéaire)
Xij = μ + αj + εij
Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).
EXEMPLE:
Ma grandeur = moyenne de la population + mon sexe + mes caractéristiques uniques
Bref, c’est un peu comme des poupées russes (grosse moyenne de la population + moyenne de mon groupe + ma variabilité individuelle)
Comment on calcul la SCtotalte?
SCtotal = ∑(Xij - X…)2
Xij = donnée pour le participant i dans le groupe j
X = grande moyenne de toutes les données
Comment on calcul la SCtrait?
SCtotal = n ∑(Xj - X…)2
Xj = moyenne du groupe j
X = grande moyenne de toutes les données
n = taille de chacun des groupes