Cours 8 - ANOVA à plan simple Flashcards
Définition de ANOVA
Technique inférentielle qui permet de comparer des moyennes obtenues auprès de plusieurs échantillons ( k = 3)
Objectif de ANOVA
Objectif est de vérifier si les différences observées entre les moyennes des échantillons correspondant à des différences réelles ou si elles sont attribuables au hasard (à la fluctuation d’échantillonnage)
- On ne sait pas la différence est où
- On ne sait pas il y a combien de différences
Pourquoi on ne fait pas simplement plusieurs tests t?
Parce qu’il en résulterait une augmentation du risque de faire une erreur alpha. (0,05 x le nombre d’ensemble de tests)
nombre de tests t possible selon le nombre d’échantillons
k(k-1)/2
Le score d’un individu selon le modèle linéaire général peut être décomposé:
Xij =μ+αj +εij
Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).
Hypothèses statistiques pour ANOVA à plan simple
H0 :μ1 =μ2 =μ3 =μk
H1: il existe au moins une différence entre les moyennes
Test repose sur la comparaisons de variances
Logique de l’ANOVA
- On compare deux estimations de la variance des scores dans la population
- Comparaison des deux estimations de variance permet de déterminer s’il y a ou non un effet statistiquement significatif du traitement
- Si l’estimation de variance affectée par le traitement n’est pas plus élevée que celle qui ne l’est pas, nous concluons qu’il n’y a pas d’effet significatif du traitement et qu’il n’y a pas de différence significative entre les moyennes
Les deux sources de variabilité pour estimer la variance
- Une estimation à partir des scores intra-groupe affectés par l’erreur. Estimation de variance INTRA-GROUPES
- Une estimation à partir des moyennes affectées par l’erreur et par le traitement. Estimation de variance INTER-GROUPES.
Comparaison des deux estimations de variance se fait à partir de:
Rapport F
F = Variabilité traitement + erreur/ Variabilité erreur
Si les différences de moyennes sont seulement dues à l’erreur:
Rapport F=1, donc estimé de sigma inter = estimé de sigma intra
Si les différences de moyennes sont dues au traitement:
F>1, sigma inter>sigma intra
La distribution d’échantillonnage du F de Fisher permet de:
Estimer la probabilité d’obtenir la valeur F observée si la seule source de variabilité est l’erreur
Comment nomme-t-on les estimations de variance dans l’ANOVA
Carrées moyens, CM, calculés à partir de sommes de carrés divisées par les dl.
CMinter est une bonne estimation de la variabilité des scores dans la population si:
Ho est vraie (u1 = u2 = u3 = uk)
Rappel du théorème de la limite centrale
Variance des scores dans la population est égale à n fois la variance des moyennes dans la distribution d’échantillonnage.
CMintra donne une estimation des scores de la population :
Peu importe sur Ho est vraie ou fausse, car la variance est calculée à partir de la variabilité à l’intérieur des groupes
Si Ho est vraie
CMinter = CMintra
Si Ho est fausse
CMinter n’est pas égale à CMintra
Conditions d’utilisation de l’ANOVA à plan simple
- Échantillons indépendants
- Distribution normale des scores autour de la moyenne pour chaque niveau de la VI
- Homogénéité des variances
- VD sur une échelle intervalle ou ratio
Étapes de l’ANOVA à plan simple
- Identifier les hypothèses statistiques
- Spécifier le seuil de signification alpha (pas unilatéral ou bilatéral)
- Préciser le modèle utilisé et effectuer l’analyse
a) Choix du test: ANOVA à plan simple
b) Conditions d’utilisation
c) Distribution d’échantillonnage du F de Fisher avec 3 dl au numérateur (dl inter: k-1) et 24 dl au dénominateur (dl intra: k(n-1))
d) Calculs - Décision statistique:
H0 est automatiquement rejetée su Fobs> Fcrit - Conclusion selon le contexte
« au moins une différence significative »
Test pour vérifier l’homogénéité des variances
Si significatif sig< 0,05, donc pas homogènes
Si pas significatif sig>0,05, donc homogènes
ANOVA à mesures répétées
Peut être réalisée sur des échantillons dépendants.
Avantages de l’ANOVA à mesures répétées
- Plus puissants au plan statistique: permet de réduire la variabilité qui n’est pas due à la VI
- Nécessitent moins de sujets
Inconvénients de l’ANOVA à mesures répétées
- Effets de persistance et d’apprentissage
S’assurer que le premier traitement n’aura pas d’influence sur le deuxième traitement
Dans l’ANOVA à plan simple vs ANOVA à mesure répétée
PS: Variation due à l’erreur inclut les variations due aux sujets et l’erreur résiduelle de manière indifférenciée
MR: Puisqu’elle est constante, la variation due aux sujets est retirée de la variation due à l’erreur, ce qui réduit la valeur du terme d’erreur utilisé pour le rapport F.
Comment sont repartis les SC et les dl dans l’ANOVA à plan simple
Selon la propriété d’additivité
SC totale (dl totale) = SCinter (dl inter (k-1)) + SC intra (dl intra k(n-1))