Cours 8 - ANOVA à plan simple Flashcards
Définition de ANOVA
Technique inférentielle qui permet de comparer des moyennes obtenues auprès de plusieurs échantillons ( k = 3)
Objectif de ANOVA
Objectif est de vérifier si les différences observées entre les moyennes des échantillons correspondant à des différences réelles ou si elles sont attribuables au hasard (à la fluctuation d’échantillonnage)
- On ne sait pas la différence est où
- On ne sait pas il y a combien de différences
Pourquoi on ne fait pas simplement plusieurs tests t?
Parce qu’il en résulterait une augmentation du risque de faire une erreur alpha. (0,05 x le nombre d’ensemble de tests)
nombre de tests t possible selon le nombre d’échantillons
k(k-1)/2
Le score d’un individu selon le modèle linéaire général peut être décomposé:
Xij =μ+αj +εij
Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).
Hypothèses statistiques pour ANOVA à plan simple
H0 :μ1 =μ2 =μ3 =μk
H1: il existe au moins une différence entre les moyennes
Test repose sur la comparaisons de variances
Logique de l’ANOVA
- On compare deux estimations de la variance des scores dans la population
- Comparaison des deux estimations de variance permet de déterminer s’il y a ou non un effet statistiquement significatif du traitement
- Si l’estimation de variance affectée par le traitement n’est pas plus élevée que celle qui ne l’est pas, nous concluons qu’il n’y a pas d’effet significatif du traitement et qu’il n’y a pas de différence significative entre les moyennes
Les deux sources de variabilité pour estimer la variance
- Une estimation à partir des scores intra-groupe affectés par l’erreur. Estimation de variance INTRA-GROUPES
- Une estimation à partir des moyennes affectées par l’erreur et par le traitement. Estimation de variance INTER-GROUPES.
Comparaison des deux estimations de variance se fait à partir de:
Rapport F
F = Variabilité traitement + erreur/ Variabilité erreur
Si les différences de moyennes sont seulement dues à l’erreur:
Rapport F=1, donc estimé de sigma inter = estimé de sigma intra
Si les différences de moyennes sont dues au traitement:
F>1, sigma inter>sigma intra
La distribution d’échantillonnage du F de Fisher permet de:
Estimer la probabilité d’obtenir la valeur F observée si la seule source de variabilité est l’erreur
Comment nomme-t-on les estimations de variance dans l’ANOVA
Carrées moyens, CM, calculés à partir de sommes de carrés divisées par les dl.
CMinter est une bonne estimation de la variabilité des scores dans la population si:
Ho est vraie (u1 = u2 = u3 = uk)
Rappel du théorème de la limite centrale
Variance des scores dans la population est égale à n fois la variance des moyennes dans la distribution d’échantillonnage.