CM 3 et TD 4 : Analyse de Variance à 1 facteur Flashcards
Qu’est-ce qu’une ANOVA à 1 facteur?
Une analyse de variance permet de mettre en évidence les différences entre les moyennes de plusieurs groupes indépendants (between- subjects)
Autrement dit, elle permet de tester l’effet d’un facteur à 2 ou plus modalités sur une VD.
Quel est le modèle sous-jacent de l’ANOVA à un facteur?
(score individuelle - moyenne générale) = (moyenne du groupe - moyenne générale) + (erreur ou effet individuel)
Cela nous donne :
- Variance totale = Variance inter + Variance intra
Variance inter = Plus les moyennes des groupes sont différentes, plus le prédicteur a un effet sur la VD.
Variance intra = Plus les variances au sein des groupes sont fortes, plus il y a un effet d’autres variables sur la VD.
Quelles sont les hypothèses dans une ANOVA à un facteur?
H0 = “Toutes les moyennes sont similaires” → pas d’effet de facteur
H1 = “Au moins deux moyennes sont différentes” → effet
Comment fait-on le test F pour une ANOVA à un facteur? Quelles informations nous donne-t-il? Que peut on faire pour obtenir plus d’information?
F est le rapport entre la Variance Inter et la Variance Intra avec la prise en compte des degrés de liberté :
F = CMinter / CMintra
- CMinter = Vinter / ddl1
- CMintra = Vintra / ddl2
DDL :
- ddl1 = (nb de modalités) - 1
- ddl2 = n - (nb de modalités)
Ainsi, F pose la question de savoir s’il y a plus de variabilité entre les groupes (i.e., l’effet du Prédicteur) par rapport à la variabilité au sein des groupes (i.e., de l’erreur individuelle).
- Si la p-value est significative, alors au moins deux moyennes sont différentes.
Ensuite, nous intéressons sur la taille d’effet, c-à-d la part de variance de la VD qui est expliquée par le prédicteur :
- η² = SCinter / SCtotal
C’est toute information que l’ANOVA peut nous donner. Pour aller plus loin il est nécessaire de déterminer quelles moyennes sont significativement différentes entre elles.
Deux approches sont possibles :
- Procéder à des comparaisons à posteriori (post-hoc) pour explorer les différences 2 à 2.
- Procéder à des comparaisons répondant à des hypothèses spécifiques posées a priori (démarche hypothético-déductive).
Comment fait-on une comparaison post-hoc?
Le post-hoc est utilisé pour explorer quelles moyennes sont significativement différentes entre elles.
Il est ici important de contrôler si nous avons fait une erreur de type 1 (conclure qu’il y a un effet, alors qu’il n’y en a pas). Ce risque augment avec le nombre de comparaisons qu’on fait. Deux types de procédures pour contrôler le taux d’erreur :
- Bonferroni : si uniquement certaines comparaisons nous intéressent
- Scheffe : si on explore toutes les comparaisons possibles
Comment fait-on une analyse de contrastes (comparaisons planifiée) pour tester les hypothèses spécifiques, cela suite à un test F d’ANOVA à un facteur?
Dans le cas d’un prédicteur catégoriel avec plus de 2 modalités, nous avons très souvent des hypothèses spécifiquesquant à la tendance que nous attendons dans les données
(c-à-d la tendance parmi les moyennes des groupes).
Pour tester ces hypothèses, on doit définir une famille de contrastes orthogonaux.
Un contraste est une combinaison linéaire permettant de comparer une moyenne
à une autre moyenne, ou la moyenne d’un groupe à la moyenne combinée
de plusieurs groupes. La somme des poids doit être zéro.
Les étapes :
- Trouver le contraste correspondant à l’hypothèse (i.e., C1, le modèle théorique)
- Trouver des contrastes pour tester ce qui n’est pas expliqué par le modèle théorique, ce que l’on appelle le résidu ou la variance résiduelle (i.e. C2, C3, etc).
- Montrer que le modèle théorique est significatif MAIS pas le(s) résidu(s).
Nb de contrastes = Nb de modalités - 1
- Le premier contraste est le contraste d’intérêt, les autres des contrastes résiduels.
Pour s’assurer qu’il s’agit d’une famille de contrastes orthogonaux :
- Pour chaque contraste, la somme des poids (coefficients) attribués aux modalités doit être égale à 0.
- Pour chaque paire de contrastes, la somme des produits des pairs doit être égale à 0.
Une fois les deux contrastes C1, C2, etc sont définis, nous allons les traiter comme des prédicteurs dans un modèle de Régression multiple. Pour confirmer l’hypothèse, il faudra que C1 soit significatif, mais pas C2.
Quelles sont les conditions d’applications d’une ANOVA à un facteur?
1) Les distributions parentes des scores suivent une tendance normale.
2) Les distributions parentes des scores présentent des variances égales
- la plus grande variance n’est pas plus de 4 fois supérieure à la plus petite
- les groupes dans lesquels on a le plus de sujets sont ceux où la variance est la plus grande
3) Les observations individuelles sont indépendantes et ne nous donnent pas d’informations sur un autre score.
- Si violation : type d’analyse multi-niveau
Dans une ANOVA à 1 facteur, comment écrit-on une conclusion sur les résultats (si significatifs)?
“[VI] a un effet significatif sur la [VD], F(ddl1, ddl2) = [], p = [], η² = []. Les comparaisons post-hoc (avec une correction du type Scheffé/Bonferroni) indiquent que la [VD] est plus important dans le groupe [modalité 1] (M = [], ET = []) comparativement au groupe [modalité 2] (M =[] , ET = [], p = []).”