Cours 6 - ANOVA Flashcards
Quelle différence entre le test T et l’ANOVA?
Tes t = test juste 2 moyennes
ANOVA : test plus de 2 moyennes, pas de restrictions sur le nbr de moyennes
Pourquoi faire une anova plutôt que plusieurs test t?
On pourrait faire pls test t pour comparer pls moyennes
MAIS, nous cause un prob de faire pls test t au lieu d’une anova : augmente le risque d’erreur → chaque test = + de risque de faire une erreur alpha
plus on répète le test = + le risque d’Erreur alpha augmente = mieux d’utiliser l’anova = 1 test qui test toutes les moyennes en même temps.
ET plus on fait de test = plus on a de chance de trouver une différence significative (EE)
Quelle est la technique statistique la plus utilisée en psychologie?
ANOVA
Comment on formule nos hypothèses dans le test d’hypothèse ANOVA?
H0 : μ1 = μ2 = … = μk (postule que pas d’effet autre que le hasard)
H1 : au moins une égalité est fausse (postule une différence significative d’au moins 1 moyenne par rapport aux autres, donc variabilité entre les échantillons plus grande que la variabilité naturelle)
Le test d’hypothèse nous permet de déterminer si au moins 1 des moyennes diffère de celle des autres,
MAIS ne nous permet pas de savoir laquelle
Qu’est-ce que l’ANOVA permet?
Permets de tester les effets de plusieurs variables indépendantes (facteurs ou critères de classification) et de vérifier les interactions
Qu’est-ce qu’une ANOVA à plans factoriels?
Lorsqu’il y a plusieurs VI
Quel est le principe d’une ANOVA?
L’analyse de variance (ANOVA) vise à déterminer si la variabilité naturelle (variabilité d’erreur ou effet du hasard, donc variabilité à l’intérieur de l’échantillon) permet d’expliquer la variabilité observée entre les échantillons (ou les mesures).
DONC, vérifier si la variabilité entre les groupes (variabilité inter groupe) est plus grande que la variabilité naturelle (variabilité intra groupe) ou si autre chose que le hasard explique les différences de moyennes.
Quel test est utilisé pour une ANOVA?
Le test-F (Fisher)
Nous permet de comparer deux sources de variance (variance inter/variance intra)
Plus la valeur du test est près de 1 et plus on se rapproche de l’hypothèse nulle (rien d’autre que le hasard)
Lorsqu’on dépasse la valeur critique (table), concluons à une différence significative de moyenne, car la variabilité entre les échantillons est plus grande que la variabilité naturelle
Quelle est la logique de l’ANOVA?
- Il y aura des différences de moyennes et de variances entre les groupes du seul fait de la variabilité inter-échantillonnalle
- On se demande est-ce que la variabilité entre les échantillons (inter échantillon) est plus grande que la variabilité dans les échantillons (intra échantillon) ?
- S’il n’y a que le hasard qui joue, ces deux variabilités devraient être approximativement égales
- si la variabilité entre les échantillons est significativement plus grande que la variabilité intra échantillon, il faut conclure qu’il y a autre chose que le hasard qui joue et qui provoque des différences de moyennes entre les échantillons
Comment on calcule l’ANOVA?
Nous comparons deux estimations des variances :
* Une variance inter échantillon
* Une variance intra échantillon
CALCUL
basé sur la somme des carrés (SC)
Pour calculé la somme des carrés = on utilise le numérateur du calcul de la variance
Ce qui fait du sens puisque l’ANOVA est une analyse de variance
** les sommes de carrés sont additives entre elles puisqu’on ne divise pas par les dl
RÉSULTAT
Si ne varie pas = viennent de la même population et la variabilité qu’on observe = juste dû au hasard
Si ça varie = probablement que viennent pas de la même population et dû à autre chose que le hasard
Quels sont des synonymes de variabilité inter et variabilité intra?
VARinter = Variabilité dû au traitement = Somme des carrés attribuable au traitement = SCtrait
VARintra = Variabilité attribuable au hasard = La somme des carrés de l’erreur = SCerreur
Qu’est-ce que la variabilité totale dans l’ANOVA?
La variabilité totale = la somme des carrés de toutes les observations
DONC: SCtotal = SCtrait + SCerreur
Sur quel modèle sous-jacent se base l’ANOVA?
Le modèle structurel (linéaire)
Xij = μ + αj + εij
Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).
EXEMPLE:
Ma grandeur = moyenne de la population + mon sexe + mes caractéristiques uniques
Bref, c’est un peu comme des poupées russes (grosse moyenne de la population + moyenne de mon groupe + ma variabilité individuelle)
Comment on calcul la SCtotalte?
SCtotal = ∑(Xij - X…)2
Xij = donnée pour le participant i dans le groupe j
X = grande moyenne de toutes les données
Comment on calcul la SCtrait?
SCtotal = n ∑(Xj - X…)2
Xj = moyenne du groupe j
X = grande moyenne de toutes les données
n = taille de chacun des groupes
Comment on calcul la SCerreur?
SCerreur = SCtotal - SCtrait
À quoi servent les Carrés Moyens (CM)?
Si nous voulons comparer les sommes de carrés (SC), il faut les transformer en carrés moyens (CM) pour prendre en compte le nombre d’éléments qui rentre dans chacun des calculs.
CALCUL
On divise le SC par les dl
- CMtotal = SCtotal / dl total
- CMtrait = SCtrait / dl trait
- CMerreur = SCerreur / dl erreur
CALCUL DES dl
∽ dltotal = N – 1
∽ dltrait = k – 1 (k = nbr de groupe)
∽ dlerreur = dltotal – dltrait ou k(n – 1)
Comment on calcul le F de fisher pour l’ANOVA?
F = VARinter/VARintra = CMtrait / CMerreur ≈ 1.0
Résultat près de 1.0 si les deux sources de variabilité sont égales
Résultat >1 s’il y a un effet significatif
Ratio F pour calculer notre hypothèse nulle : DONC, la distribution F permet de calculer la probabilité d’observer une valeur F si l’hypothèse nulle est vraie (donc utilise une table)
Quelles sont les différentes méthodes pour calculer une ANOVA sur SPSS?
ANOVA et ONEWAY
Réaliser des analyses univariées (une variable dépendante)
ONEWAY
réaliser un grand nombre de comparaisons a posteriori
UNIANOVA
Obtenir des tailles d’effet
GLM et MANOVA
réaliser des modèles plus complexes, y compris des
analyses multivariées
Quelle est la différence entre une analyse a priori et a posteriori dans une ANOVA?
Quel but ont les tests a posteriori?
A PRIORI
Comparaisons décidées avant la collecte de données
On a une hypothèse sur quelles moyennes vont différées
Restreint le nombre de comparaisons
A POSTERIORI
Comparaisons effectuées après (ou non) un test F significatif
Ne sont pas guidés par des hypothèses spécifiques quant aux différences attendues
Toutes les comparaisons possibles sont réalisées (donc, on l’utilise quand on veut tester l’ensemble des différences de moyennes)
BUT = établir la plus petite différence de moyenne significative + pour quelle(s) paire(s) de moyennes la différence observée est plus grande que la plus petite différence significative
ex de tests: Les tests de Tukey, Bonferonni et Student-Newman-Keuls
Les tests de comparaisons multiples sont presque toujours décidés après coup.
Quelles sont les conditions d’application d’une ANOVA? Qu’est-ce que ça fait si les postulats ne sont pas respectés?
- homogénéité des variances (principale condition)
∽ Nos groupes conditions sont égaux (on assume que les variances sont homogènes avec des groupes égaux)
∽ Mais si pas égaux, postulat devient encore plus important
∽ Accès à des corrections si le postulat n’est pas respecté - normalité
∽ Suivre une distribution normale
∽ SI on a des groupes égaux ET assez grands = l’ANOVA devient un test robuste - indépendance des observations
∽ Les mesures faites sur une unité d’observation sont indépendantes des mesures faites sur une autre unité d’observation
∽ les participants ne s’influencent pas les uns les autres
SI NOS POSTULATS NE SONT PAS RESPECTÉS
= ↑ puissance
= ↑ risque d’Erreur alpha
Solution : changer notre nbr de participants
Comment calculer la taille d’effet avec une ANOVA?
Puisque nous avons plus de 2 moyennes, c’est plus complexe de trouver notre taille d’effet
Il existe plusieurs indices de grandeur de l’effet pour l’ANOVA
2 sont fréquemment utilisées : le 𝜂2 et le 𝜔2
Qu’est-ce que l’éta-carré (𝜂2)
Aide à calculer la taille d’effet dans une ANOVA
Dérivé du r carré = représente donc un % de variance expliquée par le facteur groupe
FORMULE DE L’ÉTA-CARRÉ PARTIEL
𝜂2 = SCtrait / SCtotal
Formule qui prend en compte SCerreur (SCtotal - SCerreur = SCtrait)
DONC, est moins biaisé que l’éta-carré tout cours qui ne le prend pas en compte
tjs rapporté l’état-carré partiel dans le texte
Qu’est-ce que l’oméga-carré (𝜔2)
Aide à calculer la taille d’effet dans une ANOVA
∽ Souvent considéré comme plus rigoureux - parce qu’il prend en compte le nombre de groupes (k)
∽ Aussi considéré comme plus conservateur
∽ Il est donc prioriser
S’interprète aussi comme un pourcentage de variance expliquée par le facteur
FORMULE
𝜔2 = SCtrait - (k-1) X CMerreur / SCtotal + CMerreur
Comment choisir nos tests a posteriori?
Pour tester toutes les différences :
∽ Tukey,
∽ Scheffé
∽ Newman-Keuls
Une bonne pratique est de vérifier dans les écrits, quelles sont les procédures populaires dans votre domaine en fonction de notre population et notre problématique
Quand utilisé le test de Scheffé?
- Test a posteriori
- Toutes les comparaisons possibles (par paires ou comparaisons composées)
- Les n peuvent être égaux ou non
- Extrêmement conservateur (donc peu puissant et - de chance de trouver une diff significative)
Quand utilisé le test de Bonferroni?
- Test a posteriori
- Utile si les n sont inégaux
- s’il y a peu de comparaisons = le test le plus puissant
test safe qui fait un bon rapport entre la puissance et avoir un test conservateur
Quand utilisé le test de Tukey?
- Test a posteriori
- Comparer toutes les moyennes par paires (pairwise comparisons)
- Les n devraient être égaux, mais le n harmonique est accepté
- Si un grand nombre de comparaisons à faire = c’est le test le plus puissant
test safe qui fait un bon rapport entre la puissance et avoir un test conservateur
Quand utilisé le test de Dunnett?
- Test a posteriori
- Comparer tous les groupes à un groupe contrôle
- Le test le plus puissant avec un groupe contrôle (seul endroit où l’utiliser)
Quand utilisé le test de LSD de Fisher?
- Test a posteriori
- Aucune correction pour contrôler l’erreur de type 1 = plus de risque d’erreur alpha
- Devrait seulement être utilisée avec k = 3 groupes (donc l’utiliser seulement si peu de groupes
Que faire quand nos tailles d’échantillons sont inégales dans l’ANOVA?
Dans le cas de tailles inégales, nous pouvons réécrire
l’équation pour prendre en compte des n différents
Ensuite, le reste des calculs restent les mêmes
Qu’est-ce que le taux d’erreur de l’ensemble?
Le taux d’erreur de l’ensemble (EE) est la probabilité globale de faire une erreur si nous effectuons C comparaisons
Notre C comparaison = une famille de conclusion
EE = Probabilité qu’on retrouve dans cette famille une erreur de type 1
Notre but avec l’ANOVA est de contrôler EE