Chapitre 11 : L'analyse de variance simple Flashcards
Qu’est-ce que l’ANOVA simple?
- Parmi les analyses les plus utilisées.
- Analyse la différence entre plusieurs groupes et non seulement deux, comme le test t.
- Est utilisable pour des petits ou grands échantillons.
- Sa logique est similaire à celle du test t.
- On calcule la statistique Fobservé: la différence entre les moyennes des groupes par rapport à l’erreur-type de la différence.
- À partir des d.l. et du seuil alpha, on trouve le Fcritique dans la table appropriée.
- On compare la statistique Fobservé au Fcritique pour conclure H1 vs H0.
À quelle famille d’analyse appartienne le test t et l’ANOVA?
La famille d’analyse des différences de moyennes
Comment peut-on choisir entre les différents tests selon la question de recherche?
Avec un arbre décisionnel
Quels sont les différentes caractéristiques du test t? (nombre de VI/VD, nombre de groupes à comparer, stats requise, inférence, tests additionnels)
- Nombre de VI/VD : 1/1
- Nombre de groupes à comparer : Deux
- Stats requise : t
- Inférence : Valeur critique de t
- Tests additionnels : Taille de l’effet oméga^2
Quels sont les différentes caractéristiques de l’ANOVA simple? (nombre de VI/VD, nombre de groupes à comparer, stats requise, inférence, tests additionnels)
- Nombre de VI/VD : 1/1
- Nombre de groupes à comparer : Deux ou plus
- Stats requise : F
- Inférence : Valeur critique de F
- Tests additionnels : Taille de l’effet éta^2 et tests post-hoc
Qu’est-ce que l’ANOVA permet de conclure?
- Indique si un ou des groupes «n’appartient(nent) pas» à la même population (H0 vs H1) en tenant compte du risque d’erreur alpha.
- Si rejet de H0 : il est faux de conclure que tous les échantillons proviennent de la même population (au moins un des groupes est significativement différent des autres).
Il faut un autre test (post-hoc) pour l’identifier. - Si non rejet de H0 : les échantillons proviennent de la même population (ils sont semblables).
L’ANOVA se fait en trois étapes, quelles sont-elles?
- F indique que parmi tous les groupes, il y en a un qui diffère des autres mais il n’indique pas lequel
- Significatif ou non –> taille de l’effet : ecq ça vaut la peine qu’on l’analyse?
- Test post hoc pour savoir où sont les différences
Qu’est-ce qui permet de déterminer quel(s) groupe(s) différe(nt) des autres?
Les tests de comparaisons multiples post-hocs
Qu’est-ce que H1 dans un ANOVA?
Au moins un groupe diffère des autres
Comment peut-on déterminer si la différence est grande ou petite?
“La taille de l’effet” et signification statistique vs signification pratique
Pour l’ANOVA simple, quelles sont les caractéristiques des échantillons?
On compare plusieurs échantillons et chaque échantillon est composé d’observations différentes (échantillons indépendants)
Pourquoi utiliser l’ANOVA plutôt que de faire plusieurs test t?
À cause du cumul de l’erreur alpha : à chaque test t, l’erreur alpha s’additionne pour donner au final un cumul d’erreur alpha beaucoup plus grand que le seuil p < 0,05 accepté.
On peut calculer la nouvelle probabilité d’erreur de type I avec cette formule :
p = 1 (1 - alpha)^c
où c = nb de comparaisons
Qu’est-ce que la correction de Bonferroni?
- Lorsque nous sommes «forcés» d’utiliser un cumul de tests t (comparaisons deux à deux), il faut utiliser la correction de Bonferroni.
Ex : comparer deux groupes sur plusieurs variables; groupes non normaux, etc.. - Formule : alpha / nombre de comparaisons.
- La correction diminue le risque de commettre une erreur de type I, mais elle devient trop stricte lorsque beaucoup de comparaisons sont réalisées. Il est alors risqué de faire une erreur de type II.
Quels sont les avantages de l’ANOVA par rapport au cumul de l’erreur alpha du test t?
- Ne cause pas de problème de cumul de l’erreur d’inférence, tous les groupes sont comparés en même temps
- Ne limite pas le nombre de groupes qui peuvent être comparés
- Peut être utilisée avec des échantillons de presque toutes les tailles
- Devient progressivement instable lorsque les échantillons sont très petits (n < 10) et/ou trop hétérogènes (la taille des échantillons diffère trop)
Quelles sont les similitudes entre le test t et l’ANOVA?
Le test t
- Calcule la différence entre 2 groupes
- Calcule l’erreur type de la différence
- Calcule le rapport entre ces 2 éléments (tobservé).
L’ANOVA
- Calcule la différence entre les groupes (s²inter).
- Calcule l’erreur type de la différence entre les groupes (s²intra).
- Calcule le rapport entre ces 2 éléments (Fobservé).
Qu’est-ce que la VI de l’ANOVA?
- La VI = la caractéristique qui définit les niveaux (groupes)
- P.ex. : la VI est le “traitement” pour laquelle nous avons trois niveaux (reçoit le médicament, reçoit un placébo, ne reçoit ni placébi ni médicament)
Qu’est-ce que la VD de l’ANOVA?
La VD = la mesure sur laquelle nous comparons les groupes
P.ex. : le degré de rétablissement pour chaque patient suite au traitement
Comment peut-on définir les différents niveaux des VI d’un ANOVA?
- La VI = un seul continuum conceptuel divisé en «niveaux» discrets. En d’autres mots, la VI doit être une variable nominale ou ordinale.
- Chaque niveau ou groupes doit comporter des observations indépendantes entre les groupes (un échantillon différent)
- Il n’y a pas de limite au nombre de niveaux d’une VI, mais tous les niveaux doivent se situer le long du même “continuum”
Comment peut-on définir la VD d’une ANOVA?
- La variable qui est mesurée pour chaque observation de chaque groupe et sur laquelle nous postulons avoir une moyenne différente pour les différents niveaux (de la VI).
- Il s’agit d’une variable à intervalles ou de rapport / ratio.
Quelle est la logique de l’ANOVA?
- Comme pour le test t, il faut déterminer si la différence de Χ entre les groupes est plus grande que l’erreur-type de la différence entre les Χ.
- Deux éléments sont donc nécessaires :
La différence entre les Χ.
Le calcul de l’erreur-type des différences.
Qu’est-ce que la variance inter-groupe?
Il s’agit de différences entre les Χ des groupes, elle est «la variance inter groupe» ou s²inter.
Plus grande est la différence entre les Χ, plus grande sera la s²inter.
Qu’est-ce que la variance intra-groupe?
Le degré avec lequel les observations dans chaque groupe diffère les unes des autres est«la variance intra groupe» ou s²intra. La s²intra est l’erreur-type de la différence entre les Χ (i.e. l’erreur d’échantillonnage)
À partir de quels éléments s’établit l’erreur-type de la différence?
L’erreur-type de la différence s’établit en fonction de deux éléments : le nombre d’observation (n) de chaque groupe et leur variations (s² ou s).
Comment calcule-t-on F?
F = s²inter / s²intra
Plus grand est ce rapport, plus il est probable que les groupes ne proviennent pas de la même population («rejet de H0».)