Chapitre 11 : L'analyse de variance simple Flashcards

1
Q

Qu’est-ce que l’ANOVA simple?

A
  • Parmi les analyses les plus utilisées.
  • Analyse la différence entre plusieurs groupes et non seulement deux, comme le test t.
  • Est utilisable pour des petits ou grands échantillons.
  • Sa logique est similaire à celle du test t.
  • On calcule la statistique Fobservé: la différence entre les moyennes des groupes par rapport à l’erreur-type de la différence.
  • À partir des d.l. et du seuil alpha, on trouve le Fcritique dans la table appropriée.
  • On compare la statistique Fobservé au Fcritique pour conclure H1 vs H0.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

À quelle famille d’analyse appartienne le test t et l’ANOVA?

A

La famille d’analyse des différences de moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment peut-on choisir entre les différents tests selon la question de recherche?

A

Avec un arbre décisionnel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les différentes caractéristiques du test t? (nombre de VI/VD, nombre de groupes à comparer, stats requise, inférence, tests additionnels)

A
  • Nombre de VI/VD : 1/1
  • Nombre de groupes à comparer : Deux
  • Stats requise : t
  • Inférence : Valeur critique de t
  • Tests additionnels : Taille de l’effet oméga^2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quels sont les différentes caractéristiques de l’ANOVA simple? (nombre de VI/VD, nombre de groupes à comparer, stats requise, inférence, tests additionnels)

A
  • Nombre de VI/VD : 1/1
  • Nombre de groupes à comparer : Deux ou plus
  • Stats requise : F
  • Inférence : Valeur critique de F
  • Tests additionnels : Taille de l’effet éta^2 et tests post-hoc
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que l’ANOVA permet de conclure?

A
  • Indique si un ou des groupes «n’appartient(nent) pas» à la même population (H0 vs H1) en tenant compte du risque d’erreur alpha.
  • Si rejet de H0 : il est faux de conclure que tous les échantillons proviennent de la même population (au moins un des groupes est significativement différent des autres).
    Il faut un autre test (post-hoc) pour l’identifier.
  • Si non rejet de H0 : les échantillons proviennent de la même population (ils sont semblables).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

L’ANOVA se fait en trois étapes, quelles sont-elles?

A
  1. F indique que parmi tous les groupes, il y en a un qui diffère des autres mais il n’indique pas lequel
  2. Significatif ou non –> taille de l’effet : ecq ça vaut la peine qu’on l’analyse?
  3. Test post hoc pour savoir où sont les différences
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui permet de déterminer quel(s) groupe(s) différe(nt) des autres?

A

Les tests de comparaisons multiples post-hocs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que H1 dans un ANOVA?

A

Au moins un groupe diffère des autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment peut-on déterminer si la différence est grande ou petite?

A

“La taille de l’effet” et signification statistique vs signification pratique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pour l’ANOVA simple, quelles sont les caractéristiques des échantillons?

A

On compare plusieurs échantillons et chaque échantillon est composé d’observations différentes (échantillons indépendants)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi utiliser l’ANOVA plutôt que de faire plusieurs test t?

A

À cause du cumul de l’erreur alpha : à chaque test t, l’erreur alpha s’additionne pour donner au final un cumul d’erreur alpha beaucoup plus grand que le seuil p < 0,05 accepté.
On peut calculer la nouvelle probabilité d’erreur de type I avec cette formule :
p = 1 (1 - alpha)^c
où c = nb de comparaisons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la correction de Bonferroni?

A
  • Lorsque nous sommes «forcés» d’utiliser un cumul de tests t (comparaisons deux à deux), il faut utiliser la correction de Bonferroni.
    Ex : comparer deux groupes sur plusieurs variables; groupes non normaux, etc..
  • Formule : alpha / nombre de comparaisons.
  • La correction diminue le risque de commettre une erreur de type I, mais elle devient trop stricte lorsque beaucoup de comparaisons sont réalisées. Il est alors risqué de faire une erreur de type II.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quels sont les avantages de l’ANOVA par rapport au cumul de l’erreur alpha du test t?

A
  • Ne cause pas de problème de cumul de l’erreur d’inférence, tous les groupes sont comparés en même temps
  • Ne limite pas le nombre de groupes qui peuvent être comparés
  • Peut être utilisée avec des échantillons de presque toutes les tailles
  • Devient progressivement instable lorsque les échantillons sont très petits (n < 10) et/ou trop hétérogènes (la taille des échantillons diffère trop)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les similitudes entre le test t et l’ANOVA?

A

Le test t
- Calcule la différence entre 2 groupes
- Calcule l’erreur type de la différence
- Calcule le rapport entre ces 2 éléments (tobservé).
L’ANOVA
- Calcule la différence entre les groupes (s²inter).
- Calcule l’erreur type de la différence entre les groupes (s²intra).
- Calcule le rapport entre ces 2 éléments (Fobservé).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que la VI de l’ANOVA?

A
  • La VI = la caractéristique qui définit les niveaux (groupes)
  • P.ex. : la VI est le “traitement” pour laquelle nous avons trois niveaux (reçoit le médicament, reçoit un placébo, ne reçoit ni placébi ni médicament)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que la VD de l’ANOVA?

A

La VD = la mesure sur laquelle nous comparons les groupes

P.ex. : le degré de rétablissement pour chaque patient suite au traitement

18
Q

Comment peut-on définir les différents niveaux des VI d’un ANOVA?

A
  • La VI = un seul continuum conceptuel divisé en «niveaux» discrets. En d’autres mots, la VI doit être une variable nominale ou ordinale.
  • Chaque niveau ou groupes doit comporter des observations indépendantes entre les groupes (un échantillon différent)
  • Il n’y a pas de limite au nombre de niveaux d’une VI, mais tous les niveaux doivent se situer le long du même “continuum”
19
Q

Comment peut-on définir la VD d’une ANOVA?

A
  • La variable qui est mesurée pour chaque observation de chaque groupe et sur laquelle nous postulons avoir une moyenne différente pour les différents niveaux (de la VI).
  • Il s’agit d’une variable à intervalles ou de rapport / ratio.
20
Q

Quelle est la logique de l’ANOVA?

A
  • Comme pour le test t, il faut déterminer si la différence de Χ entre les groupes est plus grande que l’erreur-type de la différence entre les Χ.
  • Deux éléments sont donc nécessaires :
    La différence entre les Χ.
    Le calcul de l’erreur-type des différences.
21
Q

Qu’est-ce que la variance inter-groupe?

A

Il s’agit de différences entre les Χ des groupes, elle est «la variance inter groupe» ou s²inter.
Plus grande est la différence entre les Χ, plus grande sera la s²inter.

22
Q

Qu’est-ce que la variance intra-groupe?

A

Le degré avec lequel les observations dans chaque groupe diffère les unes des autres est«la variance intra groupe» ou s²intra. La s²intra est l’erreur-type de la différence entre les Χ (i.e. l’erreur d’échantillonnage)

23
Q

À partir de quels éléments s’établit l’erreur-type de la différence?

A

L’erreur-type de la différence s’établit en fonction de deux éléments : le nombre d’observation (n) de chaque groupe et leur variations (s² ou s).

24
Q

Comment calcule-t-on F?

A

F = s²inter / s²intra
Plus grand est ce rapport, plus il est probable que les groupes ne proviennent pas de la même population («rejet de H0».)

25
Q

Comment calcule-t-on s²inter?

A

La différence entre la Χ des groupes (s²inter).

  1. Calculez la moyenne des Χ (la grande moyenne: ΧG = SommeΧi/K).
  2. Calculez la différence entre chaque Χ et ΧG (Χi - ΧG).
  3. Il faut mettre chaque différence au carré (Χi - ΧG)², pondérer (ni) et faire la somme: SCinter = Sommeni(Χi - ΧG)²= somme des carrés intergroupe.
26
Q

Comment calcule-t-on s²intra?

A
  1. Calculez la différence entre chaque observation et sa Χ (x - Χ) que l’on met au carré (x - Χ)².
  2. Calculez la somme des différences dans chaque groupe Somme(x - Χ)² et faites la somme pour tous les groupes Somme de Somme (x - Χ)².
    SCintra = Somme de Somme(x - Χ)² = sommes des carrés intra groupe.
27
Q

Quel est le problème avec SCinter et SCintra?

A
  • La SCintra est calculée à partir de la somme des différences entre les observations x et leurs propres groupes, (xi - Χ). Cela implique que plus nous avons d’observations, plus grande sera la taille de la SCintra.
  • La SCinter est calculée a partir de la somme des différences entre les observations Χj et la grande moyenne, (Χj – ΧG). Cela implique que plus nous avons de groupes, plus grande sera la quantité SCinter.
28
Q

Comment corrige-t-on ce problème?

A

Les valeurs SCinter et SCintra étant respectivement affectées par le nombre de groupe (K) et le nombre d’observations (x), nous corrigeons en calculant leurs moyennes.
Conceptuellement:
SCΧinter = SCinter/le nombre de groupe K.
SCΧ intra= SCintra/le total des observations (de tous les groupes).
*Cependant, cette méthode amène un autre problème.

29
Q

Quel est le problème avec SCXinter et SCXintra?

A

Il faut prendre compte des d.l.
SCΧinter = SCinter / K – 1.
SCΧintra = SCintra / N - K.

30
Q

Comment peut-on interpréter conceptuellement la valeur de Fobservé?

A

La différence entre les Χ des groupes est x fois plus grande que la différence a laquelle nous nous serions attendu si tous les groupes provenaient de la même population (l’erreur-type de la différence entre les Χ).
*En d’autre mots, plus le F est grand, plus il y a de chances qu’il y aille des différences entre les groupes/plus le F grossit plus il y a des chances qu’il soit significatif

31
Q

À quelle taille un F est-il assez grand pour être “significatif”?

A

Lorsqu’il est plus grand que Fcritique.

On peut trouver Fcritique dans un tableau de valeur de Fcritique.

32
Q

Comment peut-on choisir entre le rejet ou non rejet de H0?

A
  • Il faut rejeter H0 lorsque le Fobservé est ≥ que le Fcritique.
  • Implique que moins de 5 % des groupes provenant de la même population obtiennent un tel Fobservé.
  • Nous concluons improbable que les groupes ayant ce Fobservé proviennent de la même population (rejet de H0).
  • Mais nous courrons un risque de < 5 % que notre conclusion soit fausse (erreur alpha).
  • Après tout, 5 % des groupes extraits de la même population obtiennent au moins ce Fobservé.
33
Q

Quelle est la relation entre Fcritique, Fobservé, alpha, n et K?

A
  • Plus petit le Fcritique plus probable le rejet de H0.
  • Le Fcritique est plus petit lorsque :
    a : le seuil alpha est plus grand (0,05 au lieu de 0,01). Nous acceptons un risque plus grand d’erreur a).
    n : un grand n et/ou (un grand n produit une erreur-type de la différence plus petite).
    K : beaucoup de niveaux de la VI (plus nous avons de groupes, il est plus probable qu’au moins un groupe sera différent).
34
Q

Que signifie une signification statistique insuffisante?

A
  • Nous savons qu’un Fobservé peut être statistiquement significatif ou non, dépendamment de a, n et/ou K.
  • Nous savons aussi que si le n est suffisamment grand, pratiquement tous les F seront significatifs.
  • La signification statistique ne nous dit pas si la différence est grande ou petite.
  • Si la différence est grande, cela pourrait être important.
  • Si la différence est petite, cela pourrait être trivial.
  • La taille d’effet permet de distinguer les résultats significatifs importants vs triviaux.
  • Ce qu’il faut comprendre, c’est que juste avoir la signification statistique n’est pas assez pour un F car elle ne nous dit pas si la différence est grande ou petite.
35
Q

Qu’est-ce que la taille d’effet?

A
  • Valide autant pour les tests t que les ANOVA
  • F ne dit pas non plus si la différence est importante, dit seulement si elle est significative. C’est pour ça qu’on calcule la taille d’effet
  • Permet de distinguer si c’est la différence entre les X qui “cause” la différence, ce qui pourrait être un résultat important, ou bien si c’est le fait que nous avons un grand échantillon qui cause la différence, ce qui pourrait être moins intéressant.
  • La signification statistique indique qu’au niveau de la population, les deux groupes n’ont pas la même moyenne (ex.: Χ1 > Χ2). Techniquement : il y a deux populations.
  • La taille de l’effet chiffre la taille de la différence statistiquement significative (0 % a 100 %). Elle estime la taille de la différence entre les deux ou plusieurs Χ.
36
Q

Comment calcule-t-on la taille de l’effet?

A
  • Les échantillons produisent des Χ et des s².
  • Les stats comparent les Χ : la différence «inter» groupe.
  • Il y a aussi de la différence entre les membre du même groupe. La différence «intra» groupe.
  • La somme de ces deux éléments est le total de toutes les différences. Le rapport inter/total est la taille de l’effet.
37
Q

Quels sont les critères les plus acceptés pour déterminer la taille de l’effet?

A
  • 0,01 – 0,05 (1 à 5 %) au moins = petite taille d’effet.
  • 0,06 - 0,139 (6 à 14 %) = taille d’effet de taille moyenne.
  • 0,14 et plus = grande taille d’effet.
  • Attention : le jugement sur la taille dépend plus de la situation que des critères de Cohen.
  • *La taille de l’effet n’est interprétable que si le F est significatif …
38
Q

Quelle est la formule de la taille d’effet pour un test t?

A

Oméga² = t² - 1 / t² + n1 + n2 - 1

39
Q

Quelle est la formule de la taille d’effet pour l’ANOVA?

A
Éta² = SCinter / SCtotal
SCtotal = SCinter + SCintra
40
Q

Qu’est-ce que les tests de comparaison post-hoc?

A
  • Un résultat d’ANOVA statistiquement significatif indique qu’au moins un groupe est différent des autres.
  • Mais lequel ou lesquels ?
  • Les tests de comparaisons multiples post-hocs servent à déterminer où se trouve la différence significative.
    NB: Le test t n’est pas appropriée (cumul de l’erreur alpha; sauf avec correction).
41
Q

Quelles sont quelques caractéristiques du test post hoc de Scheffé?

A
  • Pré-requis : valides seulement si l’ANOVA conclut au rejet de H0.
  • Le non rejet de H0 signifie qu’au niveau de la population, la différence entre les groupes = 0.
  • S’il n’y a pas différence entre les groupes, il est insensé de calculer le ou lesquelles des groupes diffèrent !
42
Q

Comment peut-on résumer l’ANOVA?

A
  • Compare différents niveaux de la VI sur une seule VD.
  • Calcule la statistique F, à partir de trois quantités:
    1. La grande moyenne (ΧG).
    2. La somme des carrés moyens intergroupes (SCΧinter).
    3. La somme des carrés moyens intragroupes (SCΧintra).
  • Fobservé= SCΧinter / SCΧintra
  • L’interprétation du Fobservé se fait par comparaison avec le Fcritique.
  • Si Fobservé > Fcritique, au moins un groupe diffère des autres.
  • La taille d’effet nous indique si la différence (significative) génère des conséquences pratiques.
  • Le test post-hoc spécifie lequel ou lesquels des groupes diffèrent.