Cours 6 - ANOVA Flashcards

1
Q

Quelle différence entre le test T et l’ANOVA?

A

Tes t = test juste 2 moyennes
ANOVA : test plus de 2 moyennes, pas de restrictions sur le nbr de moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi faire une anova plutôt que plusieurs test t?

A

On pourrait faire pls test t pour comparer pls moyennes
MAIS, nous cause un prob de faire pls test t au lieu d’une anova : augmente le risque d’erreur → chaque test = + de risque de faire une erreur alpha
plus on répète le test = + le risque d’Erreur alpha augmente = mieux d’utiliser l’anova = 1 test qui test toutes les moyennes en même temps.
ET plus on fait de test = plus on a de chance de trouver une différence significative (EE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la technique statistique la plus utilisée en psychologie?

A

ANOVA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment on formule nos hypothèses dans le test d’hypothèse ANOVA?

A

H0 : μ1 = μ2 = … = μk (postule que pas d’effet autre que le hasard)
H1 : au moins une égalité est fausse (postule une différence significative d’au moins 1 moyenne par rapport aux autres, donc variabilité entre les échantillons plus grande que la variabilité naturelle)

Le test d’hypothèse nous permet de déterminer si au moins 1 des moyennes diffère de celle des autres,
MAIS ne nous permet pas de savoir laquelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’ANOVA permet?

A

Permets de tester les effets de plusieurs variables indépendantes (facteurs ou critères de classification) et de vérifier les interactions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une ANOVA à plans factoriels?

A

Lorsqu’il y a plusieurs VI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est le principe d’une ANOVA?

A

L’analyse de variance (ANOVA) vise à déterminer si la variabilité naturelle (variabilité d’erreur ou effet du hasard, donc variabilité à l’intérieur de l’échantillon) permet d’expliquer la variabilité observée entre les échantillons (ou les mesures).
DONC, vérifier si la variabilité entre les groupes (variabilité inter groupe) est plus grande que la variabilité naturelle (variabilité intra groupe) ou si autre chose que le hasard explique les différences de moyennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel test est utilisé pour une ANOVA?

A

Le test-F (Fisher)
Nous permet de comparer deux sources de variance (variance inter/variance intra)

Plus la valeur du test est près de 1 et plus on se rapproche de l’hypothèse nulle (rien d’autre que le hasard)

Lorsqu’on dépasse la valeur critique (table), concluons à une différence significative de moyenne, car la variabilité entre les échantillons est plus grande que la variabilité naturelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est la logique de l’ANOVA?

A
  1. Il y aura des différences de moyennes et de variances entre les groupes du seul fait de la variabilité inter-échantillonnalle
  2. On se demande est-ce que la variabilité entre les échantillons (inter échantillon) est plus grande que la variabilité dans les échantillons (intra échantillon) ?
  3. S’il n’y a que le hasard qui joue, ces deux variabilités devraient être approximativement égales
  4. si la variabilité entre les échantillons est significativement plus grande que la variabilité intra échantillon, il faut conclure qu’il y a autre chose que le hasard qui joue et qui provoque des différences de moyennes entre les échantillons
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment on calcule l’ANOVA?

A

Nous comparons deux estimations des variances :
* Une variance inter échantillon
* Une variance intra échantillon

CALCUL
basé sur la somme des carrés (SC)
Pour calculé la somme des carrés = on utilise le numérateur du calcul de la variance
Ce qui fait du sens puisque l’ANOVA est une analyse de variance

** les sommes de carrés sont additives entre elles puisqu’on ne divise pas par les dl

RÉSULTAT
Si ne varie pas = viennent de la même population et la variabilité qu’on observe = juste dû au hasard
Si ça varie = probablement que viennent pas de la même population et dû à autre chose que le hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont des synonymes de variabilité inter et variabilité intra?

A

VARinter = Variabilité dû au traitement = Somme des carrés attribuable au traitement = SCtrait

VARintra = Variabilité attribuable au hasard = La somme des carrés de l’erreur = SCerreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que la variabilité totale dans l’ANOVA?

A

La variabilité totale = la somme des carrés de toutes les observations
DONC: SCtotal = SCtrait + SCerreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sur quel modèle sous-jacent se base l’ANOVA?

A

Le modèle structurel (linéaire)

Xij = μ + αj + εij

Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).

EXEMPLE:
Ma grandeur = moyenne de la population + mon sexe + mes caractéristiques uniques
Bref, c’est un peu comme des poupées russes (grosse moyenne de la population + moyenne de mon groupe + ma variabilité individuelle)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment on calcul la SCtotalte?

A

SCtotal = ∑(Xij - X…)2

Xij = donnée pour le participant i dans le groupe j
X = grande moyenne de toutes les données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment on calcul la SCtrait?

A

SCtotal = n ∑(Xj - X…)2

Xj = moyenne du groupe j
X = grande moyenne de toutes les données
n = taille de chacun des groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment on calcul la SCerreur?

A

SCerreur = SCtotal - SCtrait

17
Q

À quoi servent les Carrés Moyens (CM)?

A

Si nous voulons comparer les sommes de carrés (SC), il faut les transformer en carrés moyens (CM) pour prendre en compte le nombre d’éléments qui rentre dans chacun des calculs.

CALCUL
On divise le SC par les dl

  • CMtotal = SCtotal / dl total
  • CMtrait = SCtrait / dl trait
  • CMerreur = SCerreur / dl erreur

CALCUL DES dl
∽ dltotal = N – 1
∽ dltrait = k – 1 (k = nbr de groupe)
∽ dlerreur = dltotal – dltrait ou k(n – 1)

18
Q

Comment on calcul le F de fisher pour l’ANOVA?

A

F = VARinter/VARintra = CMtrait / CMerreur ≈ 1.0
Résultat près de 1.0 si les deux sources de variabilité sont égales
Résultat >1 s’il y a un effet significatif

Ratio F pour calculer notre hypothèse nulle : DONC, la distribution F permet de calculer la probabilité d’observer une valeur F si l’hypothèse nulle est vraie (donc utilise une table)

19
Q

Quelles sont les différentes méthodes pour calculer une ANOVA sur SPSS?

A

ANOVA et ONEWAY
Réaliser des analyses univariées (une variable dépendante)

ONEWAY
réaliser un grand nombre de comparaisons a posteriori

UNIANOVA
Obtenir des tailles d’effet

GLM et MANOVA
réaliser des modèles plus complexes, y compris des
analyses multivariées

20
Q

Quelle est la différence entre une analyse a priori et a posteriori dans une ANOVA?
Quel but ont les tests a posteriori?

A

A PRIORI
Comparaisons décidées avant la collecte de données
On a une hypothèse sur quelles moyennes vont différées
Restreint le nombre de comparaisons

A POSTERIORI
Comparaisons effectuées après (ou non) un test F significatif
Ne sont pas guidés par des hypothèses spécifiques quant aux différences attendues
Toutes les comparaisons possibles sont réalisées (donc, on l’utilise quand on veut tester l’ensemble des différences de moyennes)
BUT = établir la plus petite différence de moyenne significative + pour quelle(s) paire(s) de moyennes la différence observée est plus grande que la plus petite différence significative
ex de tests: Les tests de Tukey, Bonferonni et Student-Newman-Keuls

Les tests de comparaisons multiples sont presque toujours décidés après coup.

21
Q

Quelles sont les conditions d’application d’une ANOVA? Qu’est-ce que ça fait si les postulats ne sont pas respectés?

A
  1. homogénéité des variances (principale condition)
    ∽ Nos groupes conditions sont égaux (on assume que les variances sont homogènes avec des groupes égaux)
    ∽ Mais si pas égaux, postulat devient encore plus important
    ∽ Accès à des corrections si le postulat n’est pas respecté
  2. normalité
    ∽ Suivre une distribution normale
    ∽ SI on a des groupes égaux ET assez grands = l’ANOVA devient un test robuste
  3. indépendance des observations
    ∽ Les mesures faites sur une unité d’observation sont indépendantes des mesures faites sur une autre unité d’observation
    ∽ les participants ne s’influencent pas les uns les autres

SI NOS POSTULATS NE SONT PAS RESPECTÉS
= ↑ puissance
= ↑ risque d’Erreur alpha
Solution : changer notre nbr de participants

22
Q

Comment calculer la taille d’effet avec une ANOVA?

A

Puisque nous avons plus de 2 moyennes, c’est plus complexe de trouver notre taille d’effet
Il existe plusieurs indices de grandeur de l’effet pour l’ANOVA
2 sont fréquemment utilisées : le 𝜂2 et le 𝜔2

23
Q

Qu’est-ce que l’éta-carré (𝜂2)

A

Aide à calculer la taille d’effet dans une ANOVA

Dérivé du r carré = représente donc un % de variance expliquée par le facteur groupe

FORMULE DE L’ÉTA-CARRÉ PARTIEL
𝜂2 = SCtrait / SCtotal
Formule qui prend en compte SCerreur (SCtotal - SCerreur = SCtrait)
DONC, est moins biaisé que l’éta-carré tout cours qui ne le prend pas en compte
tjs rapporté l’état-carré partiel dans le texte

24
Q

Qu’est-ce que l’oméga-carré (𝜔2)

A

Aide à calculer la taille d’effet dans une ANOVA
∽ Souvent considéré comme plus rigoureux - parce qu’il prend en compte le nombre de groupes (k)
∽ Aussi considéré comme plus conservateur
∽ Il est donc prioriser

S’interprète aussi comme un pourcentage de variance expliquée par le facteur

FORMULE
𝜔2 = SCtrait - (k-1) X CMerreur / SCtotal + CMerreur

25
Q

Comment choisir nos tests a posteriori?

A

Pour tester toutes les différences :
∽ Tukey,
∽ Scheffé
∽ Newman-Keuls

Une bonne pratique est de vérifier dans les écrits, quelles sont les procédures populaires dans votre domaine en fonction de notre population et notre problématique

26
Q

Quand utilisé le test de Scheffé?

A
  • Test a posteriori
  • Toutes les comparaisons possibles (par paires ou comparaisons composées)
  • Les n peuvent être égaux ou non
  • Extrêmement conservateur (donc peu puissant et - de chance de trouver une diff significative)
27
Q

Quand utilisé le test de Bonferroni?

A
  • Test a posteriori
  • Utile si les n sont inégaux
  • s’il y a peu de comparaisons = le test le plus puissant

test safe qui fait un bon rapport entre la puissance et avoir un test conservateur

28
Q

Quand utilisé le test de Tukey?

A
  • Test a posteriori
  • Comparer toutes les moyennes par paires (pairwise comparisons)
  • Les n devraient être égaux, mais le n harmonique est accepté
  • Si un grand nombre de comparaisons à faire = c’est le test le plus puissant

test safe qui fait un bon rapport entre la puissance et avoir un test conservateur

29
Q

Quand utilisé le test de Dunnett?

A
  • Test a posteriori
  • Comparer tous les groupes à un groupe contrôle
  • Le test le plus puissant avec un groupe contrôle (seul endroit où l’utiliser)
30
Q

Quand utilisé le test de LSD de Fisher?

A
  • Test a posteriori
  • Aucune correction pour contrôler l’erreur de type 1 = plus de risque d’erreur alpha
  • Devrait seulement être utilisée avec k = 3 groupes (donc l’utiliser seulement si peu de groupes
31
Q

Que faire quand nos tailles d’échantillons sont inégales dans l’ANOVA?

A

Dans le cas de tailles inégales, nous pouvons réécrire
l’équation pour prendre en compte des n différents
Ensuite, le reste des calculs restent les mêmes

32
Q

Qu’est-ce que le taux d’erreur de l’ensemble?

A

Le taux d’erreur de l’ensemble (EE) est la probabilité globale de faire une erreur si nous effectuons C comparaisons
Notre C comparaison = une famille de conclusion
EE = Probabilité qu’on retrouve dans cette famille une erreur de type 1

Notre but avec l’ANOVA est de contrôler EE