Séance 8 : L'ANOVA à plan simple Flashcards

1
Q

Qu’est-ce que l’ANOVA?

A

Une analyse des variances. C’est une technique inférentielle qui permet
de comparer des moyennes obtenues auprès de
plusieurs échantillons (k échantillons). => une généralisation du test t pour 2 échantillons.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

V ou F : L’ANOVA a la même logique que 3 tests T

A

Faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

À quoi correspond k?

A

Au nombre de groupes, soit au nombre de niveaux de traitement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que l’ANOVA permet de vérifier?

A

S’il y a au moins une
différence significative entre les moyennes des différents
échantillons.

Donc, de vérifier si les différences observées entre
les moyennes des échantillons correspondent à des
différences réelles ou si elles sont attribuables au hasard
(à la fluctuation d’échantillonnage).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

De quoi dépend le nom donné à l’ANOVA (à plan simple vs à mesures répétées…) ?

A

Du nombre de VI et VD utilisées et du type d’échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi n’est-il pas recommandé de faire une série de tests t pour voir si au moins une différence significative?

A

Parce que cela augmente les risques de commettre une erreur alpha (dire qu’il y a une différence mais non).

Si on fixe un niveau alpha de 0.05, il s’additionnera à chaque test (à chaque comparaison)

ex: si 3 comparaisons : 0.05 x 3 = 0,15 (15%, beaucoup!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment calculer le nombre de tests possibles avec k échantillons?

A

k(k-1)/2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Calcule le risque de faire erreur alpha avec 4 groupes à alpha = 0,05

A

4(4-1)/2 = 6 tests T

0,05 x 6 = 0,3 => 30%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment peut être décomposé le score d’un indivu dans ANOVA à plan simple.

A

Xij = μ + αj + εij

où Xij = Score de l’individu i dans le niveau j; (net)

μ = Moyenne de la population (constante); (valeur théorique dans la population générale)

αj = Variabilité due à l’effet spécifique du niveau j; (effet du traitement sur le score, ex: du méd

εij = Variabilité reliée à l’individu i dans le niveau j
(erreur). (effet des autres facteurs que le traitement (diff individuelles, erreurs de mesures, distractions…) sur le score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Calcule le score de la prof qui mesure 5,6.

A

Xij = μ + αj + εij

Xij = 5,6
μ = 5,7
αj = -2 (ajustement du au fait d'être une femme, femme plus petites)
εij = +2 (ajustement car elle elle personnellement a une différence des autres femmes)

5,6 = + 5,7 -2 +2 =

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les hypothèses statistiques dans l’ANOVA à plan simple?

A

H0 : μ1 = μ2 = μ3 = μk

H1 : Il existe au moins une différence entre les moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

V ou F : l’ANOVA permet d’identifier où se trouve la(les) différences significatives (entre quelles moyennes)?

A

Fauuuuuuux, il faudra faire d’autres tests (tests de comparaison multiples)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

V ou F : L’ANOVA donne les différences de moyennes, donc logiquement son test s’effectue sur les différences de moyennes.

A

Fauuuuuux, son résultat permet de conclure quant à des différences de moyennes, mais son calcul repose sur des comparaisons de variances (ANalysis Of VAriance)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la logique de l’ANOVA ? Que fait-elle en gros?

A

Elle compare deux estimations de la variance des scores
dans la population:

-Une estimation affectée par le traitement (la VI) et l’erreur (estimé de variance Inter-groupes)

Une estimation affectée par l’erreur seulement (estimation de variance Intra-groupes)

Donc, on estime la variance des
scores de la population à
partir de deux sources
de variabilité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que l’estimation de variance intra-groupes?

A

C’est la variation entre les scores à l’intérieur d’un même groupe (intra-groupes), donc obtenus après un même traitement. Ne comporte que l’erreur (associé aux différences individuelles, car différentes personnes) et pas l’effet de traitement, car ont tous reçu le même.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que l’estimé de variance inter-groupes?

A

C’est la variation obtenue entre les MOYENNES de chaque groupe (niveau de traitement). Affectée par l’erreur (car moyenne obtenue à partir de données ayant des différences individuelles) ET par le traitement (car chaque moyenne est associée à un différent traitement)

17
Q

Qu’est-ce que le rapport F?

A

Un ratio à partir duquel se fait la comparaison des deux estimations de variance.

F = variation inter (traitement + erreur) /variation intra (erreur)

18
Q

Si les différences de moyennes sont seulement dues à l’erreur à quoi devrait ressembler le rapport F.

A

Il devrait être de 1, car la variation inter devrait presque juste être du à l’erreur, donc se rapprocher de variation intra.

19
Q

Si les différences de moyennes sont dues au traitement, à quoi devrait ressembler le rapport F.

A

Il devrait être > 1, variation inter sera plus élevée que variation intra

Toujours un peu plus grande, mais on veut savoir si la différence est significative.

20
Q

Quelle est la distribution d’échantillonnage utilisée et qu’est-ce qu’on estime à partir d’elle?

A

La distribution d’échantillonnage de Fisher. On estime la probabilité d’obtenir la valeur F observée si la seule variabilité est l’erreur (c a d si H0 est vraie).

21
Q

Comment calcule t’on le F?

A
Variation inter/Variation intra 
=
CM inter/CM intra
=
SC inter/dl inter / Scintra/dl intra
22
Q

Comment on appelle les estimations de variance dans l’ANOVA? Comment sont-ils calculés?

A

Dans l’ANOVA, les estimations de variance sont appelées
carrés moyens (CM ou mean squares, MS) et sont
calculées à partir de sommes de carrés (SC ou sum of
squares ou SS) divisées par les dl.

23
Q

Cm inter est toujours une bonne estimation de la variabilité des scores dans la population.

A

Faux. Seulement si H0 est vraie, sinon les moyennes d’échantillons proviennent de populations différentes.

24
Q

Qu’est-ce que le théorème de la limite centrale stipule par rapport à l’ANOVA?

A

En d’autres mots, le théorème de la limite centrale
stipule que la variance des scores dans la
population est égale à n fois la variance des
moyennes dans la distribution d’échantillonnage

=> plus on a d’échantillons, plus on s’approche de la variance de la pop

25
Q

CM intra donne toujours une bonne estimation de la variabilité des scores dans la population.

A
Vrai. peu importe si H0 est vraie ou fausse, car la
variance est calculée à partir de la variabilité à l’intérieur
des groupes (peu importe si les groupes appartiennent ou
non à la même population).
26
Q

Si H0 est vraie…

A

le CM inter et le CM intra devrait être similaire

27
Q

Si H0 est fausse…

A

Si H0 est fausse, le CMinter et le CM intra devrait être

différent

28
Q

Qu’est-ce que la propriété d’additivité ? À quoi s’applique t’il.

A

S’applique aux SC et aux dl.

Fait que les SC/dl inter additionnés au SC/dl intra donne les SC/dl totaux. Avec deux des trois, on peut trouver les autres.

29
Q

Étape 1 à la main

A

Identifier les hypothèses statistiques (H0 et H1)

h0=mu1=mu2…

h1=Il existe au moins une différence significative entre les moyennes.

30
Q

Étape 2 à la main

A

Alpha =

**pas de unilatéral ou latéral

F = pas de négatif, juste aller en haut tout le temps

31
Q

Étape 3 à la main

A

a. Choix du test: ANOVA à plan simple

b. Conditions d’utilisation:
- On a des échantillons indépendants
- Homogénéité des variances
- Normalité de la distribution
- VD sur échelle intervalle ou ratio

c. DIstribution d’échantillonnage du F de Fisher avec k-1 dl au numérateur et k(n-1) dl au dénominateur

d. Calculs :
remplir le tableau si pas le F

si F : F(4,6) = 4,51

32
Q

Étape 4 à la main

A

Trouver F crit. dans la table de F (PRENDRE LE BON ALPHA) avec les deux dl

Fobs(4,6) = 4,51 > Fcrit(4,6) = 3,56. On rejette H0.

33
Q

Étape 5 à la main.

A

Conclusion selon le contexte.

On conclut qu’il y a au moins une différence
significative quant au VI (nombre de comportements
« obsessifs compulsifs ») en fonction VD (du traitement
reçu.)

34
Q

V ou F : Nous devons diviser le p que nous donne SPSS dépendant de notre hypothèse.

A

Faux, avec l’ANOVA jamais.

35
Q

Étape 4 avec SPSS

A

F(3, 24) = 5,514, p = 0,005 < alpha = 0,05. On rejette H0

seule diff sauf calculs = spss.

36
Q

Que fait-on si sig = 0.000?

A

Si c’est écrit .000 en dessus de « Sig » dans SPSS, cela veut
dire que la probabilité est de .0000…1. Dans ce cas, on écrit p
< .001. (ATTENTION, PAS 0,01 comme le alpha, un 0 de plus