L'ANOVA Flashcards
Qu’est-ce qu’une ANOVA ?
Définition simple
Une analyse des variances
Dans mon examen, il y a 3 notes 50 %, 70% et 90%. La moyenne de toutes les notes se nomme la ____ _____
La grande moyenne
Parle moi de la variance dans ce contexte :
4 étudiants dans le groupe “studieux” ont obtenus 90 % et les 4 étudiants dans le groupe “party” ont obtenu 50 %
La variance d’effet est parfaite, puisqu’en connaissant X (groupe) je prédis parfaitement Y (la note), mon r2 est de 100% et mon r = 1.
Parle moi de la variance dans ce contexte :
4 étudiants dans le groupe “studieux” ont obtenus 90 % et les 4 étudiants dans le groupe “party” ont obtenu 50 %, j’ajoute un participant dans le groupe studieux avec la note de 50% et un étudiant dans le groupe party de 90 %
Je prédit moins bien Y en ayant X. Ma variance d’effet est bonne 8 fois sur 10 et ma variance d’erreur est présente 2 fois sur 10
En ayant analyser ma variance d’effet et ma variance d’erreur entre mes groupes, on peut dire que j’ai fais une ….
Analyse des variances !
Vrai ou faux : Nous pouvons arrêter les analyses suite à l’ANOVA, elle nous renseigne assez
Faux : L’ANOVA peut nous renseigner sur une différence globale entre les moyennes (ratio F), cependant, nous devons faire des comparaisons planifiées aussi appelé constrastes ou des post-hoc pour savoir entre quels groupes est-ce que la différence est.
Dans quel contexte faisons-nous des comparaisons planifiées/contrastes ?
Lorsque nous avons des hypothèses a priori, donc que nous avons des hypothèses avant de commencer la recherche.
Exemple : Le groupe A aura un score plus élevé que les autres groupes
Dans quel contexte faisons-nous des tests Post-hoc ?
Après une recherche, on teste toutes les possibilités
Vrai ou faux : L’ANOVA et le test-t ne fonctionnent pas de la même manière que la régression
Faux ! L’ANOVA est une extension de la régression
La seule différence c’est le nombre de régressions
Mon amie me dit : Tu fais une ANOVA ? pourquoi ne pas faire plusieurs test-t ?
Si on fait plusieurs test-t, on risque d’augementer l’erreur de type 1 : À chaque test statistique, nous avons 5% de chance d’erreur, les 5% s’additionnent, donc le % d’erreur ne fait qu’augmenter, tout comme la possibilité d’une erreur de type 1
Vrai ou faux : L’ANOVA empêche à 100% une erreur de type 1
Faux !
Que nous dis l’ANOVA
L’hypothèse nulle dans l’ANOVA
Il n’y aura aucune différence entre les moyennes
Vrai ou faux : Il suffit d’un seul groupe suffisament différent pour que l’ANOVA soit significative
Vrai
Que nous dis L’ANOVA
L’hypothèse expérimentale dans l’ANOVA
Il y a une différence entre les moyennes
Qu’est-ce qu’un test omnibus ?
C’est l’ANOVA : Un test omnibus est un test statistique utilisé pour vérifier si au moins une différence significative existe entre plusieurs groupes, sans préciser où se trouve cette différence. Il sert souvent de test global avant d’effectuer des comparaisons plus spécifiques.
Vrai ou Faux : Lorsqu’il y a une différence entre les moyennes (test ANOVA significatif), cela implique que la différence est entre chaque moyennes
Faux : Il peut y avoir une différence entre les moyennes, mais pas nécessairement pour tous les groupes. L’ANOVA nous indique qu’il y a une différence globale entre les moyennen
On a besoin des contrastes ou post-hoc
Définition
SST : Somme des carrés totale
Comment la calculer ?
Elle représente à quel point les données individuelles s’écartent de la grande moyenne.
Calcul : (Chaque score individuels - GM)2/ N-1
Définition
SSM : La somme des carrés du modèle
Représente la part de la variation totale (SST) qui est due à notre manipulation expérimentale, donc aux différences sytématiques entre les groupes
Définition
SSR : Somme des carrés résiduelle
Représente la part de la variation totale (SST) qui est due aux différences individuelles ou autres facteurs, donc aux différences non-systématiques entre les groupes
Définition
Ratio F
La comparaison entre la variance expliquée par le modèle (SSM) et la variance résiduelle (SSR)
Dans une ANOVA, on peut dire que le résultat est plus probable d’être significatif si ….
A) Si le modèle (SSM) explique le moins de la variabilité qu’il n’en explique, alors la manipulation expérimentale a un effet important sur le résultat.
B) Si le modèle (SSM) explique le plus de la variabilité qu’il n’en n’explique pas, alors la manipulation expérimentale a un effet important sur le résultat.
C) Si le résiduel explique le plus de la variabilité qu’il n’en explique pas, alors la manipulation expérimentale n’a pas un effet important sur le résultat.
D) A et C
E) Toutes ces réponses
F) Aucunes de ces réponses
B) Si le modèle explique le plus de la variabilité qu’il n’en n’explique pas, alors la manipulation expérimentale a un effet important sur le résultat.
Dans une ANOVA, on peut dire que le résultat est plus probable d’être non significatif si ….
A) Si le modèle (SSM) explique moins de variabilité qu’il n’en explique
B) Si le modèle (SSM) explique le plus de la variabilité qu’il n’en n’explique pas
C) Si le résiduel explique le plus de la variabilité qu’il n’en explique pas
D) A et C
E) Toutes ces réponses
F) Aucunes de ces réponses
D) A et C
Calcul
Quel est la valeur du SST, si le SSM = 20.30 et le SSR = 23.60 ?
(SSM) 20.30 + (SSR) 23.60 = 43.73
Quelle est la valeur du SSR si le SST = 37.90 et le SSM = 19.40 ?
A) -18.5
B) 57.30
C) 18.50
D) Il est impossible de savoir sans SPSS
C) 18.50
Qu’est-ce qui affecte les SSM et SSR et qui explique la raison pour laquelle on utilise le ratio F ?
La taille de l’échantillon, donc on utilise la ratio F, puisqu’il ne dépend pas des mesures.
Si j’additionne tous les scores du groupe B, je calcul donc :
A) La grande moyenne
B) La petite moyenne
C) L’écart-type de la variance
B) La petite moyenne
Si je soustrait chaque score à la grande moyenne et que je divise le tout par N-1, j’obtiens :
A) La grande moyenne
B) La variance
C) La grande variance
C) La grande variance
Si la moyenne de groupe est une meilleure prédiction que la grande moyenne, cela signifie généralement que :
A) Les groupes sont bien différenciés les uns des autres.
B) La SSM (variance expliquée/systématique) est élevée.
C) La SSR (variance résiduelle) est plus faible, car les observations sont relativement proches de leur moyenne de groupe.
D) Toutes ces réponses
D) Toutes ces réponses
Vrai ou faux : Si la moyenne des groupes prédit mieux Y que la grande moyenne, mon résultat du ratio F risque d’être significatif
Vrai
J’ai trois groupes de 5 participants chacun, et je souhaite calculer les degré de liberté total pour connaître quel nombre soustraire à 1 (N-1)
(5+5+5) -1, donc 15 -1 = 14
Comment calculons-nous la SSM ?
Nombre de participants du groupe multiplié par (petite moyenne groupe - GM)2
5(2.2-3.467)2
Pour quelle raison devons-nous multiplier le nombre de participants dans le calcul de la SSM ?
L’ANOVA ne traite pas tous les groupes comme égaux, mais plutôt proportionnellement à leur taille, il faut donc multiplier leur taille.
Quel est le calcul du degré de liberté pour la SSM ?
SSM/DLm = SSM/K-1
K = nombre de groupe
Ex. 3 -1 = 2
Comment calcul-t-on la SSR ?
(Chaque score - sa petite moyenne)2/ N-1 (donc le dlr)
Comment calcul-t-on le dl pour le calcul de la SSr ?
DLr = dlgroupe1 + dlgroupe2 + dlgroupe 3
(n -1) + (n-1) + (n-1)
n= le nombre de participant dans le groupe. Ex. (5-1) + (5-1) + (5-1)
Qu’est-ce qui dicte les hypothèses à priori ?
La théorie !
Quelles sont les 5 règles de codification
- On compare des groupes codées positivement à des groupes codés négativement
- La somme des codes doit toujours donner 0
- Si un groupe est exclu de la comparaison, alors lui attribuer 0
- Si un groupe est exclu, alors il ne peut plus être inclus
Si je souhaite faire un contraste entre placebo, et la combinaison du groupe 1 et groupe 2, quels seraits leur codes ?
placebo : -2
Groupe 1 : 1
Groupe 2 : 1
Si je fais un contraste entre le placebo et la combinaison du groupe 1 et 2, en allant voir la valeur de contraste, j’aurais la valeur de la différence des moyennes ?
Non ! : C’est seulement si le contraste compare deux groupes avec des coefficients (+1,−1, 0), alors sa valeur est exactement la différence de moyennes
Vrai ou faux : si tu codifies les groupes avec −1,1,0, alors la valeur du contraste sera exactement égale à la différence de moyennes entre les deux groupes concernés.
Vrai !
Vrai ou faux : Les coefficients
−0.5,0.5,0 ne produisent pas la même différence de moyennes que −1,1,0
FAUX : tu compares encore un seul groupe à un autre, donc le contraste est la même valeur que la différence de moyenne
Si on change les coefficients du contraste en les multipliant par 10, donc que -2, 1, 1 devient -, 20, 10, 10 qu’arrive-t-il à :
La différence de moyenne, la valeur de t, la valeur du contraste, le seuil de signification ?
La différence de moyenne : reste la même
La valeur de t : reste la même
La valeur du contraste : multilpliée par 10
Le seuil de signification : reste le même
Les valeurs t ne sont pas affectés par les unités de mesures
À quel moment peut-on faire des tests post-hoc ?
Après la recherche, on pourrait comparer chaque moyennes entre elles
Dans la correction de ____, on divise l’alpha (0.05) par le nombre de tests.
Bonferonni
Test libéral : tolère beaucoup d’erreur de type ____
Test libéral : tolère très peu l’erreur de type ____
Test conservateur : tolère très peu l’erreur de type ____
Test conservateur : tolère beaucoup l’erreur de type ____
Test libéral : tolère beaucoup d’erreur de type 1
Test libéral : tolère très peu l’erreur de type 2
Test conservateur : tolère très peu l’erreur de type 1
Test conservateur : tolère beaucoup l’erreur de type 2
Avec un très petit échantillon, un test ____ est préférable, alors qu’avec un grand échantillon et des variables importantes, un test ____ est préférable.
Libéral ou conservateur
Avec un très petit échantillon, un test libéral est préférable, alors qu’avec un grand échantillon et des variables importantes, un test conservateur est préférable.
Pour les mêmes différences de moyennes, il est plus ____ d’être significatif avec la correction de bonferonni
Pour les mêmes différences de moyennes, il est plus difficile d’être significatif avec la correction de bonferonni
Si mon seuil de signification au bonferonni est à 0.008, combien ai-je fais de tests ?
6.25 : 0.05/ 0.008
Si je suis significative suite à la correction de bonferroni, est-ce que je suis significative à mon LSD ?
Always queen
Vrai ou faux : Faire des tests LSD, équivaut à faire des contrastes dans toutes les directions, donc grand risque de l’erreur de type 2
Faux : Vrai ou faux : Faire des tests LSD, équivaut à faire des contrastes dans toutes les directions, donc grand risque de l’erreur de type 1