Cours 3 Flashcards
Dans quel contexte on doit utiliser l’ANOVA?
Quand il y a plus de deux moyennes indépendantes
Sur quoi porte le test et le calcul de l’ANOVA?
Le test porte sur les MOYENNES, mais le calcul porte sur les VARIANCES.
Hypo alternative de l’ANOVA: quelle est-elle?
Que le X (p.ex., temps moyen) D’AU MOINS UN des groupes devrait être DIFFÉRENT des autres
Autre façon de le dire: AU MOINS DEUX MOYENNES des populations dont proviennent les échantillons de chq groupe diffèrent entre elles.
Quel ratio on calcule pour obtenir notre F?
EFFET / ERREUR
Qu’est-ce qu’on souhaite p/r à la variabilité inter et intra groupes quand on fait un ratio F en ANOVA?
INTERGROUPE: GRANDE VARIATION entre les moyennes des groupes est souhaitée.
INTRAGROUPE: FAIBLE VARIATION des scores à l’intérieur de chaque groupe est souhaitée
Somme des carrés: qu’est-ce que c’est?
Le calcul des différences entre les données observées et la moyenne.
Qu’est-ce que signifie une somme des carrés PETITE? une somme des carrés TRÈS GRANDE?
PETITE: individus très proches de la moyenne
TRÈS GRANDE: individus très éloignés de la moyenne
SC Total: consiste en quoi?
En le calcul des différences entre les données observées et les données de la GRANDE MOYENNE
Grande moyenne: qu’est-ce que c’est?
GRANDE MOYENNE = Moyenne de toutes les données ensemble
SC Résiduel: qu’est-ce que c’est?
Le Calcul des différences entre les données observées et la moyenne du groupe.
Qui suis-je? Je suis synonyme de l’erreur dans le calcul de l’ANOVA?
la somme des carrés RÉSIDUELS (différences entre données observées et moyenne du groupe).
Pk les SC résiduels doivent être petits?
Car c’est la variabilité des données au sein du même groupe (qu’on veut PETITE).
SC Moyen / Modèle: c’est quoi?
Calcul des différences entre les moyennes des groupes et la GRANDE moyenne
En bref, qu’est-ce que veulent dire ces différentes somme des carrés et où se situent la variabilité intra et intergroupe là-dedans?
SCT?
SCR
SCM
SCT: Différences entre données observées et grande moyenne
SCR: Différences entre données observées et moyenne du groupe (VARIABILITÉ INTRA-GROUPE)
SCM: Différences entre moyennes de groupes et grande moyenne (VARIABILITÉ INTER-GROUPE)
En bref, que veut dire la SCT, la SCM et la SCR en termes de variance?
SCT = Variance TOTALE
SCM = Variance EXPLIQUÉE PAR LE MODÈLE
SCR = Variance NON EXPLIQUÉE (o la veut petite, car c’est la variabilité des données au sein d’un même groupe)
Lecture d’une table statistique: comment faire? Quelles 2 infos ça nous prend?
Les degrés de liberté inter (numérateur) et les degrés de liberté intra (dénominateur)
Qu’est-ce que ça veut dire si le ratio F dans l’ANOVA est plus petit que 1?
Veut dire que l’ERREUR est EXTRÊMEMENT GRANDE.. Plus d’erreur que d’effet !
3 conditions d’utilisation pour l’ANOVA?
- Normalité des scores pour chacun des groupes
- Homogénéité des variances pour chacun des groupes
- Indépendance des scores
Particularité pour la normalité des scores dans l’ANOVA?
Chaque groupe doit avoir au moins 20 participants
Q-Q Plot: expliquer la logique en bref et à quelle condition ça permet de vérifier
La distribution symétrique est représentée, sur le graphique, par la ligne. Il y a
plusieurs points sur cette ligne; quand ces points sont sur la ligne, ça veut dire
que ça suit la distribution normale. Si les points sont un peu partout, la distri-
bution N’est PAS normale (voir graphiques suivants)
Ainsi, on doit vérifier cela pour chaque groupe!
Différence entre données EXTRÊMES et données ABERRANTES?
Données ABERRANTES: données qui ne se peuvent pas (p.ex., questionnaire
donne entre 8 et 60 de score, on obtient 65 = ne fonctionne pas)
Données EXTRÊMES: données qui sont rares, mais qui se peuvent!
3 traitements possibles quand il y a des données extrêmes ou aberrantes?
- Vérification / remplacement
- Suppression
- Winsorization ou autre type de tx
Pourquoi c’est pas recommandé de faire des tests t standard entre les moyennes après une ANOVA significative?
Pcq l’erreur de type 1 va devenir gigantesqueeeee = plus de risque de rejeter Ho alors qu’on ne devrait pas
Dans quelles circonstances on fait des tests à posteriori?
Quand on a PAS D’hypothèse sur où se trouvent les différences
Dans quelles circonstances on fait es tests a priori?
Quand ON A des HYPOTHÈSES de l’endroit où se trouvent les différences
Qu’est-ce que sont les contrastes, essentiellement? Qu’est-ce qu’on fait pour les identifier?
on met des +1 et des -1 et des 0 pour identifier quels groupes on compare (COEFFICIENTS DE COMPARAISON) Important que leur somme donne ZÉRO et que la somme en valeur absolue donne 2 (Mais pas une obligation pour cette dernière)
V/F dans les contrastes, on peut faire autant de comparaisons qu’on veut sans que ça affecte l’erreur?
FAUX. Plus on fait de comparaisons, plus il y a un risque d’erreur de type 1.
Deux types de comparaisons: nommer et expliquer en quoi elles consistent
- A PRIORI: compa basée sur hypos spécifiques (énoncées d’avance)
- ORTHOGONALE: besoin de l’indépendance des observations.
En résumé, quels traitements on fait pour l’ANOVA?
- Explorer données : Outliers, normalité, homogénéité ET Boxplots, histogrammes, tests…
- Exécuter le test: post hoc ou contrastes planifiés
- Calculer la taille d’effet