ANOVA Et Comparaisons Ou Tests Multiples (1) Flashcards
À quoi sert l’ANOVA?
Comparaison de plusieurs groupes pour savoir s’ils diffèrent
Quelle est la logique de l’ANOVA?
Comparaison de la variance inter-groupes et la variance intra-groupes
Quelles sont les conditions d’application de l’ANOVA?
- Homogénéité des variances (test de Levene ou d’O’Brien)
- Normalité (les données sont distribuées normalement pour chaque groupe). On appelle souvent cette condition normalité de l’erreur
3.Indépendances des observations (les scores ne s’influencent pas l’un l’autre)
Qu’est-ce que la variance inter-groupe?
Selon le théorème central limite, il existe un rapport entre la variance de la population et la variance d’une distribution d’échantillonnage de la moyenne :
S2x=oe2/n (soit, variance de l’échantillon = variance de la population estimée / nb d’observations)
Avec les groupes qu’on compare, on dispose d’une distribution d’échantillonnage de la moyenne. SI tous ces groupes proviennent de la même population alors la variance estimée de la population obtenue à l’aide des échantillons devrait être bonne.
Qu’est-ce que la variance intra-groupe?
La variance de chaque échantillon peut être utilisée comme estimation de la variance de la population. Si les variances intra-groupes sont homogènes, alors la variance estimée de la population(moyenne de la variance de chaque groupe) devrait être bonne.
V/F Lorsque les contions d’application de l’ANOVA et que toutes les observations proviennent de la même population, les variances intra et inter groupes ont similaires
VRAI, on vérifie cela en faisant un rapport F entre la variance inter et intra et on observe les probabilité s’avoir un tel rapport sous H0
Quelle équation permet de décrire un score selon la logique de l’ANOVA?
Xij = μ + tj + Eij
X: score
i: une certaine valeur
j: un certain groupe
μ: moyenne population
Tj: contribution groupe appartenance
Eij: contribution personnelle
Décris la logique de l’ANOVA selon l’équation de description du score
- Calcul de la variance qui tient compte de la variabilité individuelle ET de la contribution du groupe , donc (E + t)
- Calcul de la variance qui tient compte de la variabilité individuelle seulement (E)
- Comparaison des deux à l’aide d’un rapport F = (T+E)/E
Si les groupes sont égaux, alors T = 0
Quel sont les synonymes de Scinter et de Sc intra?
- Inter: traitement
- Intra: erreur
En quoi se divise le Sctotal?
Scinter et SC erreur
Comment trouve-t-on le nb de dl (1) total, (2) inter et (3) intra?
Total: dl=N-1
Inter: dl= K-1
Intra: dl = K (n-1)
Comment calcule t’on les SC?
Total: Sommation du (score total - moyenne) de chaque individu
Inter: nb d’observations multiplié par sommation (moyenne du groupe-moyenne totale) de chaque groupe
Intra: Sctotal-scinter
V/F Les calculs de l’ANOVA sont très sensibles aux erreurs d’arrondissement
VRAI
Comment sont calculés les CM inter et intra?
CM inter = Scinter/dlinter
CM intra= Scintra/dlintra
Comment calcul-t-on le F
F = CMinter/CMintra
Lorsque le F calculé est…. que le F critique, les groupes diffèrent
PLUS GRAND
Quand le p associé au F calculé est…. que le seuil alpha, il y a une différence significative entre les groupes
Plus petit
Quelle taille d’effet est utilisée pour l’ANOVA? Que signifie-t-elle et comment la calcule-t-on?
L’état carré (n^2). Elle représente la proposition de la variabilité expliquée par l’appartenance au groupe
n^2=Sc inter/SCtotal
V/F L’ANOVA est un procédé robuste.
Qu’est-ce que cela signifie?
Vrai, c’est à dire qu’elle n’est pas trop sensible aux écarts à ses conditions d’utilisation, surtout pour Normalité et homogénéité des variances (on peut aller jusqu’à la plus grande variance 4X plus élevée que celle la plus petite)
CEPENDANT, si les n des échantillons diffèrent, l’anova est - robuste (si on pense que variance seront non homogène, s’arranger pour avoir échantillons tailles égales)
À quoi servent les test de comparaisons multiples?
L’ANOVA permet de dire s’il y a au moins une différence entre les groupes, mais ne permet pas de dire où se situe cette différence. C’est pour ça qu’on fait des tests de comp. multiples.
Quel est le défi principal des comparaisons multiples?
Plus on fait de test stats, plus on augmente la probabilité de faire une erreur de type 1 sous H0 (soit trouver un effet lorsqu’il n’y en a pas).
Comment calcule-t-on la probabilité de faire une erreur de type 1 selon le nb de tests effectués?
p(au moins une erreur type 1)=1-p(aucun test significatif)
OU
p(au moins une erreur type 1)=1- (1-a)^k
Ici, a est le niveau alpha et K le nb de tests effectués
Comment fait-on pour diminuer les probabilités de faire une erreur de Type-1 lors des tests de comparaison multiple?
Utilisation de procédures de contrôle du taux d’erreur (multiplicity control)
Dans quels contextes fait-on des comparaisons multiples (6)? Lequel s’applique à l’ANOVA?
- Vérification du niveau de base (tester que deux groupes sont égaux sur plusieurs caractéristiques avant de commencer une étude)
*2. Multiples groupes ou multiples mesures (vérifier s’il existe des différences entre plusieurs groupes sur un certain nb de mesures) (POUR ANOVA)
3.Certaines procédures statistiques ( les régressions multiples et ANOVAS factorielles produisent plusieurs p)
4.Data peeking (mauvaise pratique): faire analyse pour voir si on doit recruter plus de participants pour avoir résultats significatifs (bonne pratique = calculer taille effet pour bonne puissance avant étude) - Analyses intérimaires (analyses sont planifiées avant la fin d’étude pour voir si on termine + tôt)
- Expéditions de pêche🎣: recherches non planifiées de différences entre groupes ou analyses de sous-groupes non planifiées