Cours 6 - Comparaisons de variables numériques: comparaisons de moyennes Flashcards
Quand doit-on utiliser le Mann-Whitney U-Test?
Lorsqu’on analyse deux échantillons indépendants et que, même après avoir transformées les valeurs, les deux distributions ne sont pas normales (ou l’échantillon est trop petit).
Quand doit-on utiliser le Test de t corrigé de Welch?
Lorsqu’on analyse deux échantillons indépendants et les distributions sont normales (soit avant ou après transformation), mais les variances ne sont pas égales.
Quand doit-on utiliser le test de t?
3 scénarios possibles:
- On analyse deux échantillons indépendants et les distributions sont normales (soit avant ou après transformation) et les variances sont égales.
- On compare une moyenne à une valeur et que les distributions sont normales (soit avant ou après transformation)
- On compare deux échantillons appariés et la différence des valeurs suit une distribution normale (soit avant ou après transformation)
Quand doit-on utiliser un sign-test ou le test Wilcoxon signed-rank test?
2 scénarios possibles:
- On compare une moyenne à une valeur et que les distributions ne sont pas normales (même après transformation)
- On compare deux échantillons appariés et la différence des valeurs ne suit pas une distribution normale (même après transformation)
Qu’est-ce que le test de t pour un échantillon?
Un test qui compare la moyenne d’un échantillon à une valeur proposée comme hypothèse null H0.
Que sont les conditions d’application du test de t?
- L’échantillonage est indépendant et aléatoire (comme pour tout test)
- La variable mesurée est distribuée normalement dans la population.
Quand peut on dire qu’un test est apparié?
Quand les deux traitements sont appliqués sur la même unité d’échantillonage. Les deux jeux de mesures ne sont donc pas indépendants.
Quelle est la formule pour le test de t? Que représente chaque valeur?
t = (T - mu0) / SE, où t = valeur du test t T = moyenne de l'échantillon mu0 = moyenne selon l'hypothèse nulle SE = erreur standard
Pourquoi utiliser le test de t pour échantillons appariés?
- Surtout dans des tests experimentales
- Ce design permet de minimiser l’influence des autres facteurs, qui ne sont pas à l’étude mais qui peuvent influencer les résultats
Que sont les conditions d’application du test de t pour échantillons appariés?
Les mêmes que les conditions d’application du test de t régulier (échantillonage indépendant et aléatoire, différence calculée est distribué normalement)
Qu’est-ce que l’hypothèse nulle quand on applique un test de t pour deux échantillons indépendants?
Qu’il n’y a pas de différence entre les deux moyennes.
Quelle est la formule pour le test de t pour deux échantillons indépendants? Que représente chaque variable?
t = (X_1 + X_2) / SEp, où
t = statistique de test
X_ (1 ou 2) = moyenne de X(1 ou 2) (la bar devrait être par dessus le X)
SE = erreur standard
Quelle est la formule pour les degrés de liberté pour le test de t pour deux échantillons indépendants? Que représente chaque variable?
dl = dl1 + dl2 = n1 + n2 - 2, où dl = degrés de liberté total dl1,2 = degrés de liberté de 1 et 2
Que sont les conditions d’application du test de t pour deux échantillons indépendants?
- L’échantillonage est indépendant et aléatoire (comme pour tout test)
- Chaque variable échantillonée est distribuée normalement dans la population.
- Les variances des échantillons sont similaires.
Que sont les méthodes pour gérer les violations de conditions d’applications?
- Ignorer les violations
- Transformer les données
- Utiliser un test non paramétriques
- Utiliser un test numérique de permutation