Cours 6 - Comparaisons de variables numériques: comparaisons de moyennes Flashcards

1
Q

Quand doit-on utiliser le Mann-Whitney U-Test?

A

Lorsqu’on analyse deux échantillons indépendants et que, même après avoir transformées les valeurs, les deux distributions ne sont pas normales (ou l’échantillon est trop petit).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quand doit-on utiliser le Test de t corrigé de Welch?

A

Lorsqu’on analyse deux échantillons indépendants et les distributions sont normales (soit avant ou après transformation), mais les variances ne sont pas égales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quand doit-on utiliser le test de t?

A

3 scénarios possibles:

  1. On analyse deux échantillons indépendants et les distributions sont normales (soit avant ou après transformation) et les variances sont égales.
  2. On compare une moyenne à une valeur et que les distributions sont normales (soit avant ou après transformation)
  3. On compare deux échantillons appariés et la différence des valeurs suit une distribution normale (soit avant ou après transformation)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quand doit-on utiliser un sign-test ou le test Wilcoxon signed-rank test?

A

2 scénarios possibles:

  1. On compare une moyenne à une valeur et que les distributions ne sont pas normales (même après transformation)
  2. On compare deux échantillons appariés et la différence des valeurs ne suit pas une distribution normale (même après transformation)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que le test de t pour un échantillon?

A

Un test qui compare la moyenne d’un échantillon à une valeur proposée comme hypothèse null H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que sont les conditions d’application du test de t?

A
  1. L’échantillonage est indépendant et aléatoire (comme pour tout test)
  2. La variable mesurée est distribuée normalement dans la population.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quand peut on dire qu’un test est apparié?

A

Quand les deux traitements sont appliqués sur la même unité d’échantillonage. Les deux jeux de mesures ne sont donc pas indépendants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la formule pour le test de t? Que représente chaque valeur?

A
t = (T - mu0) / SE, où
t = valeur du test t
T = moyenne de l'échantillon
mu0 = moyenne selon l'hypothèse nulle
SE = erreur standard
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi utiliser le test de t pour échantillons appariés?

A
  • Surtout dans des tests experimentales
  • Ce design permet de minimiser l’influence des autres facteurs, qui ne sont pas à l’étude mais qui peuvent influencer les résultats
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que sont les conditions d’application du test de t pour échantillons appariés?

A

Les mêmes que les conditions d’application du test de t régulier (échantillonage indépendant et aléatoire, différence calculée est distribué normalement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que l’hypothèse nulle quand on applique un test de t pour deux échantillons indépendants?

A

Qu’il n’y a pas de différence entre les deux moyennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la formule pour le test de t pour deux échantillons indépendants? Que représente chaque variable?

A

t = (X_1 + X_2) / SEp, où
t = statistique de test
X_ (1 ou 2) = moyenne de X(1 ou 2) (la bar devrait être par dessus le X)
SE = erreur standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est la formule pour les degrés de liberté pour le test de t pour deux échantillons indépendants? Que représente chaque variable?

A
dl = dl1 + dl2 = n1 + n2 - 2, où
dl = degrés de liberté total
dl1,2 = degrés de liberté de 1 et 2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que sont les conditions d’application du test de t pour deux échantillons indépendants?

A
  1. L’échantillonage est indépendant et aléatoire (comme pour tout test)
  2. Chaque variable échantillonée est distribuée normalement dans la population.
  3. Les variances des échantillons sont similaires.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que sont les méthodes pour gérer les violations de conditions d’applications?

A
  1. Ignorer les violations
  2. Transformer les données
  3. Utiliser un test non paramétriques
  4. Utiliser un test numérique de permutation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels tests peut-on utiliser pour vérifier si nos données respectent les conditions d’applications?

A
  1. Le test de Shapiro-Wilk pour vérifier la normalité

2. Le test de Levene pour vérifier l’égalité des variances de deux ou plus d’échantillons.

17
Q

Dans quel conditions peut-on ignorer le resultat du test Shapiro-Wilk?

A

Si le nombre d’observations est assez grand et que la distribution n’est pas trop asymétrique, on peut ignorer le resultat du test Shapiro-Wilk.

18
Q

Que sont les types de transformations de données? Laquelle est plus fréquente?

A
  1. Transformation logarithmique (avec log10 ou ln) - celle ci est plus fréquente. La formule est: Y’ = (Y + 1*)
  2. Transformation racine-carrée. La formule est: Y’ = (Y +0.5*)^1/2
  3. Transformation arcsinus. La formule est: sin^-1(racine-carrée de Y).
    * Note: Cette valeur est seulement ajouté s’il y a une valeur égale à 0 dans la distribution.
19
Q

Qu’est-ce qu’un test non paramétrique? Qu’est-ce qui les caractérisent?

A

Un test sur le rang des valeurs, pas sur les valeurs elles-mêmes. Ils sont moins puissants (il est plus difficile à rejetter l’hypothèse nulle), mais ils sont moins contraignants (pas besoin de normalité ou d’égalité des variances)

20
Q

Que sont les types de tests non paramétriques? Décrivez-les brièvement.

A
  1. Test du signe (sign test): compare la médiane d’un échantillon à une moyenne
  2. Test de Wilcoxon des rangs signés: compare des rangs. Plus puisant que le sign test, mais ATTENTION: il faut que les distribution soient à peu près symétrique pour pouvoir l’utiliser.
  3. Test de Mann-Whitney: pour deux échantillons indépendants