Cours 6 : Comparaison de variables numériques = comparaison de moyennes Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Pour quelle raison est-ce que beaucoup de tests de comparaison de moyennes sont basés sur la distribution de student?

A

Parce que l’intervalle de confiance autour d’une moyenne estimée à partir d’un échantillon est obtenu à partir de cette loi de distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qui-suis-je? « Je compare les moyennes des réponses à deux traitements du même échantillon issu d’une population normalement distribuée. »

A

Le test de t pour 2 échantillons appariés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les conditions à respecter pour pouvoir effectuer un test de t pour 2 échantillons appariés?

A
  1. L’échantillonnage des paires de valeurs est indépendant et aléatoire
  2. Les différences entre les paires de valeurs sont distribuées normalement dans la population échantillonnée

(comme pour les autres tests)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les variables que l’on doit connaître pour faire la statistique de test t pour des échantillons appariés?

A
  1. L’effectif de l’échantillon n
  2. La moyenne des différences entre les deux traitements d¯
  3. L’écart-type des différences S
    .
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nommez des exemples d’expériences qui donnent des résultats appariés.

A
  • Comparer le poids de patients avant et après hospitalisation;
  • Comparer la fécondité des bélugas avant et après une perturbation par le bruit causé par le trafic maritime
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment sont formulées les hypothèses statistiques d’un test de Student pour des échantillons appariés?

A

H0 : le traitement n’a pas d’effet sur l’échantillon (d¯=0)

H1 : le traitement a un effet sur l’échantillon (d¯≠0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qui-suis-je? « test de t qui compare les moyennes d’échantillons issus de deux populations différentes. »

A

Test de t pour deux échantillons indépendants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui différencie le test de t pour deux échantillons indépendants par rapport aux autres test de t qui existent?

A

le calcul de l’erreur standard (SE) et du nombre de degré de liberté (dl).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Le test de t pour deux échantillons indépendants a une condition d’application supplémentaire, quelle est-elle?

A

Les variances des variables échantillonnées sont similaires : on parle d’homoscedasticité des variances.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les conditions d’application à respecter pour pouvoir effectuer un test de t pour 2 échantillons indépendants?

A
  1. L’échantillonnage est indépendant et aléatoire (pour chaque échantillon);
  2. Chaque variable échantillonnées est distribuée normalement dans sa population;
  3. Les variances des variables échantillonnées sont similaires : on parle d’homoscedasticité des variances.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment sont formulées les hypothèses statistiques pour un test de Student pour 2 échantillons indépendants?

A

H0 : il n’y a pas de différence entre les moyennes(μ1−μ2=0)

H1 : il y a une différence entre les moyennes (μ1−μ2≠0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou faux : dans le test de t pour 2 variables indépendantes, on utilise la variance conjointe (calculée à partir des 2 échantillons) pour calculer l’erreur standard.

A

Vrai, c’est la première distinction entre ce test de t et les autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est la deuxième distinction entre le test de t pour 2 échantillons indépendants et les autres tests de t?

A

Le nombre de degré de liberté tient compte des deux échantillons.

dl = dl1+dl2 = n1+n2−2

La distribution nulle du test sera donc la distribution de Student correspondant à ce nombre de degré de liberté conjoint.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans quel cas utilisons nous un test de t pour 2 échantillons indépendants?

A

Fréquent dans les études où on ne peut pas vraiment contrôler ou répéter les traitements sur les mêmes individus : Par exemple lorsqu’on compare les réponses de populations d’une même espèce provenant de deux régions différentes, lorsqu’on étudie le poids de bébés à la naissance en fonction de la consommation d’alcool de la mère durant la grossesse, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la pire affaire à faire en statistique?

A

Comparer indirectement les moyennes à la valeur seuil en question (comparaison indirecte)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est la meilleure façon de déterminer si un échantillon est différent d’un autres?

A

Comparer les deux échantillons ensemble directement

17
Q

Quelles sont les 4 options qui s’offrent à nous pour gérer les cas où des données violent les conditions d’application des tests:

A
  1. Ignorer les violations
  2. Transformer les données
  3. Utiliser un test non paramétrique
  4. Utiliser un test numérique de permutation
18
Q

2 tests permettent de poursuivre notre analyse statistique en ignorant les violations, lesquels?

A
  1. Test de Shapiro-Wilk pour déterminer la normalité des données
  2. Test de Levene pour déterminer l’égalité des variances de 2 ou plusieurs échantillons
19
Q

Qui-suis-je? «test d’ajustement d’un jeu de données à la distribution Normale qui aurait la même moyenne et le même écart-type.»

A

test de Shapiro-Wilk

20
Q

Quel est la faiblesse du test de Shapiro-Wilk?

A

plus l’effectif de l’échantillon est grand, plus l’intervalle de confiance est étroit autour de la statistique de test W, et plus il est probable de rejeter H0 même pour de petites variations… le test devient trop puissant !

21
Q

Dans quel cas peut-on ignorer le résultat du test de Shapiro et se fier directement au graphique?

A
  • Si le nombre d’observations est assez grand (environ entre 30 et 50 observations par échantillon)
  • si la distribution n’est pas trop asymétrique (pas de valeur trop extrême etc)
22
Q

Qui-suis-je? « Test qui permet de tester si la variance dans deux groupes (ou plus) est égale (similaire). En d’autres termes, elle permet de tester si nos échantillons présentent un problème d’hétéroscédasticité. »

A

Test de Levene

23
Q

Comment sont formulées les hypothèses statistiques pour un test de Levene?

A

H0: les variances des échantillons étudiés sont similaires
H1: les variances des échantillons étudiés sont différentes

24
Q

Qui-suis-je? « Relation entre deux variables. Je suis aussi représentée par le symbole ~ »

A

Modèle

25
Q

Il arrive que les conditions d’application ne semblent pas remplies (Test de Shapiro et Levene mais leur conclusion reste valide malgré un non-respect des conditions si :

A
  1. Pour la normalité il faut essentiellement que les distributions soient symétriques avec un n>30.
  2. Pour l’égalité des variances, les écarts-types peuvent différer d’un facteur 3 maximum (S2=3×S1).
26
Q

Nommez les 3 types de transformations des données qui existent.

A
  1. Transformation logarithmique
  2. Transformation racine carrée
  3. Transformation arcsinus
27
Q

Qui-suis-je? « Type de transformation qui a souvent pour effet d’aider à obtenir l’égalité des variances entre les groupes, c’est pourquoi c’est la plus répandue et la première essayée »

A

Transformation logarithmique

28
Q

La transformation logarithmique peut s’appliquer à :

A
  • Des masse et taille
  • Des concentrations
  • Toutes les données qui s’étendent sur plusieurs ordres de grandeur
  • Des mesures de ratios / produits de variables ou de taux
  • Des distributions asymétriques (skew négatif)
  • Si le groupe qui a la plus grande moyenne a aussi la plus grande variance.
29
Q

Dans quel cas est-ce qu’on ajoute 1 à nos données avant de les transformer en log?

A

Si une ou plusieurs valeurs de l’échantillon sont nulles (=0)

30
Q

Qui-suis-je? « Transformation efficace lorsque Y
est une donnée d’énumération. Elle peut entre autres s’appliquer à des données du type nombre de proies capturées ou nombre d’oeufs pondus »

A

Transformation racine carrée

31
Q

Qui-suis-je? « Transformation utilisée presque exclusivement pour des proportions parce que les valeurs de proportions ne sont pas distribuées normalement (forcément comprises entre 0 et 1) et des échantillons avec des moyennes de proportions différentes ont tendance à avoir des variances différentes.

A

Transformation arcsinus

32
Q

Qui-suis-je? « tests qui ne font pas appel à une fonction de densité de probabilité calculée avec des paramètres (moyenne, écart-type, etc.) comme distribution nulle et qui travaillent avec les rangs des valeurs (et non les valeurs elles-mêmes) »

A

Tests non paramétriques

33
Q

Vrai ou faux : Puisqu’ils sont moins contraignants, les tests non paramétriques sont moins bons que les autres tests.

A

Faux, ils sont juste un peu moins puissants

34
Q

Dans quel cas devons-nous faire le test des rangs signés de Wilcoxon?

A
  1. Lorsqu’on ne peut pas admettre de distribution paramétrique sous-jacente aux données;
  2. L’échantillon est indépendant et aléatoire (cette condition est valable pour TOUS les tests).
35
Q

Quel est le test non-paramétrique alternatif pour 2 échantillons appariés?

A

Test des rangs signés de Wilcoxon

36
Q

Quel est le test non-paramétrique alternatif pour 2 échantillons indépendants ?

A

Test de Mann-Whitney

37
Q

Quelles sont les différences et les similarités entre les tests de Wilcoxon et de Mann-Whitney?

A

Similarités : toutes les valeurs sont classées en ordre croissant et on leur attribuent un rang.

différences : Dans le cas de Mann-Whitney, on mélange toutes les valeurs ensemble avant de leur attribuer un rang, puis on fait la somme des rangs pour chaque échantillon.