Cours 6 : Comparaison de variables numériques = comparaison de moyennes Flashcards
Pour quelle raison est-ce que beaucoup de tests de comparaison de moyennes sont basés sur la distribution de student?
Parce que l’intervalle de confiance autour d’une moyenne estimée à partir d’un échantillon est obtenu à partir de cette loi de distribution.
Qui-suis-je? « Je compare les moyennes des réponses à deux traitements du même échantillon issu d’une population normalement distribuée. »
Le test de t pour 2 échantillons appariés
Quelles sont les conditions à respecter pour pouvoir effectuer un test de t pour 2 échantillons appariés?
- L’échantillonnage des paires de valeurs est indépendant et aléatoire
- Les différences entre les paires de valeurs sont distribuées normalement dans la population échantillonnée
(comme pour les autres tests)
Quels sont les variables que l’on doit connaître pour faire la statistique de test t pour des échantillons appariés?
- L’effectif de l’échantillon n
- La moyenne des différences entre les deux traitements d¯
- L’écart-type des différences S
.
Nommez des exemples d’expériences qui donnent des résultats appariés.
- Comparer le poids de patients avant et après hospitalisation;
- Comparer la fécondité des bélugas avant et après une perturbation par le bruit causé par le trafic maritime
Comment sont formulées les hypothèses statistiques d’un test de Student pour des échantillons appariés?
H0 : le traitement n’a pas d’effet sur l’échantillon (d¯=0)
H1 : le traitement a un effet sur l’échantillon (d¯≠0)
Qui-suis-je? « test de t qui compare les moyennes d’échantillons issus de deux populations différentes. »
Test de t pour deux échantillons indépendants
Qu’est-ce qui différencie le test de t pour deux échantillons indépendants par rapport aux autres test de t qui existent?
le calcul de l’erreur standard (SE) et du nombre de degré de liberté (dl).
Le test de t pour deux échantillons indépendants a une condition d’application supplémentaire, quelle est-elle?
Les variances des variables échantillonnées sont similaires : on parle d’homoscedasticité des variances.
Quelles sont les conditions d’application à respecter pour pouvoir effectuer un test de t pour 2 échantillons indépendants?
- L’échantillonnage est indépendant et aléatoire (pour chaque échantillon);
- Chaque variable échantillonnées est distribuée normalement dans sa population;
- Les variances des variables échantillonnées sont similaires : on parle d’homoscedasticité des variances.
Comment sont formulées les hypothèses statistiques pour un test de Student pour 2 échantillons indépendants?
H0 : il n’y a pas de différence entre les moyennes(μ1−μ2=0)
H1 : il y a une différence entre les moyennes (μ1−μ2≠0)
Vrai ou faux : dans le test de t pour 2 variables indépendantes, on utilise la variance conjointe (calculée à partir des 2 échantillons) pour calculer l’erreur standard.
Vrai, c’est la première distinction entre ce test de t et les autres
Quelle est la deuxième distinction entre le test de t pour 2 échantillons indépendants et les autres tests de t?
Le nombre de degré de liberté tient compte des deux échantillons.
dl = dl1+dl2 = n1+n2−2
La distribution nulle du test sera donc la distribution de Student correspondant à ce nombre de degré de liberté conjoint.
Dans quel cas utilisons nous un test de t pour 2 échantillons indépendants?
Fréquent dans les études où on ne peut pas vraiment contrôler ou répéter les traitements sur les mêmes individus : Par exemple lorsqu’on compare les réponses de populations d’une même espèce provenant de deux régions différentes, lorsqu’on étudie le poids de bébés à la naissance en fonction de la consommation d’alcool de la mère durant la grossesse, etc.
Quelle est la pire affaire à faire en statistique?
Comparer indirectement les moyennes à la valeur seuil en question (comparaison indirecte)