Séance 7 : Test inférentiel sur deux moyennes Flashcards
Test T pour échantillons indépendants et dépendants
Quel est le but de comparer deux moyennes ? Quelle question on vise à répondre ?
Est-ce que les deux échantillons proviennent de la même
population de scores ou de deux populations distinctes ?
= voir si elles diffèrent entre elles
Que sont des échantillons indépendants?
deux échantillons composés d’individus DIFFÉRENTS
qui sont tous évalués sur une même mesure (la VD).
Les observations du premier échantillon n’influencent pas
les observations du deuxième échantillon. (pas parce que on a eu ça au premier qu’on va avoir ça au 2e)
Donne 1 exemple d’études effectuées sur des échantillons indépendants.
On évalue la qualité des soins psychiatriques reçus dans
deux institutions différentes: Institut universitaire en santé
mentale de Québec et Institut universitaire en santé
mentale de Montréal.
Échantillons indépendants ou dépendants :
On teste l’efficacité d’un somnifère en comparant un
groupe expérimental (somnifère actif) à un groupe
contrôle (placebo).
Que sont des échantillons dépendants?
Les observations du premier échantillon affectent celles du
deuxième échantillon, car les échantillons sont LIÉS.
Quels sont les 2 cas d’échantillons dépendants possibles?
1.Les mêmes personnes sont mesurées à 2 reprises sur une
même variable dépendante (pré-test/post-test OU mêmes individus sur toutes les conditions de l’expérience)
- Les individus de chaque échantillon sont mesurés à une
seule reprise, mais ils sont APPARIÉS (pairés) en fonction de plusieurs caractéristiques importantes (âge, genre, scolarité, revenu, QI, etc.).
=> On considère les individus appariés comme étant une
seule personne d’un point de vue statistique.
Exemple d’échantillon dépendant de cas 1.
On mesure le niveau d’anxiété sociale d’un groupe de personnes avant et après un traitement
On compare la mémorisation de chiffres et d’images chez un
même groupe d’individus.
Exemple d’échantillon dépendant de cas 2.
Une étude qui compare l’efficacité de deux traitements pour arrêter de fumer; les participants des deux groupes sont
appariés quant à l’âge, au genre, au nombre d’années
passées à fumer, et au nombre de paquets de cigarettes
fumés par semaine (comme si tous jeunes était 1 : jeune. tous vieux 1 vieux.)
=> fek jeune dans traitement 1 comme si c’était le m jeune dans traitement 2 mais participants différents
À quoi sert le test T pour échantillons indépendants?
Ce test inférentiel vise à comparer deux moyennes
provenant d’échantillons distincts sur une même
variable (la VD).
Indépendants ou dépendants ?
Une étude qui compare le temps de descente d’une piste de
ski en fonction du type de neige (poudreuse, compacte).
Participants appariés pour âge, genre et expertise.
V ou F : En prélevant 2 échantillons indépendants, il est fort
probable que les 2 moyennes d’échantillon diffèrent
quelque peu même si elles proviennent de la même
population de scores
Vrai, mais nous on cherche à savoir :
Cette différence est-elle suffisamment grande pour
permettre de conclure que les 2 échantillons
proviennent vraiment de populations différentes ?
Lorsqu’on compare la moyenne de deux échantillons
indépendants, qu’estime-t-on?
La probabilité (p) d’observer la
différence de moyennes obtenue lorsque H0 est vraie à l’aide de la distribution d’échantillonnage des différences
de moyennes.
Obtenir cette différence si H0 est vraie… si p est petite, trop rare, la différence est significative
Quelle distribution va-t-on utiliser pour comparer la moyenne de deux échantillons indépendants?
Distribution du T de Student possèdant:
ddl : n1 + n2 – 2
Une moyenne mu1 - mu2 (toujours égal à 0 sous H0);
Quel est le calcul du t en bref (n égaux)?
similaire à celui utilisé pour le test t sur un échantillon avec une adaptation de la formule
numérateur : différence de moyenne
dénominateur : racine carrée de l’addition des variances/nbr participants
Quelle est la particularité avec des n inégaux?
On doit tenir compte du nombre d’observations ayant
servi à estimer chaque écart-type.
Donc, on utilise s^2p qui est une somme des variances pondérées par
les degrés de liberté; donc qui tient compte de la
taille de chacun des échantillons.
Explique l’étape 1 de la D.I. pour Test T sur éch. ind. À LA MAIN
Identifier les hypothèses statistiques
le test peut être soit unilatéral :
on prédit la direction de l’effet (un plus grand que l’autre)
bilatéral : on ne prédit pas, seulement h0 pareil,h1 différent
Explique l’étape 2 de la D.I. pour Test T sur éch. ind. À LA MAIN
Spécifier le seuil de signification alpha (α)
Spécifier si unilatéral ou bilatéral
Explique l’étape 3 de la D.I. pour Test T sur éch. ind. À LA MAIN
a. choix du test : test t sur échantillons indépendants
b. conditions d’utilisation :
- 2 échantillons indépendants
- normalité de la distribution
- VD sur échelle intervalle ou ratio
- homogénéité des variances
c. distribution d’échantillonnage du T de student avec (n1 + n2 -2)
d.calculs :
T obs : donné
Explique l’étape 4 de la D.I. pour Test T sur éch. ind. À LA MAIN
manière de comparer
Décision statistique (est-ce que la valeur observée de T est rare ou fréquente quand H0 est vraie)
Tcrit: aller dans la table T (alpha et degrés de liberté)
bilat :ajuster le +/- à notre test
unilat: ajuster le +/- à l’hyp alternative (si on s’attend à plus haut, prend + et vice versa)
comparer le Tobs au T crit(si dans zone de rejet, on rejette H0)
t obs(ddl) = 20 > t crit(ddl) = 18
Explique l’étape 5 de la D.I. pour Test T sur éch. ind. À LA MAIN
Conclusion selon le contexte (avec le significativement)
ex: On conclut que les jeunes fumeurs ne consomment pas
significativement plus de cigarettes que les fumeurs âgés.
Que vérifie le test de Levene? Comment l’interpréter ?
Il vérifie le postulat d’homogénéité des variances.
Si le test n’est pas significatif (sig. > .05):
• Les variances ne diffèrent pas (elles sont donc homogènes!).
• Dans ce cas, on utilise la ligne du haut pour lire le test t (Hypothèse
de variances égales)
Si le test est significatif (sig. ≤ .05):
• Les variances diffèrent (elles sont hétérogènes).
• Dans ce cas, on utilise la ligne du bas pour lire le test t (Hypothèse
de variances inégales) -> avec une correction
Veut-on que le test de Levene soit significatif ou non?
Non, sinon ça veut dire que les variances diffèrent, qu’elles sont hétérogènes et le postulat n’est pas respecté
Que doit on faire quand notre test est unilatéral et SPSS sort bilatérale ?
Diviser le p par 2
Etape 4 sur SPSS. (seule diff plus calculs : SPSS)
t(ddl) = 2.00. p = 0.025 > alpha = 0.01. On ne rejette pas H0.
À quoi sert le test T pour échantillons dépendants?
Comparer deux moyennes
provenant d’échantillons liés:
- Soit un même individu mesuré à 2 reprises;
- Soit 2 individus appariés sur certaines
caractéristiques, considérés comme un seul et
même individu.
Quel est le test le plus efficace entre indépendants et dépendants?
Le test T pour échantillons dépendants, car dans le test pour échantillons indépendants, on pondère
la différence de moyennes par la variabilité dans les
données (tenant compte des différences individuelles)
=> ce qui fait augmenter le T
Plutôt, Avec le test t pour échantillons dépendants, on évite ce problème en s’intéressant à la moyenne des différences D barre
plutôt qu’à la différence entre les moyennes (qui tient
compte des différences individuelles).
(inverse : 1 différence des moyennes vs moyenne des différences)
=> on travaille avec une seule moyenne (la moyenne des différences)
*peu importe la variabilité des scores à l’intérieur des échantillons,D reste pareil
*Quand on élimine la variabilité due aux différences
individuelles, la variabilité (Sd vs Sp au dénominateur tend à être
réduite et la valeur du t tend ainsi à augmenter.
*Avec un t plus grand, il y a plus de chance de rejeter H0,
on augmente donc la puissance statistique.
besoin d’un enregistrement vocal plz
En bref le calcul du T dépendants et quelle distribution
calcul identique que test t sur 1 échantillon, mais on travaille avec la moyenne et l’écart-type des différences entre les moyennes
Distribution d’échantillonnage pareil que test t pour un échantillon (avec n-1 ddl)
Étape 1 test t sur éch dep A LA MAIN
Idem que ind
Étape 2 test t sur éch dep A LA MAIN
Idem que ind
Étape 3 test t sur éch dep A LA MAIN
a. choix du test : test t sur échantillons dépendants
b. conditions d’utilisation :
- 2 échantillons dépendants
- normalité de la distribution
- VD sur échelle ratio ou intervalle
c. Distribution d’échantillonnage du t de Student avec n-1 ddl
d. calculs : T obs (donné)
Étape 4 test t sur éch dep A LA MAIN
décision statistique
tcrit dans table t
=> attention aux memes trucs que ind
décision pareille que ind (si zone de rejet…)
tobs(14) = 5,00 > tcrit(14) = 4.00. On rejette H0.
Étape 5 test t sur éch dep A LA MAIN
Conclusion selon le contexte (si post-pré test : après) -> avec le significativement
On conclut que le niveau d’affirmation de soi est
significativement plus élevé après le programme.
V ou F : Dans SPSS, moyenne et écart-type sont les statistiques descriptives de l’échantillon.
Faux, c’est la moyenne et l’écart type de la distribution des différences de moyennes. Dbarre et Sd
Étape 4 avec spss dépendants
Idem que ind.
T(14)= 2.361. p = 0.33/2 = 0,0165 < alpha = 0,05. On rejette H0.
seule diff sauf calculs : SPSS
V ou F : on rejette automatiquement H0 si p < alpha
Faux, il faut s’assurer que la différence observée va dans le sens de notre hypothèse alternative. (que H1 est vraie, pas H0)