Chapitre 10 : Le test t Flashcards
Pour quelles raisons le test t a-t-il été conçu?
Le test t est spécifiquement conçu et optimisé pour l’inférence de H1 vs H0, lorsque les échantillons disponibles pour l’analyse sont composés d’un “petit” nombre d’observations.
Comment fonctionne le test t?
Le test t compare la différence X1 - X2 à l’erreur d’échantillonnage (erreur-type de la moyenne), mais au lieu d’établir les intervalles de confiance avec la distribution z, il le fera avec une nouvelle distribution, la distribution t.
Le test t est utilisé pour la comparaison entre deux Χ et/ou entre Χ et m.
Pourquoi doit-on faire un test spécifiquement conçu pour des petits échantillons?
Parce que la densité des observations des petits échantillons (la distribution t), n’est pas la même que celle avec des grands échantillons (z).
Quelles sont les trois utilisations (types) du test t?
- Le test t pour “un seul échantillon” : pour déterminer si la moyenne d’un petit échantillon est différente de la moyenne connue de la population (H1 : moy échan. pas égale moy pop)
- Le test t pour “deux échantillons indépendants” (deux groupes au même moment) : pour déterminer si deux petits échantillons ne proviennent pas de la même population (H1 : deux moy des échantillons pas égales)
- Le test t pour “deux échantillons non indépendants”, ou le test t “pairé” : pour déterminer si le même petit échantillon diffère sur la même variable prise à deux moments différents (analyse du changement, H1 : moy pré pas égale moy post)
Avant de choisir quel test faire, quelle est la première question à se poser?
C’est quoi la question de recherche du problème qu’on a devant nous? C’est quoi le mot clé, variable, qui a derrière la question?
Que calculons-nous avec chaque type de test t?
- Échantillon unique : la différence entre la moyenne d’un petit échantillon et celle d’une population ayant une moyenne m connue;
- Échantillons indépendants : la différence entre la moyenne de deux petits échantillons (sans nécessairement connaître m)
- Test t pairé : la différence entre le score moyen post vs pré (ou entre deux variables) pour un unique petit échantillon.
Que compare-t-on dans un test t?
Nous comparons la différence obtenue (Χ - m ou X1 - X2) à la différence «typique» à laquelle nous pourrions nous attendre suite à l’erreur d’échantillonnage (erreur-type de la moyenne).
Si la différence observée est significativement plus grande que la différence «typique» (i.e. l’erreur-type), nous rejetterons H0.
Ainsi, qu’est-ce que les étapes du test t?
- Il faut définir ce qu’est un «petit échantillon».
- Calculer l’erreur type de la moyenne (erreur d’échantillonnage).
- Comparer Χ à m (si connue) ou Χ1 et Χ2 (de deux échantillons indépendants ou pairés).
- Établir la règle décisionnelle permettant (ou non) le rejet de H0.
Que veut dire petit échantillon?
- Le «théorème de la limite centrale» indique que la distribution des Χ des échantillons sera normale à condition que les échantillons contiennent «environ» n = 30. En conséquence : petit n < 30; grand n ≥30.
- Ce critère est approximatif.
- si s² est très grande, n = 30 pourrait être «petit» ou trop peu, alors qu’à l’inverse, si s² est petite, n = 30 pourrait être approprié ou suffisant.
Qu’est-ce que IC et la différence statistique?
- L’erreur type de la moyenne (sx) indique les valeurs que Χ pourrait prendre relativement à m, à cause des différences aléatoires qui font en sorte que les échantillons fluctuent.
- L’intervalle de confiance (IC = Χ ± z * sx) situe la Χ relativement à m, est une procédure appuyée par le théorème de la limite centrale (les Χ d’échantillons extraites de la population sont normalement distribuées).
- Le «théorème de la limite centrale» a été établi a partir de «grands» échantillons (n ≥ 30).
Qu’est-ce qu’implique la distribution t et les petits échantillons?
- Extrémités plus épaisses: les petits échantillons produisent plus fréquemment des Χ très différentes de m.
- Les densités ne sont plus pareilles à celles pour la courbe normale et ils varient dépendant du n des échantillons.
Quelle est la forme de la distribution t?
La distribution t est différente pour les échantillons de différentes tailles (n plus petit = extrémités plus épaisses).
Au fur et à mesure que n augmente, la forme de t ressemble de plus en plus a la distribution z (les extrémités s’amincissent).
Après environ n = 120, les distributions t et z coïncident quasi parfaitement et lorsque n =∞; z = t.
C’est pourquoi les tables de valeurs t sont généralement calculées pour un maximum de 120 dl.
Pourquoi est-ce les extrémités sont plus épaisses plus les échantillons sont petits?
Lorsque les échantillons sont plus petits, les chances sont plus fortes qu’ils auront une Χ plus grande (ou plus petite) que m. Avec un petit n, plus d’échantillons seront loin de m, causant des extrémités plus denses. Cette tendance disparait graduellement avec un accroissement de la taille de n.
Quels sont les implications de la distribution t pour un intervalle de confiance?
Le rejet de H0 implique que l’intervalle de confiance autour de Χ exclut m. Mais avec l’IC traditionnel, (Χ ± zsΧ) 95 % des observations se trouvent à ± 1,96z.
Mais comme nous venons de le voir, pour les petits échantillons, 95 % des observations ne se trouvent pas nécessairement ± 1,96z (à cause des extrémités plus épaisses).
Avec la distribution t, les bornes de l’IC seront différentes pour des échantillons de tailles différentes.
Cela veut dire que 95% des observations ne se trouve pas à+-1,96z.
Avec la distribution t, à quel nombre d’erreur-type se situe la moyenne de 95% des échantillons par rapport à la moyenne de la population?
Avec la distribution t, 95 % des ¯Χ des échantillons extraits de la population se situent a un nombre d’erreurs-type différent de m, dépendamment du nombre d’observations dans les échantillons (n).