Chapitre 10 : Le test t Flashcards
Pour quelles raisons le test t a-t-il été conçu?
Le test t est spécifiquement conçu et optimisé pour l’inférence de H1 vs H0, lorsque les échantillons disponibles pour l’analyse sont composés d’un “petit” nombre d’observations.
Comment fonctionne le test t?
Le test t compare la différence X1 - X2 à l’erreur d’échantillonnage (erreur-type de la moyenne), mais au lieu d’établir les intervalles de confiance avec la distribution z, il le fera avec une nouvelle distribution, la distribution t.
Le test t est utilisé pour la comparaison entre deux Χ et/ou entre Χ et m.
Pourquoi doit-on faire un test spécifiquement conçu pour des petits échantillons?
Parce que la densité des observations des petits échantillons (la distribution t), n’est pas la même que celle avec des grands échantillons (z).
Quelles sont les trois utilisations (types) du test t?
- Le test t pour “un seul échantillon” : pour déterminer si la moyenne d’un petit échantillon est différente de la moyenne connue de la population (H1 : moy échan. pas égale moy pop)
- Le test t pour “deux échantillons indépendants” (deux groupes au même moment) : pour déterminer si deux petits échantillons ne proviennent pas de la même population (H1 : deux moy des échantillons pas égales)
- Le test t pour “deux échantillons non indépendants”, ou le test t “pairé” : pour déterminer si le même petit échantillon diffère sur la même variable prise à deux moments différents (analyse du changement, H1 : moy pré pas égale moy post)
Avant de choisir quel test faire, quelle est la première question à se poser?
C’est quoi la question de recherche du problème qu’on a devant nous? C’est quoi le mot clé, variable, qui a derrière la question?
Que calculons-nous avec chaque type de test t?
- Échantillon unique : la différence entre la moyenne d’un petit échantillon et celle d’une population ayant une moyenne m connue;
- Échantillons indépendants : la différence entre la moyenne de deux petits échantillons (sans nécessairement connaître m)
- Test t pairé : la différence entre le score moyen post vs pré (ou entre deux variables) pour un unique petit échantillon.
Que compare-t-on dans un test t?
Nous comparons la différence obtenue (Χ - m ou X1 - X2) à la différence «typique» à laquelle nous pourrions nous attendre suite à l’erreur d’échantillonnage (erreur-type de la moyenne).
Si la différence observée est significativement plus grande que la différence «typique» (i.e. l’erreur-type), nous rejetterons H0.
Ainsi, qu’est-ce que les étapes du test t?
- Il faut définir ce qu’est un «petit échantillon».
- Calculer l’erreur type de la moyenne (erreur d’échantillonnage).
- Comparer Χ à m (si connue) ou Χ1 et Χ2 (de deux échantillons indépendants ou pairés).
- Établir la règle décisionnelle permettant (ou non) le rejet de H0.
Que veut dire petit échantillon?
- Le «théorème de la limite centrale» indique que la distribution des Χ des échantillons sera normale à condition que les échantillons contiennent «environ» n = 30. En conséquence : petit n < 30; grand n ≥30.
- Ce critère est approximatif.
- si s² est très grande, n = 30 pourrait être «petit» ou trop peu, alors qu’à l’inverse, si s² est petite, n = 30 pourrait être approprié ou suffisant.
Qu’est-ce que IC et la différence statistique?
- L’erreur type de la moyenne (sx) indique les valeurs que Χ pourrait prendre relativement à m, à cause des différences aléatoires qui font en sorte que les échantillons fluctuent.
- L’intervalle de confiance (IC = Χ ± z * sx) situe la Χ relativement à m, est une procédure appuyée par le théorème de la limite centrale (les Χ d’échantillons extraites de la population sont normalement distribuées).
- Le «théorème de la limite centrale» a été établi a partir de «grands» échantillons (n ≥ 30).
Qu’est-ce qu’implique la distribution t et les petits échantillons?
- Extrémités plus épaisses: les petits échantillons produisent plus fréquemment des Χ très différentes de m.
- Les densités ne sont plus pareilles à celles pour la courbe normale et ils varient dépendant du n des échantillons.
Quelle est la forme de la distribution t?
La distribution t est différente pour les échantillons de différentes tailles (n plus petit = extrémités plus épaisses).
Au fur et à mesure que n augmente, la forme de t ressemble de plus en plus a la distribution z (les extrémités s’amincissent).
Après environ n = 120, les distributions t et z coïncident quasi parfaitement et lorsque n =∞; z = t.
C’est pourquoi les tables de valeurs t sont généralement calculées pour un maximum de 120 dl.
Pourquoi est-ce les extrémités sont plus épaisses plus les échantillons sont petits?
Lorsque les échantillons sont plus petits, les chances sont plus fortes qu’ils auront une Χ plus grande (ou plus petite) que m. Avec un petit n, plus d’échantillons seront loin de m, causant des extrémités plus denses. Cette tendance disparait graduellement avec un accroissement de la taille de n.
Quels sont les implications de la distribution t pour un intervalle de confiance?
Le rejet de H0 implique que l’intervalle de confiance autour de Χ exclut m. Mais avec l’IC traditionnel, (Χ ± zsΧ) 95 % des observations se trouvent à ± 1,96z.
Mais comme nous venons de le voir, pour les petits échantillons, 95 % des observations ne se trouvent pas nécessairement ± 1,96z (à cause des extrémités plus épaisses).
Avec la distribution t, les bornes de l’IC seront différentes pour des échantillons de tailles différentes.
Cela veut dire que 95% des observations ne se trouve pas à+-1,96z.
Avec la distribution t, à quel nombre d’erreur-type se situe la moyenne de 95% des échantillons par rapport à la moyenne de la population?
Avec la distribution t, 95 % des ¯Χ des échantillons extraits de la population se situent a un nombre d’erreurs-type différent de m, dépendamment du nombre d’observations dans les échantillons (n).
Quelles sont les conditions pour réaliser un test t?
- Pour faire test t : doit venir d’un petit échantillon qui vient d’une population qui se distribue normalement
- Test t = analyse paramétrique
Comment réalise-t-on un test t pour un seul échantillon?
Nous connaissons la moyenne d’une population (m).
Nous connaissons la moyenne (Χ) et l’écart-type (s) d’un échantillon aussi bien que sa taille (n).
Si nous travaillons avec un «grand échantillon :
- Nous calculons l’erreur type de la moyenne de l’échantillon (sΧ).
- Nous établissons un intervalle de confiance (IC = Χ ± zsΧ).
- Si l’intervalle de confiance exclut m, nous rejetons H0.
Comment calcule-t-on IC pour les petits échantillons?
L’IC traditionnel (IC = Χ ± zsΧ) est déterminé par la densité des observations sous la courbe normale (z) et par l’erreur-type de la moyenne (sΧ).
Mais la distribution des moyennes des petits échantillons est mieux décrite par la distribution «t» que par la distribution z.
Il faut donc substituer «t» à «z». Nous utilisons alors:
Χ + ou - tcritique * sΧ
où tcritique est une valeur qui définit la proportion des valeurs t qui inclus 95 % (ou 99 %, etc.) des valeurs t de la distribution.
Comment peut-on lire le tableau des valeurs critiques de t?
Pour l’instant, concentrons nous sur les valeurs relatives aux hypothèses bidirectionnelles ou bicaudales / non directionnelles.
Rangés = «degrés de libertés» (la taille de l’échantillon -1).
Colonnes = seuil alpha (i.e. le risque d’une erreur alpha).
La valeur tcritique est à l’intersection de la colonne et de la rangée correspondant a l’échantillon (dl = n - 1) et au seuil alpha choisi.
Comment peut-on déterminer ou non le rejet de H0 avec le test t?
Règle décisionnelle pour l’échantillon unique (𝜲 - m)
Il faut d’abord calculer la statistique tobservé.
tobservé correspond à 𝛸 - m: la différence entre la 𝛸 d’un petit échantillon et m.
Il faut ensuite déterminer le tcritique à l’aide du tableau des valeurs critique de la statistique t.
Règle décisionnelle
Si tobservé ≥ tcritique il faut rejeter H0.
Si tobservé < tcritique il faut conserver H0.
En gros, qu’est-ce que le test t pour échantillon unique?
La grande différence entre le test t et le test z pour déterminer si Χ diffère de m se situe au niveau de la distribution (t ou z) utilisée pour déterminer les bornes de l’IC.
Avec la distribution z, le seuil critique a < 0,05 est toujours 1,96 (2,58 pour a < 0,01) mais avec la distribution t, le seuil critique à a < 0,05 sera différent en fonction du n de l’échantillon.
Les valeurs critiques de t pour les n et le seuil alpha peuvent être retrouvées dans des tables.
La comparaison Χ vs m, implique un seul échantillon. Par conséquent nous perdons un seul degré de liberté (n - 1).
Quelles sont les caractéristiques du test t pour deux échantillons indépendants?
Teste la différence entre DEUX petits échantillons.
Très souvent utilisé en sciences sociales, psychologie, médecine, etc., lorsque les n de deux groupes dont on veut comparer la moyenne sont «petits».
Si la différence entre la Χ des deux petits échantillons est plus grande que l’erreur-type de la différence entre les deux Χ, nous concluons le rejet de H0.
Quelle est la logique de base du test t indépendant?
Deux échantillons aléatoires extraits de la même population devraient avoir la même Χ.
C’est-à-dire que s’ils sont semblables et proviennent de la même population, la différence entre les deux Χ ne sera pas plus grande que l’erreur d’échantillonnage / erreur-type.
Il nous faudra donc examiner la différence entre les Χ des échantillons qui sera comparée à la différence à laquelle il faudrait s’attendre à cause de l’erreur d’échantillonnage (i.e. l’erreur-type de la moyenne sΧ).
Comment peut-on déterminer/calculer l’erreur type dans le test t indépendant pour rejeter ou non H0?
Nous avons deux échantillons, chacun étant affecté par l’erreur d’échantillonnage.
Nous nous intéressons à la différence entre les deux Χ :
H1: Χ1 - Χ2 ≠ 0 ; H0: Χ1 - Χ2 = 0.
Le rejet de H0 exige que la différence Χ1 - Χ2 soit plus grande que l’erreur d’échantillonnage de la différence entre les échantillons.
L’erreur d’échantillonnage de la différence est l’erreur type de la différence des moyennes (sΧ1 - Χ 2).
Quelle est la différence «normale» à obtenir, compte tenu des fluctuations d’échantillons?
Donc, on ne s’intéresse pas à l’erreur-type de 𝛸1 ou de 𝛸2 , mais bien de l’erreur type de la différence entre 𝛸1 et 𝛸2 !