Chapitre 10 : Le test t Flashcards

1
Q

Pour quelles raisons le test t a-t-il été conçu?

A

Le test t est spécifiquement conçu et optimisé pour l’inférence de H1 vs H0, lorsque les échantillons disponibles pour l’analyse sont composés d’un “petit” nombre d’observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment fonctionne le test t?

A

Le test t compare la différence X1 - X2 à l’erreur d’échantillonnage (erreur-type de la moyenne), mais au lieu d’établir les intervalles de confiance avec la distribution z, il le fera avec une nouvelle distribution, la distribution t.
Le test t est utilisé pour la comparaison entre deux Χ et/ou entre Χ et m.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pourquoi doit-on faire un test spécifiquement conçu pour des petits échantillons?

A

Parce que la densité des observations des petits échantillons (la distribution t), n’est pas la même que celle avec des grands échantillons (z).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les trois utilisations (types) du test t?

A
  • Le test t pour “un seul échantillon” : pour déterminer si la moyenne d’un petit échantillon est différente de la moyenne connue de la population (H1 : moy échan. pas égale moy pop)
  • Le test t pour “deux échantillons indépendants” (deux groupes au même moment) : pour déterminer si deux petits échantillons ne proviennent pas de la même population (H1 : deux moy des échantillons pas égales)
  • Le test t pour “deux échantillons non indépendants”, ou le test t “pairé” : pour déterminer si le même petit échantillon diffère sur la même variable prise à deux moments différents (analyse du changement, H1 : moy pré pas égale moy post)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Avant de choisir quel test faire, quelle est la première question à se poser?

A

C’est quoi la question de recherche du problème qu’on a devant nous? C’est quoi le mot clé, variable, qui a derrière la question?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que calculons-nous avec chaque type de test t?

A
  • Échantillon unique : la différence entre la moyenne d’un petit échantillon et celle d’une population ayant une moyenne m connue;
  • Échantillons indépendants : la différence entre la moyenne de deux petits échantillons (sans nécessairement connaître m)
  • Test t pairé : la différence entre le score moyen post vs pré (ou entre deux variables) pour un unique petit échantillon.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que compare-t-on dans un test t?

A

Nous comparons la différence obtenue (Χ - m ou X1 - X2) à la différence «typique» à laquelle nous pourrions nous attendre suite à l’erreur d’échantillonnage (erreur-type de la moyenne).
Si la différence observée est significativement plus grande que la différence «typique» (i.e. l’erreur-type), nous rejetterons H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Ainsi, qu’est-ce que les étapes du test t?

A
  • Il faut définir ce qu’est un «petit échantillon».
  • Calculer l’erreur type de la moyenne (erreur d’échantillonnage).
  • Comparer Χ à m (si connue) ou Χ1 et Χ2 (de deux échantillons indépendants ou pairés).
  • Établir la règle décisionnelle permettant (ou non) le rejet de H0.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que veut dire petit échantillon?

A
  • Le «théorème de la limite centrale» indique que la distribution des Χ des échantillons sera normale à condition que les échantillons contiennent «environ» n = 30. En conséquence : petit n < 30; grand n ≥30.
  • Ce critère est approximatif.
  • si s² est très grande, n = 30 pourrait être «petit» ou trop peu, alors qu’à l’inverse, si s² est petite, n = 30 pourrait être approprié ou suffisant.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que IC et la différence statistique?

A
  • L’erreur type de la moyenne (sx) indique les valeurs que Χ pourrait prendre relativement à m, à cause des différences aléatoires qui font en sorte que les échantillons fluctuent.
  • L’intervalle de confiance (IC = Χ ± z * sx) situe la Χ relativement à m, est une procédure appuyée par le théorème de la limite centrale (les Χ d’échantillons extraites de la population sont normalement distribuées).
  • Le «théorème de la limite centrale» a été établi a partir de «grands» échantillons (n ≥ 30).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’implique la distribution t et les petits échantillons?

A
  • Extrémités plus épaisses: les petits échantillons produisent plus fréquemment des Χ très différentes de m.
  • Les densités ne sont plus pareilles à celles pour la courbe normale et ils varient dépendant du n des échantillons.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la forme de la distribution t?

A

La distribution t est différente pour les échantillons de différentes tailles (n plus petit = extrémités plus épaisses).
Au fur et à mesure que n augmente, la forme de t ressemble de plus en plus a la distribution z (les extrémités s’amincissent).
Après environ n = 120, les distributions t et z coïncident quasi parfaitement et lorsque n =∞; z = t.
C’est pourquoi les tables de valeurs t sont généralement calculées pour un maximum de 120 dl.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pourquoi est-ce les extrémités sont plus épaisses plus les échantillons sont petits?

A

Lorsque les échantillons sont plus petits, les chances sont plus fortes qu’ils auront une Χ plus grande (ou plus petite) que m. Avec un petit n, plus d’échantillons seront loin de m, causant des extrémités plus denses. Cette tendance disparait graduellement avec un accroissement de la taille de n.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quels sont les implications de la distribution t pour un intervalle de confiance?

A

Le rejet de H0 implique que l’intervalle de confiance autour de Χ exclut m. Mais avec l’IC traditionnel, (Χ ± zsΧ) 95 % des observations se trouvent à ± 1,96z.
Mais comme nous venons de le voir, pour les petits échantillons, 95 % des observations ne se trouvent pas nécessairement ± 1,96z (à cause des extrémités plus épaisses).
Avec la distribution t, les bornes de l’IC seront différentes pour des échantillons de tailles différentes.
Cela veut dire que 95% des observations ne se trouve pas à+-1,96z.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Avec la distribution t, à quel nombre d’erreur-type se situe la moyenne de 95% des échantillons par rapport à la moyenne de la population?

A

Avec la distribution t, 95 % des ¯Χ des échantillons extraits de la population se situent a un nombre d’erreurs-type différent de m, dépendamment du nombre d’observations dans les échantillons (n).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les conditions pour réaliser un test t?

A
  • Pour faire test t : doit venir d’un petit échantillon qui vient d’une population qui se distribue normalement
  • Test t = analyse paramétrique
17
Q

Comment réalise-t-on un test t pour un seul échantillon?

A

Nous connaissons la moyenne d’une population (m).
Nous connaissons la moyenne (Χ) et l’écart-type (s) d’un échantillon aussi bien que sa taille (n).
Si nous travaillons avec un «grand échantillon :
- Nous calculons l’erreur type de la moyenne de l’échantillon (sΧ).
- Nous établissons un intervalle de confiance (IC = Χ ± zsΧ).
- Si l’intervalle de confiance exclut m, nous rejetons H0.

18
Q

Comment calcule-t-on IC pour les petits échantillons?

A

L’IC traditionnel (IC = Χ ± zsΧ) est déterminé par la densité des observations sous la courbe normale (z) et par l’erreur-type de la moyenne (sΧ).
Mais la distribution des moyennes des petits échantillons est mieux décrite par la distribution «t» que par la distribution z.
Il faut donc substituer «t» à «z». Nous utilisons alors:
Χ + ou - tcritique * sΧ
où tcritique est une valeur qui définit la proportion des valeurs t qui inclus 95 % (ou 99 %, etc.) des valeurs t de la distribution.

19
Q

Comment peut-on lire le tableau des valeurs critiques de t?

A

Pour l’instant, concentrons nous sur les valeurs relatives aux hypothèses bidirectionnelles ou bicaudales / non directionnelles.
Rangés = «degrés de libertés» (la taille de l’échantillon -1).
Colonnes = seuil alpha (i.e. le risque d’une erreur alpha).
La valeur tcritique est à l’intersection de la colonne et de la rangée correspondant a l’échantillon (dl = n - 1) et au seuil alpha choisi.

20
Q

Comment peut-on déterminer ou non le rejet de H0 avec le test t?

A

Règle décisionnelle pour l’échantillon unique (𝜲 - m)
Il faut d’abord calculer la statistique tobservé.
tobservé correspond à 𝛸 - m: la différence entre la 𝛸 d’un petit échantillon et m.
Il faut ensuite déterminer le tcritique à l’aide du tableau des valeurs critique de la statistique t.
Règle décisionnelle
Si tobservé ≥ tcritique il faut rejeter H0.
Si tobservé < tcritique il faut conserver H0.

21
Q

En gros, qu’est-ce que le test t pour échantillon unique?

A

La grande différence entre le test t et le test z pour déterminer si Χ diffère de m se situe au niveau de la distribution (t ou z) utilisée pour déterminer les bornes de l’IC.
Avec la distribution z, le seuil critique a < 0,05 est toujours 1,96 (2,58 pour a < 0,01) mais avec la distribution t, le seuil critique à a < 0,05 sera différent en fonction du n de l’échantillon.
Les valeurs critiques de t pour les n et le seuil alpha peuvent être retrouvées dans des tables.
La comparaison Χ vs m, implique un seul échantillon. Par conséquent nous perdons un seul degré de liberté (n - 1).

22
Q

Quelles sont les caractéristiques du test t pour deux échantillons indépendants?

A

Teste la différence entre DEUX petits échantillons.
Très souvent utilisé en sciences sociales, psychologie, médecine, etc., lorsque les n de deux groupes dont on veut comparer la moyenne sont «petits».
Si la différence entre la Χ des deux petits échantillons est plus grande que l’erreur-type de la différence entre les deux Χ, nous concluons le rejet de H0.

23
Q

Quelle est la logique de base du test t indépendant?

A

Deux échantillons aléatoires extraits de la même population devraient avoir la même Χ.
C’est-à-dire que s’ils sont semblables et proviennent de la même population, la différence entre les deux Χ ne sera pas plus grande que l’erreur d’échantillonnage / erreur-type.
Il nous faudra donc examiner la différence entre les Χ des échantillons qui sera comparée à la différence à laquelle il faudrait s’attendre à cause de l’erreur d’échantillonnage (i.e. l’erreur-type de la moyenne sΧ).

24
Q

Comment peut-on déterminer/calculer l’erreur type dans le test t indépendant pour rejeter ou non H0?

A

Nous avons deux échantillons, chacun étant affecté par l’erreur d’échantillonnage.
Nous nous intéressons à la différence entre les deux Χ :
H1: Χ1 - Χ2 ≠ 0 ; H0: Χ1 - Χ2 = 0.
Le rejet de H0 exige que la différence Χ1 - Χ2 soit plus grande que l’erreur d’échantillonnage de la différence entre les échantillons.
L’erreur d’échantillonnage de la différence est l’erreur type de la différence des moyennes (sΧ1 - Χ 2).
Quelle est la différence «normale» à obtenir, compte tenu des fluctuations d’échantillons?
Donc, on ne s’intéresse pas à l’erreur-type de 𝛸1 ou de 𝛸2 , mais bien de l’erreur type de la différence entre 𝛸1 et 𝛸2 !

25
Q

Qu’est-ce que la statistique t dans le test t indépendant?

A

«t» est la statistique qui indique le rapport entre les différences de moyennes et les erreurs-types. Il faut donc deux calculs :
La différence numérique entre deux moyennes.
L’erreur type de la différence (des deux moyennes).

26
Q

Comment se calcule t/ quelle est la formule de t?

A

Le test t se calcule à partir des moyennes et des variances des deux échantillons.
t = X1 - X2 / Sx1-x2

27
Q

Comment calcule-t-on l’erreur type de la différence? (Sx1-x2)
Qu’est-ce que Sc2?

A

Sx1-x2 = ((Sc2/n1) + (Sc2/n2)) ^1/2
Sc2 est la variance conjointe, qui nous permet de calculer la variance conjointe des deux échantillons, selon leurs tailles et leurs d.l.
Elle se calcule avec la formule suivante :
Sc2 = (n1 - 1)s1^2 + (n2 - 1)s2^2 / (n1 + n2 - 2)

28
Q

Quelle est la règle d’inférence pour les test t indépendants?

A

Règle d’inférence: rejet de H0 lorsque tobservé ≥ tcritique.

29
Q

Quel est le critère primordial des échantillons pour pouvoir effectuer un test t indépendant?

A

Lorsque les observations qui appartiennent à un échantillon ne peuvent pas appartenir à l’autre, nous disons que les échantillons sont indépendants.
**Doit être certain que dans les deux groupes il n’y a pas deux fois les mêmes entités

30
Q

Quel est le principe du test t pairé?

A

Très souvent utilisé pour vérifier le changement pré (x) – post test (y).
Avant / après thérapie; avant / après médicament…
Pour chaque observation, il faut calculer la différence (D) entre la performance «pré» (x) et la performance «post» (y). Cela crée une nouvelle variable (D) et nous calculons sa moyenne (ΧD) et son écart-type (sD).
Nous pouvons aussi calculer son erreur type : sΧD = sD/√n.

31
Q

Comment calcule-t-on les degrés de liberté pour chaque type de test t?

A
  • Test t pour échantillon unique : d.l. = n – 1.
  • Test t pour échantillons indépendants : nous avons deux échantillons. Donc d.l. = n1 - 1 et n2-1 ou n1 + n1 - 2.
  • Test t pairé : nous travaillons avec un seul échantillon. Donc d.l. = n - 1.
32
Q

Qu’est-ce que la différence entre une hypothèse bi vs unilatérale?

A

Bilatérale : Quand on ne sait pas quelle sera la différence entre les deux échantillons, quand on ne sait pas si la moyenne d’un échantillon sera plus faible ou plus forte que l’autre. En d’autre mots, lorsque nous savons que la VI aura une impact sur la VD mais nous ne savons pas comment.
Unilatérale : Quand on suppose que la moyenne de l’un des échantillons sera plus forte ou plus faible que l’autre. En d’autre mots, lorsque nous prédisons quel impact la VD aura sur la VI.

33
Q

Donnez des exemples d’hypothèses (H1 et H0) pour une hypothèse uni vs bilatérale

A

Bilatérale :
Lorsque nous ne savons pas si l’intervention (VI) sera bénéfique ou nocive sur la détresse (VD), mais que nous croyons que celle-ci aura un impact (Χ avec intervention ≠ Χ sans intervention) : hypothèse bilatérale.
H1 : le traitement aura une influence sur la détresse.
OU
Il y aura une différence significative entre le score de détresse du groupe suivant le traitement et celui qui ne le suit pas
H0 : le traitement n’aura pas d’influence sur la détresse.
OU
Il n’y aura pas de différence significative entre les scores de détresse obtenus par les deux groupes (avec ou sans traitement).
Unilatérale :
Lorsque nous croyons l’intervention bénéfique (ou le contraire) (Χavec intervention > Χsans intervention) : hypothèse unilatérale.
H1 : le traitement réduit la détresse.
OU
Le score de détresse du groupe suivant le traitement sera significativement plus faible que celui du groupe ne suivant pas le traitement.
H0 : Identique à bilatérale

34
Q

Peut-on utiliser le test t sur de grands échantillons?

A

Lorsque n est petit, le test t est obligatoire.

Lorsque n est grand, le test t est optionnel mais néanmoins valide.