COURS 8 Flashcards

1
Q

Définition du test T?

A

▫ Le test t est spécifiquement conçu et optimisé pour l’inférence H1 vs H0, lorsque les échantillons disponibles pour l’analyse sont composés d’un « petit » nombre d’observations.
▫ Le test t comparera la différence Χ1 - Χ2 à l’erreur d’échantillonnage (erreur-type de la moyenne), mais au lieu d’établir les intervalles de confiance avec la distribution z, il le fera avec une nouvelle distribution, la distribution t.
▫ Pourquoi? Parce que la densité des observations des petits échantillons (la distribution t) n’est pas la même que celle avec des grands échantillons (z).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les utilisation du test t? (3)

A

▫ Le test t pour « un seul échantillon » : pour déterminer si la Χ d’un petit échantillon est différente de la moyenne connue de la population m (H1: Χ ≠ m ).
▫ Le test t pour « deux échantillons indépendants » : pour déterminer si deux petits échantillons ne proviennent pas de la même population. (H1: Χ1 ≠ Χ2).
▫ Le test t pour « deux échantillons non indépendants », ou le « test t pairé » (apparié) : pour déterminer si le même petit échantillon diffère sur la même variable prise à deux moments différents (analyse du changement: H1: Χpré ≠ Χpost).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment on calcule le test t?

A

▫ Nous calculons:
- (Échantillon unique) la différence entre la moyenne d’un petit échantillon et celle d’une population ayant une moyenne m connue;
- (Échantillons indépendants): la différence entre la moyenne de deux petits échantillons (sans nécessairement connaître m);
- Cas 3 (test t pairé): la différence entre le score moyen post vs pré (ou entre deux variables) pour un unique petit échantillon.

▫ Nous comparons la différence obtenue (Χ -m ou Χ1 - Χ2) à la différence « typique » à laquelle nous pourrions nous attendre suite à l’erreur d’échantillonnage (erreurtype de la moyenne).

▫ Si la différence observée est significativement plus grande que la différence « typique » (i.e. l’erreur-type), nous rejetterons H0.

DONC :
▫ Il faut définir ce qu’est un « petit échantillon ».
▫ Calculer l’erreur type de la moyenne (erreur d’échantillonnage).
▫ Comparer Χ à m (si connue) ou Χ 1 et Χ 2 (de deux échantillons
indépendants ou pairés).
▫ Établir la règle décisionnelle permettant (ou non) le rejet de H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dans le test t, quelle est la notion de “petit échantillon”?

A

▫ Le « théorème de la limite centrale » indique que la distribution des Χ des échantillons sera normale à condition que les échantillons contiennent « environ » n = 30. En conséquence : petit n < 30; grand n ≥30.
▫ Ce critère est approximatif.
▫ si s² est très grande, n = 30 pourrait être « petit » ou trop peu, alors qu’à l’inverse, si s² est petite, n = 30 pourrait être approprié ou suffisant.
▫ Mais quelle sera la distribution des Χ lorsque les échantillons sont composés de petits n ?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelle est la notion de l’intervalle de confiance dans le test t?

A

▫ L’erreur type de la moyenne indique les valeurs que Χ pourrait prendre relativement à m, à cause des différences aléatoires qui font en sorte que les échantillons fluctuent.
▫ L’intervalle de confiance (IC = Χ ± z * s) situant la Χ relativement à m, est une procédure appuyée par le théorème de la limite centrale (les Χ d’échantillons extraites de la population sont normalement distribuées).
▫ Le « théorème de la limite centrale » a été établi à partir de « grands » échantillons (n ≥ 30).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les différences entre la forme de la distribution t et de la distribution normale?

A

▫ Extrémités plus épaisses: les petits échantillons produisent plus fréquemment des Χtrès différentes de m.
▫ Les densités ne sont plus pareilles à celles pour la courbe normale et ils varient dépendant du n des échantillons.
▫ La distribution t est différente pour les échantillons de
différentes tailles (n plus petit = extrémités plus épaisses).
▫ Au fur et à mesure que n augmente, la forme de t ressemble de
plus en plus a la distribution z (les extrémités s’amincissent).
▫ Après environ n = 120, les distributions t et z coïncident quasi
parfaitement et lorsque n =∞; z = t.
▫ C’est pourquoi les tables de valeurs t sont généralement
calculées pour un maximum de 120 dl.

▫ Avec la distribution normale (z), 95 % des Χ des échantillons extraits de la population se situent toujours a une distance ± 1,96 erreurs-type de m.
▫ Avec la distribution t, 95 % des Χ des échantillons extraits de la population se situent à un nombre d’erreurs-type différent de m, dépendamment du nombre d’observations dans les échantillons (n).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pourquoi est-ce que les extrémités de la forme du test t sont plus épaisses que celles de la courbe normale?

A

▫ Lorsque les échantillons sont plus petits, les chances sont plus fortes qu’ils auront une Χ plus grande (ou plus petite) que m. Avec un petit n, plus d’échantillons seront loin de m, causant des extrémités plus denses. Cette tendance disparait graduellement avec un accroissement de la taille de n.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définition du test t pour un seul échantillon?

A

Un petit échantillon appartient-il ou non à une population connue?
▫ La grande différence entre le test t et le test z pour déterminer si Χdiffère de m se situe au niveau de la distribution (t ou z) utilisée pour déterminer les bornes de l’IC.
▫ Avec la distribution z, le seuil critique a < 0,05 est toujours 1,96 (2,58 pour a < 0,01) mais avec la distribution t, le seuil critique à a < 0,05 sera différent en fonction du n de l’échantillon.
▫ Les valeurs critiques de t pour les n et le seuil alpha peuvent être
retrouvées dans des tables.
▫ La comparaison Χ vs m, implique un seul échantillon. Par conséquent nous perdons un seul degré de liberté (n - 1).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment on calcule l’IC pour les petits échantillons?

A

▫ L’IC traditionnel (IC = Χ ± zsΧ) est déterminé par la densité des
observations sous la courbe normale (z) et par l’erreur-type de la
moyenne (sΧ).
▫ Mais la distribution des moyennes des petits échantillons est mieux décrite par la distribution « t » que par la distribution z.
▫ Il faut donc substituer « t » à « z ». Nous utilisons alors :
Χ + ou - tcritique* sΧ
▫ … où tcritique est une valeur qui définit la proportion des valeurs t qui inclus 95 % (ou 99 %, etc.) des valeurs t de la distribution.

▫ Le tcritique = 95 % des échantillons de taille n extraits de la distribution auront une Χ inférieure à la valeur du tcritique et il sera différent pour chaque n.
▫ Le tcritique se trouve dans un tableau (Haccoun et Cousineau, 2010; p. 433-434).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la règle décisionnelle pour le test t a échantillon unique?

A

Il faut d’abord calculer la statistique tobservé.
- tobservé correspond à X - u : la différence entre la X d’un petit
échantillon et u.
▫ Il faut ensuite déterminer le tcritique à l’aide du tableau des valeurs critique de la statistique t.
▫ Règle décisionnelle
- Si tobservé ≥ tcritique il faut rejeter H0.
- Si tobservé < tcritique il faut conserver H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définition du test t pour 2 échantillons indépendants?

A

▫ Test la différence entre DEUX petits échantillons.
▫ Très souvent utilisé en sciences sociales, psychologie,
médecine, etc., lorsque les n de deux groupes dont on veut
comparer la moyenne sont « petits ».
▫ Si la différence entre la Χ des deux petits échantillons est plus
grande que l’erreur-type de la différence entre les deux Χ, nous
concluons le rejet de H0
▫ Deux échantillons aléatoires extraits de la même population devraient
avoir la même Χ.
▫ C’est-à-dire que s’ils sont semblables et proviennent de la même
population, la différence entre les deux Χ ne sera pas plus grande que l’erreur d’échantillonnage / erreur-type.
▫ Il nous faudra donc examiner la différence entre les Χ des échantillons qui sera comparée à la différence à laquelle il faudrait s’attendre à cause de l’erreur d’échantillonnage (i.e. l’erreur-type de la moyenne sΧ).
▫ Le test t pour Χ ≠ m (échantillon unique).
▫ Le test t pour deux échantillons indépendants Χ1 ≠ Χ2.
- Indépendants ? Lorsque les observations qui appartiennent à un
échantillon ne peuvent pas appartenir à l’autre, nous disons que les échantillons sont indépendants.
▫ Mais lorsque les mêmes observations sont à la source des deux variables à être comparées, les échantillons ne sont pas indépendants.
- Il faut alors utiliser le test t pairé ou pour échantillons non
indépendants.
- Deux variables mesurées pour les mêmes personnes; deux temps de mesure pour une même variable pour les mêmes personnes, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est l’erreur type dans le test t indépendant?

A

▫ Nous avons deux échantillons, chacun étant affecté par l’erreur
d’échantillonnage.
- Nous nous intéressons à la différence entre les deux Χ :
- H1: Χ1 - Χ2 ≠ 0 ; H0: Χ1 - Χ2 = 0.
- Le rejet de H0 exige que la différence Χ1- Χ2 soit plus grande que l’erreur d’échantillonnage de la différence entre les échantillons.
▫ L’erreur d’échantillonnage de la différence est l’erreur type de la
différence des moyennes (sΧ1 - Χ 2).
▫ Quelle est la différence « normale » à obtenir, compte tenu des
fluctuations d’échantillons?
- Donc, on ne s’intéresse pas à l’erreur-type de X1 ou de X2 , mais bien de l’erreur type de la différence entre X1 et X2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est la formule du test t indépendant?

A

t = X1 - X2 / Sx1-x2
▫ Le test t se calcule à partir des moyennes et des variances des deux échantillons.
▫ « t » est la statistique qui indique le rapport entre les différences de moyennes et les erreurs-types. Il faut donc deux calculs :
- La différence numérique entre deux moyennes.
- L’erreur type de la différence (des deux moyennes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment on calcule l’erreur type de la différences des deux moyennes?

A

▫ Il faut calculer l’erreur type de la moyenne. L’axiome statistique
indique que le meilleur estimé de la variance de la population est
la variance de l’échantillon : s² = s², et que l’erreur-type est le
rapport s²/n (ou s/√n)
▫ Mais maintenant, nous avons deux groupes et donc deux s (s1, s2) et deux
n.
▫ Réponse: prenons la moyenne des deux s. Cette moyenne se nomme la variance conjointe (s² c).
▫ Les deux échantillons pourraient avoir des n différents, ce qui doit être pris en considération.
▫ La pondération consiste à multiplier les s2 par leur d.l., afin d’accorder plus d’importance à l’échantillon le plus grand.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Définition du test t pairé / apparié

A

▫ Très souvent utilisé pour vérifier le changement pré (x) – post
test (y).
- Avant / après thérapie; avant / après médicament…
▫ Pour chaque observation, il faut calculer la différence (D) entre
la performance « pré » (x) et la performance « post » (y). Cela
crée une nouvelle variable (D) et nous calculons sa moyenne
(ΧD) et son écart-type (sD).
▫ Nous pouvons aussi calculer son erreur type : sΧD = sD/√n.

Il faut calculer :
▫ La différence D = x - y de chaque observation.
▫ La différence moyenne ΧD = SD/n = 6,13
▫ L’écart-type sD= √[S(Di-6,13)²/7 = 4,70 ]
▫ Calculons l’erreur-type sΧD = sD/ √ n = 1,66
▫ tobservé= ΧD/ sΧD = 6,13/1,66 = 3,69
▫ tcritique = dl (8 - 1), a < 0,05 = 2,365
▫ Régle d’inférence : rejet de H0 lorsque tobservé ≥ tcritique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les calculs des d.l. pour les 3 types de test t?

A
  • Test t pour échantillon unique : d.l. = n –1.
  • Test t pour échantillons indépendants :
    nous avons deux échantillons. Donc d.l. = n1 - 1 et n2-1 ou n1 + n1- 2.
  • Test t pairé : nous travaillons avec un seul
    échantillon. Donc d.l. = n -1.
17
Q

Différence entre une hypothese bilatérale et unilatérale?

A

▫ Il faut déterminer le sens de la différence. Croyons-nous que le premier groupe aura un score systématiquement plus fort ou plus faible? Ou croyons-nous qu’une différence pourrait exister, mais que nous n’en connaissons pas le sens
▫ Lorsque nous ne savons pas si l’intervention (VI) sera bénéfique ou nocive sur la détresse (VD), mais que nous croyons que celle-ci aura un impact (Χ avec intervention ≠ Χsans intervention) : hypothèse bilatérale.
▫ Lorsque nous croyons l’intervention bénéfique (ou le contraire) (Χavec intervention > Χsans intervention) : hypothèse unilatérale.