Cours 8 Flashcards
Quelle est la taille des échantillons analysés par les tests t?
Des petits échantillons
Le test t compare la différence X1 - X2 à l’erreur d’échantillonnage.
- Quel est le nom de la distribution avec laquelle il pourra établir les intervalles de confiance? Et pourquoi?
- La distribution t
- Car la densité des observations des petits échantillons (distribution t) n’est pas la même que celle avec des grands échantillons (z)
Quelles sont les 3 utilisations du test t (3 types de tests t)?
1 - Le test t pour “un seul échantillon”
2 - Le test t pour “2 échantillons indépendants”
3 - Le test t pour “2 échantillons non indépendants”
Explique le test t pour “un seul échantillon”
- Pour déterminer si la X d’un petit échantillon est différente de la moyenne connue de la population u (H1: X != u)
- Pour déterminer si un petit échantillon appartient ou non à une population connue
Explique le test t pour “2 échantillons indépendants”
Pour déterminer si 2 petits échantillons ne proviennent pas de la même population (H1: X1 != X2)
Explique le test t pour “2 échantillons non indépendants”
Aussi appelé le test t pairé (apparié). Pour déterminer si le même petit échantillon diffère sur la même variable prise à 2 moments différents (analyse du changement: H1: Xpre != Xpost). En d’autres mots, pour vérifier le changement pré (x) - post test (y)
- Quelle est l’opération effectuée pour déterminer si on rejette ou si on conserve H0?
- Explique une situation où on rejetterait H0
- On compare la différence entre nos moyennes (X1 - X2 ou X - u) à l’erreur-type de la moyenne
- Lorsque la différence entre nos moyennes est significativement plus grande que l’erreur-type de la moyenne
Def. théorème de la limite centrale
- Indique que la distribution des X sera normale à condition que les échantillons contiennent environ n = 30.
Quelle sont les valeurs pour un petit n et pour un grand n selon la convention?
- Petit n < 30
- Grand n >= 30
Quand la variance est grande, est-ce que n = 30 est considéré comme:
- Trop grand
- Suffisant
- Trop petit
Trop petit
Quand la variance est petite, est-ce que n = 30 est considéré comme:
- Trop grand
- Suffisant
- Trop petit
Suffisant / approprié
Lorsqu’on a des échantillons de petites tailles, est-ce que le théorème de la limite centrale est valide?
Non, il se peut que la distribution ne soit pas normale
Def. erreur type de la moyenne (sx)
Les différentes valeurs que les X peuvent prendre par rapport à u à cause des différences aléatoires qui font que les échantillons fluctuent
Def. intervalle de confiance
Permet de situer la X relativement à u. C’est une procédure appuyée par le théorème de la limite centrale
Quelle sont les différences entre une distribution normale et une distribution t?
1 - Il y a moins d’observations dans une distribution t
2 - Les extrémités d’une distribution t sont plus épaisses
3 - Les densités ne sont plus pareilles à celles pour la courbe normale et ils varient dépendant du n des échantillons
Quel est un synonyme pour la distribution t?
La distribution de Student
Quel est l’effet d’un n _____ sur la distribution t?
a) Plus petit
b) Plus grand
a) Les extrémités sont plus épaisses
b) Les extrémités s’amincissent, la forme de la distribution t ressemble de + en + à une distribution normale
Qu’arrive-t’il à la distribution t lorsque le n atteint environ 120?
La distribution t coïncide quasi parfaitement avec la distribution z. Il est donc possible d’utiliser soit la distribution t ou la distribution z dans ce cas.
Quelle est la raison pour laquelle les extrémités deviennent + épaisses lorsque le n diminue?
Car avec une petite taille d’échantillon, plus de données seront loin de u. C’est ce qui cause une augmentation de l’épaisseur des extrémités.
Comment peut-on voir, en regardant l’intervalle de confiance, qu’il faut rejeter H0?
Lorsque l’intervalle de confiance autour de X exclut u
Qu’est-ce qui est spécial avec l’intervalle de confiance d’une distribution t?
Les bornes de l’IC changent selon la taille de l’échantillon (selon le nombre d’observations de l’échantillon)
Quelles valeurs doit-on connaître pour faire un test t à un seul échantillon?
- La moyenne de la population
- La moyenne de l’échantillon
- L’écart-type de l’échantillon
- Le nombre d’observations de l’échantillon (sa taille)
Def. t critique
Valeur qui définit la proportion des valeurs t qui inclus 95% (ou 99%, etc.) des valeurs t de la distribution. Permet de déterminer l’intervalle de confiance (de quelle à quelle valeur).
Def. degré de liberté
Taille de l’échantillon - 1
Quelles valeurs doit-on connaître pour trouver la valeur du t critique dans le tableau?
- La taille de l’échantillon (pour déterminer le degré de liberté)
- Le seuil alpha
Qu’est-ce que la règle décisionnelle?
- Si t observé >= t critique, il faut rejeter H0
- Si t observé < t critique, il faut conserver H0
Avec un test t indépendant, quand peut-on conclure le rejet d’H0?
Lorsque la différence entre les moyennes (X1 - X2) des petits échantillons est plus grande que l’erreur type de la différence des moyennes (sx1-x2)
À quoi correspond la variance conjointe?
Elle correspond à la moyenne des variances des deux échantillons
Qu’est-ce que la variance conjointe prend en considération?
Que les 2 échantillons pourraient avoir des n différents
Pourquoi est-ce que dans la formule de la variance conjointe on multiplie les variances par leur degré de liberté?
Car ça permet d’accorder plus d’importance à l’échantillon le plus grand
Pourquoi est-ce que dans la formule de la variance conjointe on divise par (n1 + n2 - 2)
Car puisqu’on a 2 échantillons, on a 2 variances et on perd donc un degré de liberté pour chacune. On perd donc 2 degrés de liberté au total.
Def. de 2 échantillons qui sont indépendants
Les observations qui appartiennent à un échantillon ne peuvent pas appartenir à l’autre. les 2 groupes sont mutuellement exclusifs.
Combien de degrés de liberté (d.l.) perdons nous selon les types de tests t et explique pourquoi:
a) Test t pour échantillon unique
b) Test t pour échantillons indépendants
c) Test t pairé
a) 1, car nous n’avons qu’un échantillon, l’autre “groupe” est la population et il n’y a pas de perte de d.l.
b) 2, car on a deux échantillons différents
c) 1, car nous n’avons qu’un échantillon
Def. hypothèse bilatérale
On sait qu’il y aura une différence entre nos moyennes, mais on ne peut pas orienter la différence
Def. hypothèse unilatérale
On sait dans quel sens sera la différence entre nos moyennes. Exemple, X1 sera significativement supérieure à X2 ou vice-versa.