Cours 3 - Test de T et Test de Z Flashcards
On sait que, plus le nombre d’échantillons pris dans une population pour calculer la moyenne des moyennes échantillonnales est important, plus cette moyenne des moyennes échantillonnales se rapproche de celle de la population étudiée. Alors l’écart type des moyennes échantillonnales (Standard Error/erreur type) se rapproche-t-il, de la même façon, de celui de la population étudiée.
On calcule l’erreur type pour savoir à quel point notre échantillon est loin de la moyenne de la population. Il peut s’approcher, mais cela dépend de notre échantillon.
Dans le cas d’un test d’hypothèse, quel est le processus décisionnel qui détermine si l’on doit faire un test de T ou un test de Z ?
Si on connait l’écart-type de la population et que l’échantillon est plus grand que 30, on doit faire un test de Z, si l’échantillon est plus petit que 30, nous devons effectuer un test de T. De plus, si nous ne connaissons pas l’écart-type de la population, on fait un test de T.
Pourquoi est-il nécessaire d’utiliser la distribution de la loi de Student lorsqu’on effectue un test de T, alors que ceci n’est pas le cas pour un test de Z?
Parce que l’écart-type n’est pas toujours un bon estimateur de la vraie valeur populationnelle. Ce qui fait en sorte que l’on introduit une imprécision.
Nous avons vu dans le cours qu’il y a deux types d’erreurs : l’erreur de type I et l’erreur de type II. Expliquez en quoi consiste chaque type d’erreur.
L’erreur de type I est d’affirmer que l’hypothèse nulle est fausse alors qu’elle est vraie (qu’il y a un lien alors qu’il n’y en a pas). L’erreur de type II est d’affirmer que l’hypothèse nulle est vraie alors qu’elle est fausse (qu’il n’y a pas de liens alors qu’il n’y en a un).
Parmi les énoncés ci-dessous, veuillez identifier laquelle est une erreur de type I et laquelle est une erreur de type II.
o Lors du test, je conclus que mon hypothèse nulle est vraie, alors qu’en réalité, elle est fausse.
o Lors du test, je conclus que mon hypothèse nulle est fausse, alors qu’en réalité, elle est vraie.
o Lors du test, je conclus que mon hypothèse nulle est vraie et en réalité elle est aussi vraie.
o Lors du test, je conclus que mon hypothèse nulle est fausse et en réalité elle est aussi fausse.
o Lors du test, je conclus que mon hypothèse nulle est vraie, alors qu’en réalité, elle est fausse.
Type II.
o Lors du test, je conclus que mon hypothèse nulle est fausse, alors qu’en réalité, elle est vraie.
Type I.
o Lors du test, je conclus que mon hypothèse nulle est vraie et en réalité elle est aussi vraie.
Pas une erreur.
o Lors du test, je conclus que mon hypothèse nulle est fausse et en réalité elle est aussi fausse.
Pas une erreur.
Lequel de ces tests présente la plus faible probabilité de rejeter l’hypothèse nulle :
o Test n°1 unilatéral à un seuil de signification 90%
o Test n°2 unilatéral à un niveau de confiance 99%
o Test n°3 unilatéral avec une valeur de p égale à 5%
o Test n°4 bilatéral avec un seuil de signification à 10%
Il s’agirait du test numéro 2
Nous avons vu en classe qu’il existe deux types de tests de normalité : ceux visuels et ceux statistiques. Tout d’abord, peu importe leur type, quelle est l’utilité majeure de ce genre de tests ?
En ce qui concerne la catégorie statistique, quels sont les noms des deux principaux tests utilisés ? Enfin, quelles hypothèses ces tests posent-ils ?
o Les distributions non normales réduisent la puissance des tests.
o Le test Kolmogorov-Smirnov (K-S), l’hypothèse nulle est que la courbe est normale et l’hypothèse alternative est que la courbe n’est pas normale. Le test compare une distribution théorique normale et celle observée. Plus notre distribution diffère de la distribution théorique, plus on augmente les chances de rejeter l’hypothèse nulle.
o Le test de Shapiro-Wilkinson, les hypothèses sont les mêmes que pour l’autre et compare également une distribution théorique à notre distribution. Si la valeur de p est plus petite que 0.05, l’hypothèse nulle est rejetée.
Nommer le paramètre des tests d’hypothèse associé à chacune des caractéristiques suivantes.
* Probabilité de garder l’Ho alors qu’elle est vraie.
* Probabilité de commettre une erreur, soit de rejeter l’Ho alors qu’elle est vraie
* Pour être satisfaisant, il doit être au moins égal à 0,80.
* Plus qu’il est petit, plus qu’il existe des preuves solides en faveur de Ha.
Probabilité de garder l’Ho alors qu’elle est vraie.
Niveau de confiance (1 - α)
Probabilité de commettre une erreur, soit de rejeter l’Ho alors qu’elle est vraie.
Seuil de signification (α)
Pour être satisfaisant, il doit être au moins égal à 0,80.
La puissance du test.
Plus qu’il est petit, plus qu’il existe des preuves solides en faveur de Ha.
La valeur de p.
Expliquez les circonstances dans lesquels ce n’est pas nécessaire de faire un test de normalité avant de procéder à un test de T?
Quand la distribution est asymétrique. Cette violation de la loi normal permet tout de même de soutirer des valeurs de p précises, même si on augmente les chances de faire des erreurs de type I.
Qu’est-ce que le seuil de signification?
Il s’agit de la probabilité de faire une erreur et de rejeter l’hypothèse nulle alors qu’elle est vraie. Il est dénoté (a). Il est généralement de 0.1 (10%), 0.05 (5%) ou 0.01 (1%)
Qu’est-ce que le niveau de confiance?
Il s’agit de la probabilité de ne pas rejeter l’hypothèse nulle alors qu’elle est vraie. Il est généralement dénoté (1 - a) et est donc le contraire du seuil de signification.
Qu’est-ce que la valeur de p?
Il s’agit de la probabilité, selon l’hypothèse où il n’y a pas de véritable différences, de recueillir des données qui montrent une différence égale ou plus extrême que celle que l’on observe.
En général, si p < a, on rejette l’hypothèse nulle.
Qu’est-ce que la puissance d’un test?
Il s’agit de la probabilité d’avoir raison. Que nos conclusions soient vraies.
Généralement, la puissance doit au moins être égale à 0.80 pour être satisfaisante.