cours 3 - tests d'hypothèse, statistique de z, statistique de t Flashcards
- Parmi les quatre affirmations suivantes concernant l’erreur type, laquelle (ou lesquelles) est (ou sont) juste(s)?
a) Plus la taille de l’échantillon diminue, et plus l’erreur type augmente.
b) Plus la taille de l’échantillon est grande, plus nous avons de chance de rejeter l’hypothèse alternative.
c) Dans une statistique de Z, pour obtenir l’erreur type, on doit diviser l’écart-type de la population par la racine carrée de la taille de l’échantillon.
d) L’erreur type est une mesure de la dispersion des moyennes échantillonnales autour de la médiane de la population.
A et C
- Vous avez établi pour une situation précise un intervalle de confiance de 95% pour le nombre de crimes commis dans une certaine région au cours de l’année dernière, et cet intervalle va de 45 à 55. Dans ce cas, expliquez ce que signifie le niveau de confiance de 95%? Quelle serait la différence si nous avions un niveau de confiance de 99%?
Le niveau de confiance de 95% signifie qu’on s’attendrait à ce que 95% de ces intervalles contiennent la vraie valeur du paramètre (dans ce cas, le nombre réel de crimes commis dans la région au cours de l’année dernière).
Si vous aviez un niveau de confiance de 99%, l’intervalle de confiance serait plus large, car vous seriez plus “confiant” dans la capture de la vraie valeur du paramètre. la même étude serait de 43 à 57.
- À quoi correspond la valeur critique d’un test?
La valeur critique est la valeur de T pour laquelle nous rejetons l’hypothèse nulle selon notre seuil de signification
- Expliquez les nuances entre les termes suivants : le seuil de signification, la valeur de p ainsi que le niveau de confiance
Le seuil de signification est α = 0.05 qui est la probabilité de faire une erreur et de rejeter l’hypothèse nulle alors que celle-ci est vraie.
(et donc d’avoir la bonne conclusion).
la valeur de p est la probabilité d’obtenir des résultats
la valeur de p région sous la courbe de z
niveau de confiance = 1-a =
- Parmi le seuil de signification et la valeur de p, lequel est le plus précis ? Justifiez votre réponse.
Cela dépend du résultat de notre statistique de z. si notre statistique de z est plus grande que notre valeur critique du test c’est donc la valeur de p qui est plus précise. au contraire si notre statistique de z est moins grande que la valeur critique du test c’est donc le seuil de signification qui est plus précis
- Suite à vos résultats, vous arrivez à rejeter votre hypothèse nulle. Pouvez-vous ensuite assumer que votre hypothèse alternative est automatiquement vraie? Expliquez votre raisonnement.
Non, le rejet de l’hypothèse nulle ne signifie pas automatiquement que l’hypothèse alternative est vraie. Le rejet de l’hypothèse nulle indique simplement qu’il y a des preuves statistiques suffisantes pour remettre en question cette hypothèse, mais cela ne confirme pas nécessairement la validité de l’hypothèse alternative. (erreurs, biais, coincidence)
- Vrai ou faux? Parmi les échantillons de grande taille (n>30), une violation de la normalité peut encore donner des valeurs p précises. Justifiez votre réponse
Vrai. Parmi les échantillons de grande taille (n>30), une violation de la normalité peut souvent être tolérée sans affecter de manière significative la précision des valeurs p dans certains contextes. Cela est dû au Théorème Central Limite (TCL), qui stipule que la distribution des moyennes échantillonnaires tend vers une distribution normale à mesure que la taille des échantillons augmente, quel que soit la forme de la distribution de la population d’origine.
- Parmi les 3 affirmations suivantes laquelle est la plus représentative de la relation entre le niveau et l’intervalle de confiance?
a) Plus le niveau de confiance est élevé, plus l’intervalle de confiance est petit, car on est plus certain de ne pas faire d’erreur.
b) Plus le niveau de confiance est élevé, plus l’intervalle de confiance est grand puisque cela réduit les chances de commettre une erreur.
c) Le niveau de confiance n’affecte pas l’intervalle de confiance; ce sont deux aspects complètement distincts
B
- Lorsque l’on calcule une statistique de Z ou de T, quelles sont les 5 règles de base (postulats) qui guident l’analyse. Rappelez-vous que si ces règles ne sont pas respectées, les résultats peuvent être incorrects.
- La variable est continue
- Les observations sont tirées d’un échantillon aléatoire et représentatif de la population (un échantillon probabiliste)
- Les observations sont indépendantes
- Il n’y a pas de valeur aberrante
- La distribution de la variable suit une loi normale OU l’échantillon est assez grand (n plus grand que 30)
- Vrai ou faux ? Le test de T est toujours préférable au test de Z car il est plus robuste et peut être appliqué à n’importe quelle taille d’échantillon, que l’on connaisse la variance de la population ou non. Justifiez votre réponse
Faux, le test de t est préférable lorsque nous ne connaissons pas l’écart type de la population et que l’échantillon est plus petit que 30 pour appliquer la statistique de z,
sinon nous faisons directement un test de z lorsque nous connaissons l’écart type et le nb est supérieur à 30. le test de t n’est pas nécessairement plus robuste et ne dépend pas de la variance de la population.