Chapitre 9 : La mécanique de l'inférence statistique Flashcards
Quelles sont les probabilités?
La probabilité d’obtenir une moyenne d’échantillon en fonction de la normalité : la plupart des moyennes d’échantillons seront près de la moyenne de la pop (68%) et la majorité (95%) à plus ou moins 2 s de la moy. de pop.
Que signifie que la moyenne d’un échantillon s’éloigne beaucoup de la moyenne de la population?
Lorsqu’il est peu probable qu’un échantillon, il est probable qu’il vienne d’une autre population.
Sur quelle base peut-on décider de rejeter ou non H0?
La règle décisionnelle indique que nous rejetons H0 lorsque la différence entre les deux moyennes (pop et échantillon) est “bien plus grande” que l’erreur type de la moyenne.
Comment se distribuent les moyennes des échantillons d’une population?
- La plupart des échantillons auront une moyenne proche de la moyenne de la pop, mais d’autres se trouveront plus loin
- La distribution des moyennes des échantillons sera invariablement normale si les échantillons sont “grands”
- La moyenne des moyennes de échantillons sera égale à la moyenne de la pop
Qu’arrive-t-il si la distribution de la population est non-normale?
Les résultats demeureront identiques, la distribution des échantillons sera “normale”.
**Cependant, les inférences sont valides seulement lorsque la population de référence est normale.
Quels sont les postulats de l’inférence?
- Nous présumons que le ou les échantillons sont aléatoirement extraits de populations normalement distribuées
- Il n’est pas requis que l’échantillon soit parfaitement normalement distribué mais il lui faut être aléatoirement extrait (i.e. symétrie et aplatissement pas trop élevés)
Qu’est-ce que la fluctuation type?
Il s’agit de la différence moyenne entre toutes les moyennes de tous les échantillons possibles (théoriquement) de même taille d’une population
Ressemble à un écart-type, mais au niveau des échantillons et non de la distribution
Qu’est-ce que l’erreur type de la moyenne?
L’erreur type de la moyenne est la fluctuation typique ou habituelle entre les moyennes des échantillons provenant de la même pop
Cependant, nous ne connaissons jamais tous les échantillons, il est donc difficile de calculer l’erreur-type de la moyenne
Comment peut-on trouver l’erreur-type de la moyenne si nous ne connaissons pas tous les échantillons?
- À défaut de connaitre tous les échantillons, nous connaissons toujours n.
- Lorsque la variance de la population est connue, l’erreur type de la moyenne peut être estimée environ comme la variance
- Mais nous ne connaissons jamais la variance de la pop. Ainsi, s est le meilleur estimé de la variance et donc nous pouvons utilisé s.
Ainsi, peut-on rejeter H0 avec s plutôt qu’avec l’erreur-type de la moyenne?
Oui, on peut conclure qu’un échantillon n’appartient à une pop si la différence entre la moyenne de l’échantillon et la moyenne de l’échantillon est plus grande que s
Qu’est-ce qu’un intervalle de confiance? À quoi sert l’IC?
On crée IC à partir de la moyenne de l’échantillon.
Si la moyenne de la pop est inclus dans l’intervalle, il faut accepter H0. L’échantillon appartient à la population, il n’est pas si différent de la moyenne de la pop
Si la moyenne de pop est à l’extérieur de l’intervalle, il faut accepter H1. L’échantillon est trop différent de la moyenne de la pop, il doit appartenir
Comment calcule-t-on IC?
IC = moyenne de l’échantillon ± z*erreur type de la moyenne
Qu’est-ce que la signification statistique?
- Conclusion que l’échantillon ne provient prob pas de cette population (ou réponse à une autre question : lien, prédiction, etc.).
- Cette conclusion est avancée seulement lorsque le risque qu’elle soit fausse est faible : erreur d’inférence de type I.
- Cette conclusion est déclarée, min lorsque le risque d’une erreur est + petit que 5 % (a < 0,05).
- Lorsqu’il est important de rejeter H0 seulement si le risque d’erreur alpha est très faible, nous faisons appel a un seuil alpha plus petit : (a = 0,01 ou même a = 0,001).
Comment détermine-t-on le seuil de signification? (pour l’inférence)
- Le choix de p < 0,05 pour définir la signification statistique est une convention pratique aidant la décision : H1 ou H0.
- Il n’existe aucun rationnel mathématique qui détermine cette valeur. C’est plutôt le risque à prendre qui compte.
- Le rejet de H0 est fait en acceptant un risque d’erreur d’inférence (0,05; 0,01; 0,001).
- Tout dépend du degré d’importance de la décision à prendre !
Comment peut-on réduire le risque d’erreur de type I?
- Erreur alpha: Conclure au rejet de H0 alors qu’en réalité cela est faux.
- Il faut accroitre les bornes de l’IC
- En augmentant l’erreur-type de la moyenne
- En choisissant un seuil alpha plus petit (0,01 plutôt que 0,05).
- En réduisant le nombre d’observations n
- Lorsque les bornes de l’IC sont larges, il est moins probable que la moyenne de la pop se trouve a l’extérieur