Chapitre 9 : La mécanique de l'inférence statistique Flashcards

1
Q

Quelles sont les probabilités?

A

La probabilité d’obtenir une moyenne d’échantillon en fonction de la normalité : la plupart des moyennes d’échantillons seront près de la moyenne de la pop (68%) et la majorité (95%) à plus ou moins 2 s de la moy. de pop.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que signifie que la moyenne d’un échantillon s’éloigne beaucoup de la moyenne de la population?

A

Lorsqu’il est peu probable qu’un échantillon, il est probable qu’il vienne d’une autre population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Sur quelle base peut-on décider de rejeter ou non H0?

A

La règle décisionnelle indique que nous rejetons H0 lorsque la différence entre les deux moyennes (pop et échantillon) est “bien plus grande” que l’erreur type de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment se distribuent les moyennes des échantillons d’une population?

A
  • La plupart des échantillons auront une moyenne proche de la moyenne de la pop, mais d’autres se trouveront plus loin
  • La distribution des moyennes des échantillons sera invariablement normale si les échantillons sont “grands”
  • La moyenne des moyennes de échantillons sera égale à la moyenne de la pop
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’arrive-t-il si la distribution de la population est non-normale?

A

Les résultats demeureront identiques, la distribution des échantillons sera “normale”.
**Cependant, les inférences sont valides seulement lorsque la population de référence est normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels sont les postulats de l’inférence?

A
  • Nous présumons que le ou les échantillons sont aléatoirement extraits de populations normalement distribuées
  • Il n’est pas requis que l’échantillon soit parfaitement normalement distribué mais il lui faut être aléatoirement extrait (i.e. symétrie et aplatissement pas trop élevés)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la fluctuation type?

A

Il s’agit de la différence moyenne entre toutes les moyennes de tous les échantillons possibles (théoriquement) de même taille d’une population
Ressemble à un écart-type, mais au niveau des échantillons et non de la distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que l’erreur type de la moyenne?

A

L’erreur type de la moyenne est la fluctuation typique ou habituelle entre les moyennes des échantillons provenant de la même pop
Cependant, nous ne connaissons jamais tous les échantillons, il est donc difficile de calculer l’erreur-type de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment peut-on trouver l’erreur-type de la moyenne si nous ne connaissons pas tous les échantillons?

A
  • À défaut de connaitre tous les échantillons, nous connaissons toujours n.
  • Lorsque la variance de la population est connue, l’erreur type de la moyenne peut être estimée environ comme la variance
  • Mais nous ne connaissons jamais la variance de la pop. Ainsi, s est le meilleur estimé de la variance et donc nous pouvons utilisé s.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Ainsi, peut-on rejeter H0 avec s plutôt qu’avec l’erreur-type de la moyenne?

A

Oui, on peut conclure qu’un échantillon n’appartient à une pop si la différence entre la moyenne de l’échantillon et la moyenne de l’échantillon est plus grande que s

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’un intervalle de confiance? À quoi sert l’IC?

A

On crée IC à partir de la moyenne de l’échantillon.
Si la moyenne de la pop est inclus dans l’intervalle, il faut accepter H0. L’échantillon appartient à la population, il n’est pas si différent de la moyenne de la pop
Si la moyenne de pop est à l’extérieur de l’intervalle, il faut accepter H1. L’échantillon est trop différent de la moyenne de la pop, il doit appartenir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment calcule-t-on IC?

A

IC = moyenne de l’échantillon ± z*erreur type de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la signification statistique?

A
  • Conclusion que l’échantillon ne provient prob pas de cette population (ou réponse à une autre question : lien, prédiction, etc.).
  • Cette conclusion est avancée seulement lorsque le risque qu’elle soit fausse est faible : erreur d’inférence de type I.
  • Cette conclusion est déclarée, min lorsque le risque d’une erreur est + petit que 5 % (a < 0,05).
  • Lorsqu’il est important de rejeter H0 seulement si le risque d’erreur alpha est très faible, nous faisons appel a un seuil alpha plus petit : (a = 0,01 ou même a = 0,001).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment détermine-t-on le seuil de signification? (pour l’inférence)

A
  • Le choix de p < 0,05 pour définir la signification statistique est une convention pratique aidant la décision : H1 ou H0.
  • Il n’existe aucun rationnel mathématique qui détermine cette valeur. C’est plutôt le risque à prendre qui compte.
  • Le rejet de H0 est fait en acceptant un risque d’erreur d’inférence (0,05; 0,01; 0,001).
  • Tout dépend du degré d’importance de la décision à prendre !
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment peut-on réduire le risque d’erreur de type I?

A
  • Erreur alpha: Conclure au rejet de H0 alors qu’en réalité cela est faux.
  • Il faut accroitre les bornes de l’IC
  • En augmentant l’erreur-type de la moyenne
  • En choisissant un seuil alpha plus petit (0,01 plutôt que 0,05).
  • En réduisant le nombre d’observations n
  • Lorsque les bornes de l’IC sont larges, il est moins probable que la moyenne de la pop se trouve a l’extérieur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment peut-on réduire le risque d’erreur de type II?

A
  • Erreur bêta: conclure au non-rejet de H0 alors qu’en réalité cela est faux
  • Il faut réduire les bornes de l’IC
  • En réduisant l’erreur-type de la moyenne
  • En choisissant un seuil alpha plus grand (0,05 plutôt que 0,01)
  • En augmentant le nombre d’observations n
17
Q

Comment choisit-on entre réduire le risque d’erreur de type I ou de type II?

A

Le choix entre la réduction d’erreur dépend totalement du risque l’on désire minimiser.
Si la conséquence de faire une erreur de type II est plus grave que la conséquence d’une erreur de type I, réduisons l’erreur beta (et vice-versa).