Chapitre 3 Flashcards

1
Q

Tendance centrale

A

La valeur la plus typique de la distribution, celle qui résume le mieux.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Mode

A

Valeur de la distribution dont la fréquence est la plus grande. L’intervalle contenant le plus d’observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Critique du mode comme statistique de la tendance centrale

A

Pratique, car le mode se trouve facilement, et il s’agit invariablement d’une valeur existant véritablement dans la distribution. Cependant, le mode est définit par seulement qu’une partie de toute l’information disponible. Ce n’est pas toujours la valeur qui décrit le mieux la distribution. L’addition ou le retrait de certaines observations peut considérablement changer le mode ou ne pas le modifier.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Médiane

A

Mesure de la tendance centrale qui permet de définir ;a valeur qui coupe la distribution en deux parties, chacune ayant le même nombre d’observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment trouver la médiane

A

Échantillon d’observation impaire:

  1. Ajouter 1 au nombre totale d’observation N
  2. Diviser ce totale par 2
  3. La médiane est la valeur de l’observation qui se trouve à la position calculée à l’étape 2.

Échantillon d’observation paire:

  1. Ajouter 1 au nombre totale d’observation N.
  2. Diviser ce total par 2
  3. La médiane se situe entre la valeur de l’observation se trouvant à la position indiquée à l’étape 2 en enlevant 0.5 et l’observation se trouvant à la position indiquée à l’étape 2 en ajoutant 0.5.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Critique de la médiane comme statistique de la tendance centrale

A

L’inconvénient principal de la médiane est qu’elle ne se sert que d’une parcelle de l’information contenue dans la distribution, soit la position relative des observations. Cependant, la médiane n’est pas affectée par les valeurs qui sont très différentes des autres, notamment, lorsqu’il y a des valeurs extrêmes dans la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Moyenne

A

Ensemble de caractéristiques et de propriétés qui font de la moyenne la valeur de la tendance centrale représentant le mieux la distribution et qui, par conséquent, est celle qu’on utilise généralement le plus..

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Critique de la moyenne comme statistique de la tendance centrale

A

Deux inconvénients principaux:

  1. C’est une valeur abstraite qu’on ne retrouve pas dans les données de la distribution
  2. Lorsque la distribution des données est très asymétrique, la moyenne présente une image qui peut être trompeuse.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Moyenne: estimation par excellence de la tendance centrale d’un échantillon

A

La moyenne utilise toutes les informations disponibles. C’est aussi la statistique de tendance centrale qui fait le moins d’erreur. Le moins d’erreur lorsqu’il est temps de prédire chaque valeur de la distribution. La moyenne est le point d’équilibre de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

L’erreur

A

Comment déterminer laquelle des trois statistiques de tendance centrale est la plus représentative de toutes les valeurs de la distribution?
L’écart par rapport à la mesure de la tendance centrale, c’est-à-dire la différence entre la valeur réelle de chaque observation et la valeur de tendance centrale. La différence s’appelle l’erreur. La meilleure mesure de tendance centrale devrait être celle qui fait le moins d’erreurs lorsque l’on s’en sert pour prédire chaque valeur de la distribution. On prend chaque valeur de la distribution et on soustrait respectivement la moyenne, le mode et la médiane. Plus grande est cette différence, plus grande est l’erreur produite par cette statistique.
Le signe négatif veut dire que la moyenne surestime la valeur, et sous-estime la valeur lorsque le signe est positif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Mesures de dispersion

A

Pour décrire adéquatement une distribution, il faut par conséquent trouver un moyen de quantifier non seulement sa moyenne, mais aussi le degré de différence entre les observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

L’étendue

A

La différence entre les deux extrêmes d’une distribution produit une première statistique qui reflète le degré de dispersion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Critique de l’étendue comme statistique de la dispersion

A

La principale force de l’étendue comme mesure de dispersion est sa facilité de calcul. Cependant, elle n’utilise qu’une infime partie de l’information contenue dans la distribution, en l’occurence seulement des deux observations extrêmes. C’est aussi une valeur relativement instable, car une observation à elle seule peut changer considérablement l’étendue.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

L’étendue interquartile

A

Au lieu de comparer la valeur la plus grande et la valeur la plus petite de l’échantillon, l’étendue interquartile compare la différence entre deux autres valeurs, qui, elles sont plus stables. Nous savons que les observations tendent à être plus rares aux extrémités de la distribution et qu’elles sont plus fréquentes autour de la moyenne. Alors si nous calculons es étendues à partir de valeurs plus proches de la moyenne, le résultat obtenu aura tendance à être plus stable. 50% des observations qui se situent autour de la médiane (+25% et -25%).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Critique de l’étendue interquartile comme statistique de la dispersion

A

Plus stable que l’étendue. Utile lorsque les distributions sont asymétriques où quelques informations peuvent se trouver très loin de la moyenne. Plus stable que l’étendue, car l’ajout d’une donnée ne changera pas. Encore une fois, il ne s’agit pas de la plus stable, puisqu’elle ne prend pas en compte toutes les données de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Variance autour de la moyenne

A

Indique le degré moyen de précision (au carré) de la moyenne pour estimer chaque valeur de l’échantillon.