Chapitre 3 : Les statistiques descriptives Flashcards

1
Q

Qu’est-ce que sont les mesures de tendance centrale?

A

La tendance centrale est un terme générique pour décrire le centre d’une distribution de fréquences et d’observations (données). C’est aussi la valeur typique d’une distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que l’étendue?

A

L’étendue (“range”) est la différence entre la valeur minimale et la valeur maximale d’une distribution.
L’étendue interquartile se calcule en retirant 25% des scores les plus faibles et 25% des plus élevés pour calculer l’étendue de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les différentes mesures de tendance centrale?

A

La moyenne (“mean”), le mode et la médiane (“median”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que le mode?

A

Le mode est le score qui est le plus fréquent à travers les données recueillies.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est ce que la médiane?

A

La médiane est l’observation qui partage la distribution/les données en deux groupes égaux.
Elle n’est pas affectée par les scores extrêmes.
Calcul : (n+1)/2
Nous indique la position de la médiane et si n est pair, nous donne la position entre les deux valeurs dont on fait la moyenne pour la médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la moyenne?

A

La moyenne est la mesure de tendance centrale la plus utilisée.
Elle est influencée par les valeurs extrêmes et est sensible aux changements dans la distribution.
Moyenne = Σxi / n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pourquoi est-ce que la moyenne est la mesure de tendance centrale la plus utilisée?

A
  • Elle tient compte de chaque observation
  • Elle est sensible à tout changement dans la distribution
  • C’est celle qui fait le moins d’erreurs dans sa description des valeurs de toute la distribution (elle réduit l’erreur moyenne à 0)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle mesure permet de bien constater la variabilité de la moyenne?

A

L’écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que la déviance?

A

Aussi appelé l’écart à la moyenne, la déviance est la différence entre une valeur observée d’une variable et sa moyenne.
Une somme d’écarts qui n’est pas 0 représente une erreur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi est-ce que la somme de la déviance est-elle toujours égale à 0?

A

Car la déviance est basée sur la moyenne (qui est le centre de la distribution). Ainsi, certains scores sont positifs et d’autres sont négatifs, et ils finissent tous par s’annuler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dans quelles échelles de mesure peut-on catégoriser chaque mesure de tendance centrale?

A

Mode : nominale, ordinale, intervalles, proportions
Médiane : Ordinale, intervalles, proportions
Moyenne : Intervalles, proportions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Est-ce la moyenne est toujours la meilleure mesure à utiliser?

A

Non, surtout avec des valeurs extrêmes, la moyenne n’est pas la mesure la plus appropriée. Dépendamment des cas, il peut s’agir du mode ou de la médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dans une distribution bimodale, quelle est la meilleure mesure à utiliser?

A

Si on est dans la distribution bimodale, la moyenne risque de se trouver entre le deux modes.
Donc il serait plus approprié de dire qu’il semble y avoir deux tendances centrales à la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La moyenne est-elle appropriée pour une distribution leptokurtique? et platykurtique?

A

Elle est ok pour une distribution leptokurtique et moins bonne pour une distribution platykurtique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que l’asymétrie nous permet de déterminer par rapport aux mesures de tendance centrale?

A

Asymétrie nulle : La moyenne se trouve au centre de la distribution
Asymétrie + : La moyenne est plus élevé que la majorité des variables.
Asymétrie - : La moyenne est plus faible que la majorité des variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qui peut influencer l’utilisation de la moyenne?

A

Si les statistiques d’asymétrie ou d’aplatissement sont trop élevées, la distribution ne sera pas normale, ce qui influence l’utilisation de la moyenne.
Elles influencent aussi l’utilisation de différents tests statistiques inférentiels.

17
Q

Qu’est-ce que la variance?

A

Lorsque les observations sont davantage différentes, la moyenne devient un moins bon estimateur de la distribution des valeurs d’une distribution.
Il existe probablement des «sous-groupes» au sein des données.
La variance estime le degré de différence entre les observations.
Décrit le degré avec lequel les observations sont différentes de la moyenne de la variable mesurée. (estimé de la variabilité moyenne des données)

18
Q

Qu’est-ce qui détermine si le mode et la moyenne d’une distribution seront similaires?

A

La variance
Même s’il s’agit d’une distribution unimodale symétrique, les valeurs des distributions peuvent être très différentes, ce qui déterminera si moyenne = Mo (et si la moyenne sera une bonne représentation de la distribution.

19
Q

Comment peut-on obtenir la variance?

A

Il faut d’abord la déviance.

Pour empêcher que la variance = 0 (comme la déviance), on met au carré.

20
Q

Comment s’appelle également la variance?

A

Somme des différences au carré

21
Q

Comment calcule-t-on la variance?

A

s2 = Σ(xi-ẋ)^2 / N -1

22
Q

Qu’est-ce que la variance nous indique sur la moyenne?

A

Lorsque la variance d’une variable est faible ou proche de 0, les observations obtiennent des valeurs proche de la moyenne.
Donc, la moyenne estimera très bien chaque observation, mais la variable est moins intéressante sur le plan scientifique (observations semblables)
Lorsque la variance est forte, les observations obtiennent des valeurs loin de la moyenne. Par conséquent, la moyenne estimera très mal chaque observation, mais la variable est plus intéressante.

23
Q

Donnez des caractéristiques de la variance

A
  • Elle n’est jamais négative. Il ne peut pas avoir moins qu’aucune différence.
  • Une variance de 0 implique une distribution constante
  • La variance indique le degré d’homogénéité des réponses à la variable.
  • Cependant, elle est difficile à interpréter.
24
Q

Qu’est-ce que l’écart-type?

A

L’écart type s’obtient à l’aide de la racine carrée de la variance
Le calcul de l’écart-type exige le calcul préalable de la variance
L’écart-type indique la différence moyenne entre les valeurs d’une distribution et sa moyenne
Est identique à la variance, mais est plus simple et plus facile à interpréter.

25
Q

Qu’est-ce que signifie une variance plus élevée pour 2 distributions avec la même moyenne?

A

Celle ayant s2 la plus élevée est plus en mesure de détecter les différences individuelles entre les observations.

26
Q

Comment interpréter s2 pour des distributions pour lesquelles la variance n’est pas identique?

A

Le coefficient de variabilité

27
Q

Qu’est-ce que le coefficient de variabilité?

A

CV est une statistique qui permet la comparaison du niveau de variabilité des variables qui n’ont pas la même moyenne et s2.
La variable ayant le CV le plus grand est plus capable de détecter différences individuelles entre observations.
CV = s / moyenne

28
Q

Donnez des caractéristiques de s et s2

A
  • Plus il y a d’observations loin de la moyenne, plus s et s2 seront élevés.
    Plus les observations se concentrent autour de la moyenne, plus petits seront s et s2.
29
Q

Quel est le principal inconvénient de la médiane et du mode?

A

Ils ne prennent en compte qu’une infime partie des informations de la distribution.

30
Q

Quel est un avantage du mode et de la médiane?

A

Le mode est très facile à trouver et la médiane n’est pas affecter par les valeurs extrêmes car elle ne prend pas en compte toutes les variables de la distribution.

31
Q

Qu’est-ce que le degré d’aplatissement?

A

Le degré d’aplatissement (Ku) réfère au degré de concentration près de la moyenne des valeurs de la distribution.
Ku de 0 indique que la distribution a une rondeur normale.

32
Q

Qu’est-ce que le degré d’asymétrie?

A

Lorsqu’une distribution est asymétrique, le nombre d’observations se situant des deux côtés de la moyenne et leur distance relative ne sont pas égaux.
Sk permet de calculer numériquement le niveau d’asymétrie.
Sk > 0 signifie une asymétrie positive
Sk = 0 signifie une distribution parfaitement symétrique
Sk < 0 signifie une asymétrie négative