Cours 5 - Les statistiques descriptives Flashcards
L’analyse exploratoire des données constitue l’étape prilimiaire à toute analyse statistique, même les plus sophistiquée.
À quoi sert-elle?
Elle aide à orienter les analyses subséquentes (paramétriques vs non paramétriques)
Lors de l’analyse exploratoire des données, à quel aspect on s’attarde habituellement ?
3 aspects
- Les mesures de tendance centrale
- Les mesures de dispersion
- La distribution des résultats
Choix de réponse
Je suis une mesure qui indique où se trouve la majeure partie des données ou score d’une distribution. Ces mesuresvisent à représenter le score typique d’une distribution.
a) Les mesures de tendance centrale
b) La distribution des résultats
c) Les mesures de dispersion
d) aucune de ces réponses
a) Les mesures de tendance centrale
Quels sont les trois types de mesure centrale ?
- Le mode
- La médiane
- La moyenne
Définisser ce qu’est le mode.
Le mode est la valeur la plus fréquente d’un ensemble de données. Il correspond à la valeur qui revient le plus souvent parmis l’ensemble des données.
Vrai ou faux
Le mode est une mesure que l’on peut toujours identifiée.
Faux
Il est impossible d’identifier le mode lorsqu’il y a un petits nombres d’observations et que chaque valeurs est différente/unique.
Que mesurons-nous lorsqu’il est question de la médiane?
La médiane correspond à l’observation du milieu. C’est-à-dire la valeur qui se situe à la moitié des observations.
À quoi fait référence à la moyenne?
La moyenne représente la mesure la plus courante des tendance centrale des observations. Toutefois, elle n’est pas toujours approprié et peut ne pas faire de sens.
Qu’est-ce qui caractérises les mesures de dispersion?
Les mesures de dispersions sont des indices qui caractérisent l’étalement des valeurs d’une distribution d’une variable autour d’une variable centrale.
Vrai ou faux
Les mesures de dispersion ne permettent pas de comparer des distribution qui ne sont pas sur la même échelle ?
Vrai
Les mesures ne sont pas standarisées, elles permettent de mesurer la disparité, mais ne permettent pas de comparer avec d’autre
Que cherchons-nous à valider avec les mesures de dispersion?
Les indices de dispersion permette de savoir si les scores individuels se rapprochent ou s’éloignent beaucoup des mesures de tendant centrale. Cela permet donc d’évaluer à quel point les gens sont homogène ou hétérogène
Quelles sont les différentes mesures de dispersion?
3 mesures
- Létendue
- La variance
- L’écart-type
Choix de réponse
Quelle type de mesure indique entre quelles valeurs les résultats varient?
a) Le mode
b) L’écart-type
c) La variance
d) L’étendue
e) Le coefficient de variation
d) L’étendue
Écart entre le minimum et le maximum
Vrai ou faux
L’écart-type mesure la dispersion de chaque obseration autour de la moyenne.
Faux
Cette définition faut référence à la variance.
Quelles est la mesure de dispersion la plus utilisées dans le cas de la description de variables continues ?
L’écart-type
Que nous permet de mesurer le coefficient de variation?
Le coefficient de variation permet de comparer les dispersions de différents groupes. Plus il est élevé, plus il y a une dispersion dans les résultats.
Qu’est-ce qu’une distribution ?
Ce sont les vaeurs de chaque cas pour une variable donnée. Typiquement, les réponses sont ordonnées. C’est donc une représentation très visuelle de valeur.
Exemple : nuage de point
Comment les fractiles se caractérisent-ils?
Les fractiles séparent la distribution en groupes égaux et les données sont donc toujours ordonnée. Il est possible de le faire à peu près n’importe quoi et le plus fréquent est le quartile.
Vrai ou faux
Dans une distribution normale, la moyenne et la médianne sont la même, mais le mode est différent.
Faux
Dans une distribution normale, le mode, la médiane et la moyenne sont tous la même.
Le kurtose fait référece à quel type de mesure?
a) Mesure d’asymétrie de la distribution
b) Mesure d’aplatissement de la distribution
c) Aucune de ces réponse
b) Mesure d’aplatissement de la distribution
Quels sont les trois types d’aplatissement de la distribution possible et à quoi fait-il référence?
- Mesokurtique : Distribution normale, donc aplatissement presque nul (K=0)
- Leptokurtique : K = en haut de zéro
- Platykurtique : K = en bas zéro
Vrai ou faux
Lorsque l’on mesure le Kurtose d’une distribution et que K=0.49, nous avons une représentation Leptokurtique de la distribution puisque K est plus grand que 0.
Faux
Une distribution avec K=0,49 est un applatissement de la courbe de type Mésokurtique puisque Si K=+/-0,5 = normal = mésokurtique
Le skewness est une mesure d’asymétrie de la distribution?
Vrai
Vrai ou faux
Une courbe qui tend vers la gauche (monte tranquillement et redescend drastiquement) représente une asymétrie positive.
Faux
Ceci fait référence à une asymétrie négative (ordre dans la courbe: moyenne, médiate, mode)
Si le “S” (Skewness) est positif, l’asymétrie sera positive, normal ou négative?
Positive
Parmis les énoncés suivant, indiqué si c’est une variable paramétrique ou pas.
a) Lorsque le N est de moins de 30
b) Lorsque la distribution de notre variable est non normale
c) Lorsque c’est une variable nominale ou ordinale
a) Lorsque le N est de moins de 30 = non paramétrique
b) Lorsque la distribution de notre variable est non normale = non paramétrique, mais on peut accorder une certaine souplesse
c) Lorsque c’est une variable nominale ou ordinale = automatiquement non paramétrique