Semaine 2 (description et exploration des données) Flashcards
Nommer l’avantage et le désavantage d’utiliser une distribution de fréquences.
Avantage : Permet de voir rapidement les données extrêmes.
Désavantage : Difficile de visualiser la forme générale de la distribution puisqu’il y a une fluctuation importante d’un point à l’autre.
Quelle est la solution à envisager afin de contrer le désavantage d’une distribution de fréquences (où il est difficile de visualiser la forme générale de la distribution en raison d’une trop grande fluctuation entre les points)?
Regrouper les valeurs adjacentes en un histogramme!
On regroupe certaines valeurs et on fait des intervalles sur l’axe des X
Quel est le désavantage d’un histogramme?
On ne voit plus les données réelles de la distribution (valeurs individuelles).
Quels sont les avantages d’un histogramme?
- Permet de voir la forme de la distribution (moins de trous)
- Permet de voir les données extrêmes
- Évite les fluctuations adjacentes (problème de la distribution de fréquences)
- On peut voir où se situe la plupart des gens.
Quelle représentation graphique peut-on utiliser comme alternatif à l’histogramme puisqu’elle permet d’observer les valeurs individuelles?
Le diagramme en tiges et feuilles.
Quels sont les avantages du diagramme en tiges et feuilles?
- Permet d’avoir données individuelles
- Permet de voir données extrêmes
- Permet de voir la forme de la distribution
- Permet de comparer des échantillons entre eux (2 distributions qu’on place dos à dos)
Vrai ou faux? La légende est facultative dans un diagramme en tiges et feuilles.
Faux. La légende est obligatoire! On doit toujours l’inclure sous le diagramme.
Dans le diagramme en tiges et feuilles, que représentent respectivement les tiges et les feuilles?
Tiges : le chiffre des dizaines (des données individuelles)
Feuilles : le chiffre des unités (des données individuelles)
Quelle représentation graphique de données est la plus informative?
Le diagramme en boîte-et-moustaches
Quelle représentation graphique de données est la plus utilisée en sciences humaines?
Le diagramme en boîte-et-moustaches
Dans le diagramme en boîte-et-moustaches, que représentent respectivement Q1, Q2 et Q3?
Q1 : Représente le premier quartile (25% des données se situent sous Q1)
Q2 : Représente la médiane
Q3 : Représente le troisième quartile (75% des données se situent sous Q3)
Dans le diagramme en boîte-et-moustaches, que représentent les moustaches?
Les moustaches représentent la valeur la plus haute (sans être extrême) et la valeur la plus basse (sans être extrême) de la distribution.
Vrai ou faux? Dans le diagramme en boîte-et-moustaches, la médiane est représentée par Q3.
Faux. La médiane correspond à Q2.
Vrai ou faux? Dans le diagramme en boîte-et-moustaches, les valeurs extrêmes ne sont pas représentées.
Faux. Il est vrai que les valeurs extrêmes ne sont pas pris en considération lorsqu’on détermine où se situent les moustaches et la boîte, mais les valeurs extrêmes sont tout de même représentées par un point sur le diagramme (avec un * ou un 1 en exposant pour indiquer qu’il s’agit d’une valeur extrême)
Dans le diagramme en boîte-et-moustaches, que représente la longueur des moustaches?
La longueur des moustaches rend compte de la variabilité qu’on retrouve dans la distribution.
Plus les moustaches sont longues, plus ça indique qu’il y a de variabilité dans notre distribution (données très dispersées autour de la moyenne).
Que peut-on conclure si, dans le diagramme en boîte-et-moustaches, l’une des moustache est longue et l’autre est courte?
On peut conclure qu’il y a une asymétrie.
Quels sont les 4 types de symétrie? Dessinez un exemple. pour chacun.
- Normale
- Bimodale
- Asymétrie négative
- Asymétrie positive
Quels sont les 3 types de degré de voussure? Dessinez un exemple pour chacun.
- Mésokurtique
- Leptokurtique
- Platikurtique