Tendance centrale, dispersion et position Flashcards
Quelles sont les 3 mesures de tendance centrale?
- Mode
- Médiane
- Moyenne
Pourquoi on a besoin des mesures de tendance centrale?
Car on veut caractériser la distribution entière des données sur une variable
==> les mesures de tendance centrale permettent caractériser une série statistiques avec une valeur ou modalité typique
Qu’est-ce que le mode?
Le centre de concentration–> reflète la modalité la + fréquente
–>indiquent pas le nb d’ind. qui correspond au mode ni comment les ind sont dispersés
Qu’est-ce que la médiane?
divise une série statistique en 2 groupes: avec chacun 50% des données
==> l’échelle de mesure doit être au moins ordinale pour avoir une médiane
==> + robuste que la moyenne
Comment calculer la médiane pour une variable qualitative ordinale?
- classer les données par ordre croissant
- si la série a un nb d’observation pair, la médiane est au rang n/2
- si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
Comment calculer la médiane pour une variable quantitative?
- Si pas groupée, on les classe par ordre croissant
- -si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
- si la série a un nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2) +1
Si elles sont groupées par valeurs:
- si nb observations impair, la médiane est au rang (n+1)/2
- si nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2)+1
Qu’est-ce que la moyenne?
Le score moyen de tous les sujets
–>elle quantifie les distances qui séparent de la médiane
==> il faut une échelle de mesure au moins d’intervalles, mais souvent on calcule la moyenne d’une variable qualitative ordinale alors qu’elle a pas d’intervalle, mais on fait comme si
==> moyenne dépend bcp des codes arbitaires + sensibles aux valeurs extrême
Quels sont les 3 types de distributions unimodales?
- distribution relativement symétrique (cloche)–> pas d’asymétrie car autant d’ind à droite qu’à gauche du centre (médiane)==> médiane, moyenne et mode se confondent
- distribution asymétrique positive: car les valeurs poussent vers le + (la moyenne aussi)
- distribution asymétrique négative: car les valeurs poussent vers le - (la moyenne aussi)
A quoi sert une mesure de dispersion?
A quantifier l’étalement et la variabilité des données et donc leur degré d’homogénéité et de concentration
Quels sont les 4 mesures de dispersion?
- L’étendue
- La variance
- L’écart-type
- L’écart interquartile
Qu’est-ce que l’étendue?
Distance entre le max et le min
==> pour échelle ordinale ou supérieures
==> très sensible aux valeurs extrêmes donc pas robustes.
Qu’est-ce que la variance?
La distance à la moyenne
—>+ on est proche de la moyenne, + la variance est petite
Comment calculer la variance?
- Calculer la moyenne des sujets
2 On fait: (donnée 1- moyenne)2 + (donnée 2-moyenne)2 .. etc / n-1
Quand les valeurs sont regroupées:
- calculer la moyenne
- donné1 x(modalité-moyenne)2 + donné1 x(modalité-moyenne)2 etc /n-1
==> variance s’exprime pas dans la même échelle que la variable car au carré, donc besoin de l’écart type
Qu’est-ce que l’écart-type?
racine carrée de la variance
==>pour retomber sur une distance dans l’échelle
==>si l’écart type est petit, les données sont concentrées autour de la moyenne
==> donc même unité que la variable !
Qu’est-ce que l’écart interquartile?
-Donne indication de ou se trouvent les 50% centraux de la dispersion
-+ robuste que la variance
==> pour échelles ordinales ou supérieures