Tendance centrale, dispersion et position Flashcards
Quelles sont les 3 mesures de tendance centrale?
- Mode
- Médiane
- Moyenne
Pourquoi on a besoin des mesures de tendance centrale?
Car on veut caractériser la distribution entière des données sur une variable
==> les mesures de tendance centrale permettent caractériser une série statistiques avec une valeur ou modalité typique
Qu’est-ce que le mode?
Le centre de concentration–> reflète la modalité la + fréquente
–>indiquent pas le nb d’ind. qui correspond au mode ni comment les ind sont dispersés
Qu’est-ce que la médiane?
divise une série statistique en 2 groupes: avec chacun 50% des données
==> l’échelle de mesure doit être au moins ordinale pour avoir une médiane
==> + robuste que la moyenne
Comment calculer la médiane pour une variable qualitative ordinale?
- classer les données par ordre croissant
- si la série a un nb d’observation pair, la médiane est au rang n/2
- si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
Comment calculer la médiane pour une variable quantitative?
- Si pas groupée, on les classe par ordre croissant
- -si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
- si la série a un nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2) +1
Si elles sont groupées par valeurs:
- si nb observations impair, la médiane est au rang (n+1)/2
- si nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2)+1
Qu’est-ce que la moyenne?
Le score moyen de tous les sujets
–>elle quantifie les distances qui séparent de la médiane
==> il faut une échelle de mesure au moins d’intervalles, mais souvent on calcule la moyenne d’une variable qualitative ordinale alors qu’elle a pas d’intervalle, mais on fait comme si
==> moyenne dépend bcp des codes arbitaires + sensibles aux valeurs extrême
Quels sont les 3 types de distributions unimodales?
- distribution relativement symétrique (cloche)–> pas d’asymétrie car autant d’ind à droite qu’à gauche du centre (médiane)==> médiane, moyenne et mode se confondent
- distribution asymétrique positive: car les valeurs poussent vers le + (la moyenne aussi)
- distribution asymétrique négative: car les valeurs poussent vers le - (la moyenne aussi)
A quoi sert une mesure de dispersion?
A quantifier l’étalement et la variabilité des données et donc leur degré d’homogénéité et de concentration
Quels sont les 4 mesures de dispersion?
- L’étendue
- La variance
- L’écart-type
- L’écart interquartile
Qu’est-ce que l’étendue?
Distance entre le max et le min
==> pour échelle ordinale ou supérieures
==> très sensible aux valeurs extrêmes donc pas robustes.
Qu’est-ce que la variance?
La distance à la moyenne
—>+ on est proche de la moyenne, + la variance est petite
Comment calculer la variance?
- Calculer la moyenne des sujets
2 On fait: (donnée 1- moyenne)2 + (donnée 2-moyenne)2 .. etc / n-1
Quand les valeurs sont regroupées:
- calculer la moyenne
- donné1 x(modalité-moyenne)2 + donné1 x(modalité-moyenne)2 etc /n-1
==> variance s’exprime pas dans la même échelle que la variable car au carré, donc besoin de l’écart type
Qu’est-ce que l’écart-type?
racine carrée de la variance
==>pour retomber sur une distance dans l’échelle
==>si l’écart type est petit, les données sont concentrées autour de la moyenne
==> donc même unité que la variable !
Qu’est-ce que l’écart interquartile?
-Donne indication de ou se trouvent les 50% centraux de la dispersion
-+ robuste que la variance
==> pour échelles ordinales ou supérieures
Quelles sont les mesures de position?
Situent les données les une par rapport aux autres
Quelles sont les différentes mesures de positions?
- les rangs
- quantiles
- score z
Qu’est-ce que les rangs?
Une mesure de postions
–> donne la position d’une donnée dans une série statistique ordonnée
==> échelle ordinale ou supérieure
Qu’est-ce que les quantiles?
Une mesure de position
–> divise une série statistique ordonnée en groupe de même proportion de données
==> échelles ordinales et supérieures
- les quartiles: divisé en 4 groupes de 25%: 4 groupe et 3 quartiles –> q
- les quintiles: divisé en 5 groupes de 20%: 5 groupes et 4quintiles
- les déciles: divisée en 10 groupes de 10%: 10 groupes et 9 déciles
- les centiles: divisée 100 groupes de 1%: 100 groupes mais 99 centiles
Qu’est-ce que le score z?
-Mesure de position
-indique à combien d’écart type on se trouve pas rapport à la moyenne==> position du sujet par rapport à la série statistique
==> échelle d’intervalle ou supérieure
z= (données - moyenne)/ écart-type
- compris en -3 et 3 en général
- pas d’unités
- une série stat traduite en score z a toujours une moyenne de 0 et un écart-type de 1
Qu’est-ce que l’écart interquartile?
écart ente Q3 et Q1 = écart entre les extrémité du groupe de données qui occupent les 50% du centre de la série stat
Qu’est-ce qu’un box plot et de quoi est-il constitué?
Résume la distribution d’une variable quantitative continue
4 parties:
- un boite (=écart interquartile–>centre de concentration des données, indique ou sont les 50% des individus autour de la tendance centrale
- ligne/carré dans la boite: médiane
-moustaches: disent la distance de au max 1,5X l’écart interquartile–> dit si on a une asymétrie négative ou positive ou distribution centrale