Description et exploration des données 2 Flashcards
Quelles sont les mesures de dispersion/variabilité?
- Étendue
- Écart semi-interquartile
- Variance et écart-type
Qu’est-ce que l’étendue?
Représente l’étalement des données (max-min)
**Sensible aux valeurs extrêmes
Qu’est-ce que l’écart semi-interquartile (Q)?
- Cherche à déterminer à quoi correspond 25% du centre = donne un indice sur la dispersion des données (Q petit = dispersion petite)
- Avantage: pas affecté par les valeurs extrêmes (mieux qu’écart-type pour ça)
Quand utilisons-nous l’écart semi-interquartile?
- Si on a une variable continue non normale (quand médiane est meilleure mesure de tendance centrale)
- Si on a une variable ordinale
Pourquoi est-ce qu’on n’utilise pas la moyenne des écarts à la moyenne?
Parce que ça donne toujours 0
Pourquoi est-ce qu’on n’utilise pas l’écart absolu moyen (EAM)/déviation de la moyenne?
Consiste à enlever les (-)… Parce qu’elle n’a pas d’utilité en statistiques (analyses développées en fonction de la variance: moyenne des écarts à la moyenne au carré)
Qu’est-ce que la variance (S2)?
Caractérise l’éparpillement autour de la moyenne pour les variables CONTINUES (moyenne des écarts à la moyenne au carré)
C’est la principale mesure de dispersion!! Elle est à la base de plusieurs analyses inférentielles
Quelles sont les limites de la variance?
- Difficile à interpréter car pas même unité de mesure que la variable
- Très influencé par les valeurs extrêmes
**Rare qu’on voit le score de la variance dans les études
Quelles sont les étapes du calcul de la variance?
- Calculer l’écart à la moyenne pour chaque observation
- Mettre les écarts au carré
- Faire la somme
- Diviser par le nombre d’observation -1 (pour faire la moyenne)
En quoi consiste le degré de liberté (ddl)?
À chaque fois qu’on fait une estimation, on doit soustraire par 1 le nombre d’observation parce que cela correspond aux positions que l’on peut librement choisir en fonction de la moyenne fixée. (N-1)
Ex: équipe de soccer
**Si population complète (o2), pas de ddl perdu (juste N)
En quoi consiste l’écart-type (S)?
- C’est la racine carrée de la variance
- Même unité de mesure que la variable!
- Valeur faible = petite dispersion autour de la moyenne
- Si ÉT = 0, toutes les observations ont la même valeur
Quels sont les avantages et limites de l’écart-type?
A:
- Meilleur complément à la moyenne
- Mesure de dispersion la plus utilisée
I:
- Plus long à calculer
- Sensible aux valeurs extrêmes
Que se passe-t-il avec l’écart type si:
Changement d’origine (ex: +2 à toutes les valeurs)?
Changement d’échelle (on multiplie les valeurs ex: travail sur 20 amené sur 100)?
Origine: l’écart-type ne change pas!!
Échelle: Multiplier ou diviser l’écart-type par la même valeur
Quelles mesures devons-nous présenter si on a une variable nominale?
Le mode
Les fréquences relatives pour TOUTES les catégories (excepté 0%)
Quelles mesures devons-nous présenter si on a une variable ordinale?
Médiane et Écart semi-interquartile
Mode
Fréquences relatives pour toutes les catégories