Cours 4 Flashcards
Quelle mesure de tendance centrale utilise-t-on d’emblée pour une variable ordinale ou continue non-normale ?
médiane
Quelle mesure de tendance centrale s’applique le mieux aux variables qualitatives ?
Mode
Le moyenne dépend de___________
Le médiane dépend de_________________
Le mode dépend de ________________
Moyenne : la grandeur des valeurs
Médiane : du nombre et rang des observations
Mode : fréquence des observations
Décrivez les 3 mesures de tendance centrale si :
courbe unimodale symétrique
courbe bimodale symétrique
Asymétrie négative ou positive
Unimodale symétrique: Superposition
Bimodale symétrique: superposition de la moyenne et de la médiane, mais 2 modes
Asymétrie négative ou positive : 3 mesures diffèrent et moyenne se déplace vers l’asymétrie (M, Md, Mo)
Quelles mesures de tendance centrale doit-on présenter si on a une distribution:
symétrique
asymétrique
bimodale
symétrique : uniquement moyenne
asymétrique : ajouter médiane (car valeurs extrêmes)
bimodale : ajouter Mo1 et Mo2 pour bien refléter la tendance
Que sont les mesures de dispersion ? Quelles sont les trois principales ?
Nombres qui permettent de représenter l’étalement ou la variabilité d’un ensemble de données : variabilité autour du centre de la distribution
Étendue
Écart semi-interquartile
Variance et écart-type
Chaque quartile compte ___________ de la population.
L’espace interquartile regroupe _________des valeurs centrales alors que Q = ________ du centre
25%
50%
25%
Quel est le meilleur indice de dispersion autour de la Md ?
Espace semi-interquartile
Quelle est la force de l’écart semi-interquartile ? Dans quels contextes (2) doit-on l’utiliser ?
N’est pas affecté par les valeurs extrêmes
Variable continue non-normale (car cette mesure n’est pas affectée par l’asymétrie ou les valeurs extrêmes)
Variable ordinale
Pourquoi n’utilise-t-on pas l’écart moyen comme mesure de dispersion ?
Car la moyenne des écarts à la moyenne donne toujours 0
L’écart absolu moyen n’a pas d’utilité en statistiques
Quelle est la principale mesure de dispersion ?
La variance
La variance caractérise l’éparpillement autour de la moyenne pour les variables _____________
Elle constitue la ___________ des ________________
continues uniquement
La moyenne des écarts à la moyenne au carré (sinon, les écarts s’annulent)
Quelles sont les limites (2) de la variance ?
Difficile à interpréter car pas dans la même unité de mesure que la variable (au carré)
Très influencée par les valeurs extrêmes (mises au carré)
Quelles sont les étapes du calcul de la variance ?
Calculer écart à la moyenne pour chaque observation
Les mettre au carré
Faire la somme
Diviser par le nombre d’observations - 1 (N - 1)
Quel concept est derrière le N - 1 dans le calcul de la variance ?
Le concept de degré de liberté : au moins une observation n’est pas libre de bouger quand on estime à la population à partir d’échantillons
Écart type
Valeur plus faible représente une ___________
Si toutes les observations prennent la même valeur, l’écart-type est ______-
plus petite dispersion autour de la moyenne
nul
Quelle est la limite de l’écart-type ?
Toujours présenté avec quoi ?
Sensible aux valeurs extrêmes
La moyenne
Que se passe-t-il si :
Changement d’origine (ajout d’une constante +2)?
Changement d’échelle?
Origine : Écart type ne change pas
Échelle : multiplier / diviser l’écart-type par la même constante
Quelles mesures présente-t-on pour une variable continue + distribution normale ?
M + ET
Indices d’asymétrie + aplatissement
Min + Max
Quelles mesures présente-t-on pour une variable continue + distribution non-normale ?
M + ET Indices asymétrie + aplatissement Min + Max Md Q
Quelles mesures présente-t-on pour une variable ordinale ?
Md
Mo
Fréquences relatives pour toutes les catégories (%)
Quelles mesures présente-t-on pour une variable nominale ?
Mo
Fréquences relatives pour toutes les catégoreis (%)
Une valeur extrême vient biaiser la moyenne, la variance et l’écart-type parce qu’elle s’éloigne significativement de la moyenne. À combien d’écart-types une valeur doit-elle se situer par rapport à la moyenne pour être considérée comme extrême ?
3.29 ET
Les valeurs aberrantes se situent entre ____ et ___ écart-types
1.96 et 3.28
Comment peut-on identifier les valeurs extrêmes ? (2)
à l’aide du graphique boîte à moustache
en transformant variable en score Z (si Z plus grand ou égal à 3,29)
Quelles sont les options lorsqu’on repère une valeur extrême ? (2)
Corriger si c’est une erreur
Traiter la valeur comme manquante (Vue des variables) pour l’exclure; le mentionner
Dans le diagramme boîte à moustache, les valeurs extrêmes sont identifiées par une ______ tandis que les valeurs aberrantes sont identifiées par un _________
Ce diagramme utilise la __________ et les __________-
étoile
cercle
Médiane et les quartiles
Les charnières du diagramme boîte à moustache doivent regrouper ____________
La dispersion des charnières _____________
_______ = +/- 1,5 X dispersion
Les valeurs _________ sont comprises dans les barrières
50% des valeurs centrales
Écart interquartile
Barrière intérieure (moustaches)
Adjacentes
Qu’est-ce que permettent les mesures de position et dans quoi sont-elles surtout utiles ?
Évaluer la performance d’une personne par rapport aux autres: situent chaque observation par rapport à son groupe ou à un groupe de normalisation
Psychométrie
Quelles sont les mesures de position les plus utilisées?
Rangs centiles + Quantiles (centiles (pourcentiles), déciles, quartiles)
Le 72e centile d’une série statistique est le point sur l’axe des valeurs …….
Nommez en 3
au-dessous duquel se situent 72% des observations
Quartiles
Quintiles
Déciles
C25 = Q? C50 = Q? = ? C75 = ?
C25 = Q1 C50 = Q2 = Md C75 = Q3