Analyse univariée Flashcards
Quelle est l’utilité de l’analyse univariée?
- elle n’est pas d’expliquer
- Elle sert à décrire et présenter les données (ce sont ces analyses qui nous permettent de voir si on doit faire du recodage)
Quelles sont les différentes mesures de tendance centrale et à quoi servent-elles?
- Moyenne, mode, médiane
- elles permettent de résumer en un seul nombre la valeur la plus représentative d’une série statistique
Quelles sont les différentes mesures de position et à quoi servent-elles?
- quartiles, quintiles, déciles, centiles
- elles renseignent sur la position d’une donnée par rapport aux données d’une distribution ordonnée
Quelles sont les différentes mesures de dispersion et à quoi servent-elles?
- étendue, écart-type, variance (ne s’applique pas aux données qualitatives / ordinale,nominale)
- elles mesurent le niveau de variation ou de dispersion des variables
Qu’est-ce que le Mode (Mo) et quelles sont ses caractéristiques?
- C’est la valeur ou la modalité de la variable la plus fréquente dans la distribution.
- Une classe peut être modale, c’est donc une catégorie qui est la donnée revenant le plus souvent
- on peut l’utiliser avec la variable intervalle, la variable continue, la variable ordinale et la variable nominale (surtout avec la nominale)
- Ne fait de sens que si la valeur du mode se distingue réellement des autres valeurs ou modalités
- Il peut y avoir plusieurs modes
Qu’est-ce que la Médiane (Md) et quelles sont ses caractéristiques?
- C’est la valeur qui divise une distribution ordonnée en 2 parties égales. on retrouve 50% des données au dessus et 50% des données en dessous.
- on peut l’utiliser avec la variable intervalle, la variable continue et la variable ordinale (surtout avec l’ordinale)
- utile dans les cas de distributions très asymétriques
- bon complément à la moyenne
- la médiane n’est pas du tout affectée par les extrêmes
Qu’est-ce que la moyenne(x) et quelles sont ses caractéristiques?
- C’est la somme des données divisée par leur nombre
- on peut l’utiliser avec l’échelle d’intervalle et l’échelle continue
- elle est idéale lorsque la distribution est relativement symétrique et unimodale
- elle est très influencée par les valeurs extrêmes (elle peut donc être non représentative)
Quels sont les avantages et les inconvénients au recours au Mode (Mo)?
Avantages: simple, facile à identifier, s’utilise avec tous les types d’échelle de mesure
Inconvénient: Ne prend pas en considération toute l’information disponible sur la distribution (le mode est donc une information «de base»)
*On le trouve dans la fréquence, c’est la plus grosse proportion de répondants. Lorsqu’on a plus d’un mode, on priorise l’utilisation d’une autre mesure.
Quels sont les avantages et les inconvénients au recours à la Médiane (Md)?
Avantages: peu influencée par les valeurs extrêmes
Inconvénient: prend seulement en considération l’ordre des données/valeurs
Quelles sont les deux façons de mesurer la médiane (Md)?
Selon la nature de la variable qu’on va étudier:
1) Si ce sont des données groupées/variable ordinale: se fier au pourcentage cumulatif en identifiant le 50e percentile
2) S’il s’agit d’une variable continue: (n+1)/2 (n est le nombre d’unités d’analyse)
Quels sont les quantiles?
Ce sont des valeurs qui partagent une distribution en un certain nombre de parties égales (on divise n groupes égaux)
Qu’est-ce que l’étendue et quelles sont ses caractéristiques?
- elle renseigne sur l’étalement des données
- c’est la différence entre la valeur observée la plus élevée et la valeur observée la moins élevée d’une distribution
- plus l’étendue est grande, plus les valeurs possibles sont différentes
Qu’est-ce que la variance (S²) et quelles en sont les caractéristiques?
- elle renseigne sur la variabilité/homogénéité des données
- elle mesure la distance de chaque observation par rapport à la moyenne/la concentration (mesure la dispersion des résultats de chaque individu ou groupe par rapport à la moyenne de la distribution). Il s’agit du calcul de l’écart à la moyenne pour tous les répondants.
- est sensible aux valeurs extrêmes
- difficile à interpréter!
- si s² est élevée: hétérogénéité de la distribution. Plus ladispersion des données est grande, plus la variance est grande.
- si s² est basse: homogénéité de la distribution
Qu’est-ce que l’écart-type (s) et quelles en sont les caractéristiques?
- il renseigne sur la variabilité/ l’homogénéité des données
- est sur la même base que les données recueillies (ex. si on a recueilli des $, s sera en $)
- mesure la distance de chaque observation par rapport à la moyenne
- sensible aux valeurs extrêmes
- s élevé: hétérogénéité de la distribution
- pour avoir l’écart-type, on fait la racine carrée de la variance
Que signifie une distribution homogène?
Les résultats sont regroupés autour de la moyenne
Que signifie une distribution hétérogène?
Les résultats sont dispersés autour de la moyenne. La moyenne est moins représentative.