Analyse univariée Flashcards
Quelle est l’utilité de l’analyse univariée?
- elle n’est pas d’expliquer
- Elle sert à décrire et présenter les données (ce sont ces analyses qui nous permettent de voir si on doit faire du recodage)
Quelles sont les différentes mesures de tendance centrale et à quoi servent-elles?
- Moyenne, mode, médiane
- elles permettent de résumer en un seul nombre la valeur la plus représentative d’une série statistique
Quelles sont les différentes mesures de position et à quoi servent-elles?
- quartiles, quintiles, déciles, centiles
- elles renseignent sur la position d’une donnée par rapport aux données d’une distribution ordonnée
Quelles sont les différentes mesures de dispersion et à quoi servent-elles?
- étendue, écart-type, variance (ne s’applique pas aux données qualitatives / ordinale,nominale)
- elles mesurent le niveau de variation ou de dispersion des variables
Qu’est-ce que le Mode (Mo) et quelles sont ses caractéristiques?
- C’est la valeur ou la modalité de la variable la plus fréquente dans la distribution.
- Une classe peut être modale, c’est donc une catégorie qui est la donnée revenant le plus souvent
- on peut l’utiliser avec la variable intervalle, la variable continue, la variable ordinale et la variable nominale (surtout avec la nominale)
- Ne fait de sens que si la valeur du mode se distingue réellement des autres valeurs ou modalités
- Il peut y avoir plusieurs modes
Qu’est-ce que la Médiane (Md) et quelles sont ses caractéristiques?
- C’est la valeur qui divise une distribution ordonnée en 2 parties égales. on retrouve 50% des données au dessus et 50% des données en dessous.
- on peut l’utiliser avec la variable intervalle, la variable continue et la variable ordinale (surtout avec l’ordinale)
- utile dans les cas de distributions très asymétriques
- bon complément à la moyenne
- la médiane n’est pas du tout affectée par les extrêmes
Qu’est-ce que la moyenne(x) et quelles sont ses caractéristiques?
- C’est la somme des données divisée par leur nombre
- on peut l’utiliser avec l’échelle d’intervalle et l’échelle continue
- elle est idéale lorsque la distribution est relativement symétrique et unimodale
- elle est très influencée par les valeurs extrêmes (elle peut donc être non représentative)
Quels sont les avantages et les inconvénients au recours au Mode (Mo)?
Avantages: simple, facile à identifier, s’utilise avec tous les types d’échelle de mesure
Inconvénient: Ne prend pas en considération toute l’information disponible sur la distribution (le mode est donc une information «de base»)
*On le trouve dans la fréquence, c’est la plus grosse proportion de répondants. Lorsqu’on a plus d’un mode, on priorise l’utilisation d’une autre mesure.
Quels sont les avantages et les inconvénients au recours à la Médiane (Md)?
Avantages: peu influencée par les valeurs extrêmes
Inconvénient: prend seulement en considération l’ordre des données/valeurs
Quelles sont les deux façons de mesurer la médiane (Md)?
Selon la nature de la variable qu’on va étudier:
1) Si ce sont des données groupées/variable ordinale: se fier au pourcentage cumulatif en identifiant le 50e percentile
2) S’il s’agit d’une variable continue: (n+1)/2 (n est le nombre d’unités d’analyse)
Quels sont les quantiles?
Ce sont des valeurs qui partagent une distribution en un certain nombre de parties égales (on divise n groupes égaux)
Qu’est-ce que l’étendue et quelles sont ses caractéristiques?
- elle renseigne sur l’étalement des données
- c’est la différence entre la valeur observée la plus élevée et la valeur observée la moins élevée d’une distribution
- plus l’étendue est grande, plus les valeurs possibles sont différentes
Qu’est-ce que la variance (S²) et quelles en sont les caractéristiques?
- elle renseigne sur la variabilité/homogénéité des données
- elle mesure la distance de chaque observation par rapport à la moyenne/la concentration (mesure la dispersion des résultats de chaque individu ou groupe par rapport à la moyenne de la distribution). Il s’agit du calcul de l’écart à la moyenne pour tous les répondants.
- est sensible aux valeurs extrêmes
- difficile à interpréter!
- si s² est élevée: hétérogénéité de la distribution. Plus ladispersion des données est grande, plus la variance est grande.
- si s² est basse: homogénéité de la distribution
Qu’est-ce que l’écart-type (s) et quelles en sont les caractéristiques?
- il renseigne sur la variabilité/ l’homogénéité des données
- est sur la même base que les données recueillies (ex. si on a recueilli des $, s sera en $)
- mesure la distance de chaque observation par rapport à la moyenne
- sensible aux valeurs extrêmes
- s élevé: hétérogénéité de la distribution
- pour avoir l’écart-type, on fait la racine carrée de la variance
Que signifie une distribution homogène?
Les résultats sont regroupés autour de la moyenne