Module 2 Flashcards
3 types de variables
- variables de personnes (âge, occupation, état civil, habitudes de vie)
- variables de lieux (pays, région)
- variables de temps (durée, fréquence de la maladie)
Classification des variables
- variable quantitative (numériques)
- discrète (ne peut pas être exprimée par fraction)
- continue (peut être exprimée par fraction) - variables qualitatives (qualités, attributs)
3 types d’échelles de classification
- échelle nominale (sexe, groupe sanguin)
- échelle ordinale (satisfaction)
- échelle d’intervalle (âge 1-4, 5-7, etc)
*Passage possible: intervalle -> ordinale -> nominale (sens unique seulement)
Distribution des fréquences dans un tableau
intervalle -> effectif -> fréquence relative -> fréquence relative cumulée
Distribution des fréquences dans un graphique
Échelle nominale ou ordinale
- secteurs proportionnels (pointe de tarte)
- barres proportionnelle (voir p.25 livre)
- en barres (chaque barre représente la fréquence de la classe d’une variable)
Échelle par intervalle
- histogramme (pour les variables quantitatives continues)
- polygone de fréquences (variables continues ou discrètes)
- graphe en ligne (y en fonction de x)
- graphe de percentiles (distribution en 100 parties égales)
Autres représentations
- représentation cartographique
- graphe en point (si extrapolation des valeurs non nécessaire)
Mesure de tendance centrale: les moyennes
Arithmétique: somme des valeurs observées divisée par le nombre de valeur (inconvénient: influencée par les valeurs extrêmes, surtout élevées)
Pondérée: somme des moyennes des classes multipliée par le nombre d’observation par classe
Géométrique: xème racine du produit des valeurs (avantage: réduit l’influence des valeurs extrêmes, surtout basse)
Mesure de tendance centrale: la médiane
Divise en deux parties égales l’ensemble des valeurs en ordre croissant.
Avantage: n’est pas influencée par les valeurs extrêmes; la prioriser lorsque distribution asymétrique
*Si le total des valeurs est pair, faire la moyenne entre les 2 valeurs médianes
Mesure de tendance centrale: le mode
Valeur qui revient le plus souvent
Mesure de dispersion: l’étendu
Différence entre la valeur maximal et la valeur minimal
Inconvénient: ne subit l’influence que des valeurs extrêmes
Mesure de dispersion: quantiles
Diviser l’ensemble en un certain nombre de parties égales
**Données en ordre croissant; quartiles vs quintes vs percentiles
Mesure de dispersion: variance
Somme des carrés des écarts p/r à la moyenne divisée par le nombre d’observation
Mesure de dispersion: écart-type
Racine carrée de la variance
Mesure de dispersion: variation
Rapport de l’écart-type à la moyenne
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle nominale?
Mode
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle ordinale?
Mode, médiane