Semaine 10 Flashcards
Fréquence
nb d’observations associées à une valeur ou catégorie
(niveau ou modalité)
BOITE À MOUSTACHE
Fréquence cumulée:
dans une présentation des valeurs ordonnées, le
nombre d’observations associées à une valeur/catégorie X ou à une
valeur/catégorie précédente (addition)
Proportion:
fréquence (f) divisée par le nombre total d’observations
Rapport (ratio):
relation entre deux quantités qu’on veut comparer
* Exemple: 6 hommes pour 7 femmes = rapport 6/7
Proportion:
les deux quantités sont liées (le numérateur est un sousensemble
du dénominateur)
Taux:
processus dynamique, on observe un changement dans le temps
* Exemple: dénominateur exprimé en personne-temps, c.-à-d. qu’on attribue à
chaque personne un poids selon la durée de son observation
Forme de la distribution
comment se situent les valeurs
par rapport aux autres
L’asymétrie
(skewness)écrit un décalage vers la gauche ou vers la droite de la courbe.
L’aplatissement (kurtosis)
décrit la concentration des fréquences autour
de la moyenne
Mesures de tendance centrale
Distribution = propriété d’une population (Ø d’un individu)
Tendance centrale ce qui est typique de la population ; ce qui se
passe «en moyenne»
* Valeurs autour desquelles la distribution est centrée
Différentes mesures :
Moyenne
Moyenne pondérée
Médiane
Mode
Moyenne
Somme des observations divisée par le nombre d’observations
Moyenne pondérée
- Toutes les observations n’ont pas le même poids
- Permet de modifier la contribution relative des observations
Médiane:
sépare la distribution en deux groupes égaux (50%)
moins affectée que la moyenne par les valeurs extrêmes
Mode:
catégorie ou valeur ayant la fréquence la plus élevée
Le mode est approprié pour les variables nominales et ordinales
Mesures de dispersion
Ce qui est « typique » peut être plus ou moins fréquent dans une population.
il y aura de la variabilité autour de la tendance centrale.
* Étendue
* Écart moyen
* Variance
* Écart-type
* Coefficient de variation
Étendue:
différence entre les valeurs minimale et maximale de la distribution
Étendue = Max – Min
Écart moyen:
décrit comment, en moyenne, chacune des observations est éloignée
de la moyenne
- Sans valeurs absolues, la somme des écarts à la moyenne = 0
- Pour des raisons mathématiques, les valeurs absolues ne sont pas idéales…
Variance:
moyenne des carrés des écarts à la moyenne
Écart-type:
racine au carré de la variance
Coefficient de variation:
variabilité par rapport à la moyenne
écart type / moyenne
Plus le CV est petit, plus les valeurs de la distribution tendent à être proche de la
moyenne
Mesures de position
situer une valeur relativement à l’ensemble de la
distribution
*Centiles : 100 groupes composés
chacun de 1% des observations
*Quartiles : 4 groupes composés chacun de 25% des observations
Q1: milieu de la 1ere moitié des données définie par la médiane
Q2 = médiane
Q3: milieu de la 2e moitié des données définie par la médiane