C15 - Statistiques descriptives Flashcards
En statistiques descriptives, qu’appelle-t-on “population” ?
L’ensemble sur lequel porte l’étude statistique
Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique
En statistiques descriptives, comment appelle-t-on les éléments qui composent la population ?
Individus ou unités statistiques
Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique
En statistiques descriptives, comment appelle-t-on les valeurs prises par la variable statistique ?
Les modalités
Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique
La note obtenue en mathématique est une modalité
En statistiques descriptives, que peut-on associer à une unité statistique ?
Un caractère ou une variable statistique
En statistiques descriptives, comment appelle-t-on une variable qui n’est PAS mesurable ?
Quels sont les deux types de cette variable ?
Une variable qualitative
Ex : le sexe, le département de naissance…
- Variable qualitative ORDINALE si les modalités associées peuvent être hiérarchisées
Ex : appréciation d’une prestation par les modalités mauvaise, moyenne ou bonne - Variable qualitative NOMINALE si les modalités associées ne peuvent être hiérarchisées
Ex : la couleur des yeux : bleus, marrons, verts, noirs
En statistiques descriptives, comment appelle-t-on une variable qui est mesurable ?
Quels sont les deux types de cette variable ?
Une variable quantitative
Ex : le nombre de frères et soeurs, l’âge, la taille, la note obtenue….
- Variable quantitative DISCRETE si elle peut prendre des valeurs isolées
Ex : nombre d’enfants par foyer : 0,1,2,3… - Variable quantitative CONTINUE si elle peut prendre toutes les valeurs d’un intervalle appelé classe
Ex : la taille, le salaire
En statistiques descriptives, qu’est ce que l’effectif ni d’une modalité i ?
Le nombre d’individus associé à xi
Pour p modalités, on a n1, n2, n3 …. np
L’effectif total est la somme de tous les effectifs, noté N
ou
N = ∑ni avec i=1 et i=p
En statistiques descriptives, qu’est ce que
Nk = ∑ni avec i=1 et i=k ?
Les effectifs cumulés croissants jusqu’au rang k
En statistiques descriptives, qu’est ce que la fréquence fi d’une modalité i ?
Le rapport de l’effectif ni à l’effectif total N
fi = ni/N
Avec
∑fi avec i=1 et i=p –> f1+f2+f3+….+fp = 1
La somme des fréquences est égale à 1
En statistiques descriptives, qu’est ce que
Fk = ∑fi avec i=1 et i=k ?
Les fréquences cumulées croissantes jusqu’au rang k
On calcule la fréquence de chaque modalité
On ajoute à la fréquence de la modalité k la somme des fréquences des modalités ou classes précédentes
En statistiques descriptives, qu’est ce qu’une série statistique ?
L’ensemble des couples {(xi,ni)} où xi est la modalité i d’effectif ni
En statistiques descriptives, qu’est ce que le mode d’une série statistique ?
Quel est-il dans le cas d’une variable continue dont les classes sont de même amplitude ?
Quel est-il dans le cas d’une variable continue dont les classes ne sont PAS de même amplitude ?
La valeur de la variable associée au plus grand effectif ou à la plus grande fréquence
Pour le trouver, on doit ordonner les valeurs dans l’ordre croissant.
Si 4 élèves ont obtenu la note 12 et que c’est le plus grand effectif, le mode est 12
Dans le cas d’une variable continue dont les classes sont de même amplitude, le mode est le centre de la classe modale
Dans le cas d’une variable continue dont les classes ne sont pas de même amplitude, le mode est le centre de la classe modale associé au plus grand effectif rectifié
Ex : classe d’âge/effectif / effectif rectifié
{4;5{ = 12 / 12
{5;6{ = 14 / 14
{6;8{ = 30 / 15 –> Car la classe est d’amplitude 2 au lieu de 1, on divise par 2
{6;8{ est la classe modale car associé au plus grand effectif rectifié (15)
Le mode est le centre de classe : 7
En statistiques descriptives, qu’est ce que la moyenne arithmétique ?
Le quotient de la somme des valeurs par l’effectif total N
X̅ = 1/N ∑xi avec i=1 et i=n
Lire : “somme des xi, i variant de 1 à n” divisé par N
En statistiques descriptives, qu’est ce que la moyenne arithmétique pondérée ?
La moyenne des xi pondérés par les effectifs ni
X̅ = 1/N ∑ni x xi avec i=1 et i=p
On peut aussi la calculer en pondérant les xi par leur fréquence respective fi : dans ce cas, on ne divise pas par N puisque ça a déjà été fait pour calculer les fréquences
X̅ = ∑fi x xi avec i=1 et i=p
En statistiques descriptives, qu’est ce que la moyenne géométrique ?
A quoi sert-elle ?
La moyenne géométrique de n valeurs positives xi est la racine nième de leur produit
G = n√ x1 * x2 x3 …. * xn
= (x1* x2 x3 …. * xn)1/n
Utile pour calculer des moyennes de pourcentage : on calcule la moyenne géométrique G des coefficients multiplicatifs associés aux augmentations et diminutions successives
Calculer l’augmentation moyenne du prix d’un article ayant subi 3 hausses de 5%, 6%, 8% et 2 baisses de 3% et 4%
Pour déterminer l’augmentation moyenne, il faut d’abord calculer la moyenne géométrique G des coefficients multiplicatifs associés aux augmentations et diminutions successives
G = 5√1,05x1,06x1,08x0,97x0,96
G = (1,05x1,06x1,08x0,97x0,96)^1/5
G = 1,0228
L’augmentation moyenne est donc égale à 2,28%
En statistiques descriptives, qu’est ce que la moyenne harmonique ?
A quoi sert-elle ?
La moyenne géométrique de n valeurs positives xi est le nombre H dont l’inverse est la moyenne arithmétique des inverses de ces n valeurs
Soit 1/H = 1/n * (1/x1 + 1/x2 + …. + 1/xn)
ou
H = n / ((1/x1 + 1/x2 + …. + 1/xn))
Elle est utile pour calculer des vitesses moyennes
Un cycliste a parcouru 4 étapes de 80 km chacune à la vitesse respective de 10, 20, 16 et 32km/h
Quelle est sa vitesse moyenne ?
Moyenne harmonique des vitesses
Distance parcourue = 4 x 80km = 320km
On divise la distance totale par la somme des durées mises à parcourir chacune des étapes
(4x 80) / (80/10 + 80/20 + 80/16 + 80/32)
On peut simplifier par 80 :
4 / (1/10 + 1/20 + 1/16 + 1/32)
H = 16,41km/h
Quelle moyenne utiliser pour calculer une vitesse moyenne ?
Une moyenne de pourcentages d’augmentations et diminitions
- Vitesse moyenne : Moyenne harmonique
- Moyenne de pourcentages : Moyenne géométrique
En statistiques descriptives, qu’est ce que les quantiles ?
Les valeurs du caractère xi qui partagent la série statistique en n séries de même effectif
Selon la valeur de n, les quantiles sont appelés : Médiane : n=2 Quartiles : n=4 Déciles : n=10 Centiles : n=100
En statistiques descriptives, qu’est ce que la médiane ?
La valeur de xi qui partage la série statistique en 2 séries de même effectif
Il y a donc autant de valeurs inférieures à la médiane que de valeurs supérieurs
Comment calculer la médiane si la variable est discrète ?
Ranger les données dans l’ordre croissant
- Effectif total N impair : valeur du caractère xi de rang N+1 /2
- Effectif total N pair : moyenne arithmétique des 2 valeurs de xi de rang N/2 et N+1 /2
Comment calculer la médiane si la variable est continue ?
Ranger les données dans l’ordre croissant
On retient la classe associée à l’effectif cumulé croissant représentant au moins 50% de l’effectif total
En statistiques descriptives, qu’est ce que les quartiles ?
Les 3 valeurs Q1, Q2 et Q3 du caractère qui partagent la série en 4 parties de même effectif
25% de l’effectif total a une valeur inférieur à Q1
Q2 = Me
75% de l’effectif total a une valeur inférieur à Q3
Comment calculer les quartiles si la variable est discrète ?
Ranger les données dans l’ordre croissant
Si l’effectif total n’est pas un multiple de 4, alors les quartiles Q1 et Q3 sont respectivement les termes de rang immédiatement supérieurs à N/4 et 3N/4
Si l’effectif total est un multiple de 4, alors les quartiles Q1 et Q3 sont respectivement les termes de rang N/4 et 3N/4
Paramètres de dispersion : qu’est ce que l’étendue d’une statistique ?
La différence entre la plus grande valeur xmax et la plus petite valeur xmin du caractère
Notée e
Paramètres de dispersion : qu’est ce que l’intervalle interquartile d’une statistique ?
{Q1 ; Q3} est l’intervalle interquartile d’une série, il contient 50% de l’effectif
A ne pas confondre avec l’écart interquartile
Paramètres de dispersion : qu’est ce que l’écart interquartile d’une statistique ?
Q3-Q1 : mesure la dispersion des valeurs xi autour de la médiane
Plus l’écart est petit, plus les valeurs appartenant à l’intervalle interquartile sont proches de la médiane
Avantage de l’écart interquartile d’une statistique en tant que paramètre de dispersion, par rapport à l’étendue ?
N’intègre que 50% de l’effectif total, ce qui a pour effet d’éliminer l’influence des valeurs extrêmes, souvent marginales
Représentations graphiques : qu’est ce qu’un diagramme à secteurs ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?
Un camembert
L’effectif est représenté par un disque de mesure 360°
On partage ce disque en secteur angulaires dont les mesures des angles au centre sont proportionnelles aux fréquences de chaque modalité
Ex : le produit A a une fréquence de 24% : la part de disque correspond à un angle au centre de 360°x0,24 = 86,4°
Utilisé pour les variables qualitatives
Représentations graphiques : qu’est ce qu’un diagramme à bandes ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?
Représente les modalités par des bandes dont la hauteur est proportionnelle aux effectifs
Utilisé pour les variables qualitatives
A ne pas confondre avec
- l’histogramme, où les bandes sont “collées” : pour les variables quantitatives continues
- le diagramme en bâtons : pour les variables quantitatives discrètes
Représentations graphiques : qu’est ce qu’un diagramme en bâtons ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?
Représente les modalités par des bâtons dont la hauteur est proportionnelle aux effectifs
Utilisé pour les variables quantitatives discrètes
A ne pas confondre avec
- l’histogramme, où les bandes sont “collées” : pour les variables quantitatives continues
- le diagramme en bandes : pour les variables qualitatives
Représentations graphiques : qu’est ce qu’un histogramme ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?
Un diagramme composé de rectangles continus dont l’aire est proportionnelle à l’effectif de chaque classe
On associe à chaque classe {ai;ai+1{ un rectagle dont la largeur est ai+1 - ai et dont l’aire est propotionnelle à l’effectif ni associé à cette classe
Cas particulier : si les amplitudes des classes sont inégales : on divise les effectifs des classes d’amplitude plus importante pour obtenir des effectifs rectifiés à l’unité choisie (les hauteurs des rectangles) et ainsi obtenir des aire de rectangle proportionnelles à l’effectif de chaque classe
=> comme les cases sont “plus larges”, la hauteur doit être “rabaissée”
Tracer la courbe des effectifs cumulés croissant ou décroissants
Cas particulier dans le cas où la variable est continue ?
Abscisse : variable ou classe
Ordonnée : ECC
Si la variable est continue : l’abscisse sera la borne supérieure de cette classe pour les ECC et la borne inférieure pour les ECD
Déterminer graphiquement la médiane et les quartiles
Sur la courbe des ECC :
Me : abscisse du point d’ordonnée N/2
Q1 : abscisse du point d’ordonnée N/4
Q3 : abscisse du point d’ordonnée 3N/4
Tracer un diagramme en boite (“seringue”)
Calculer Q1, Me et Q3
Tracer au dessus d’une droite graduée un rectangle délimité par Q1 et Q3 et coupé par Me
Ce rectangle constitue le diagramme en boîte
Tracer ensuite 2 segments délimités par les valeurs extrêmes