C15 - Statistiques descriptives Flashcards

1
Q

En statistiques descriptives, qu’appelle-t-on “population” ?

A

L’ensemble sur lequel porte l’étude statistique

Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En statistiques descriptives, comment appelle-t-on les éléments qui composent la population ?

A

Individus ou unités statistiques

Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

En statistiques descriptives, comment appelle-t-on les valeurs prises par la variable statistique ?

A

Les modalités

Ex : l’ensemble des candidats au CRPE est une population
Chaque candidat est une unité statistique
La note obtenue en mathématique est une modalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En statistiques descriptives, que peut-on associer à une unité statistique ?

A

Un caractère ou une variable statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

En statistiques descriptives, comment appelle-t-on une variable qui n’est PAS mesurable ?
Quels sont les deux types de cette variable ?

A

Une variable qualitative
Ex : le sexe, le département de naissance…

  • Variable qualitative ORDINALE si les modalités associées peuvent être hiérarchisées
    Ex : appréciation d’une prestation par les modalités mauvaise, moyenne ou bonne
  • Variable qualitative NOMINALE si les modalités associées ne peuvent être hiérarchisées
    Ex : la couleur des yeux : bleus, marrons, verts, noirs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

En statistiques descriptives, comment appelle-t-on une variable qui est mesurable ?
Quels sont les deux types de cette variable ?

A

Une variable quantitative
Ex : le nombre de frères et soeurs, l’âge, la taille, la note obtenue….

  • Variable quantitative DISCRETE si elle peut prendre des valeurs isolées
    Ex : nombre d’enfants par foyer : 0,1,2,3…
  • Variable quantitative CONTINUE si elle peut prendre toutes les valeurs d’un intervalle appelé classe
    Ex : la taille, le salaire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

En statistiques descriptives, qu’est ce que l’effectif ni d’une modalité i ?

A

Le nombre d’individus associé à xi
Pour p modalités, on a n1, n2, n3 …. np
L’effectif total est la somme de tous les effectifs, noté N
ou
N = ∑ni avec i=1 et i=p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

En statistiques descriptives, qu’est ce que

Nk = ∑ni avec i=1 et i=k ?

A

Les effectifs cumulés croissants jusqu’au rang k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En statistiques descriptives, qu’est ce que la fréquence fi d’une modalité i ?

A

Le rapport de l’effectif ni à l’effectif total N

fi = ni/N

Avec
∑fi avec i=1 et i=p –> f1+f2+f3+….+fp = 1
La somme des fréquences est égale à 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En statistiques descriptives, qu’est ce que

Fk = ∑fi avec i=1 et i=k ?

A

Les fréquences cumulées croissantes jusqu’au rang k

On calcule la fréquence de chaque modalité
On ajoute à la fréquence de la modalité k la somme des fréquences des modalités ou classes précédentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En statistiques descriptives, qu’est ce qu’une série statistique ?

A

L’ensemble des couples {(xi,ni)} où xi est la modalité i d’effectif ni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

En statistiques descriptives, qu’est ce que le mode d’une série statistique ?

Quel est-il dans le cas d’une variable continue dont les classes sont de même amplitude ?

Quel est-il dans le cas d’une variable continue dont les classes ne sont PAS de même amplitude ?

A

La valeur de la variable associée au plus grand effectif ou à la plus grande fréquence
Pour le trouver, on doit ordonner les valeurs dans l’ordre croissant.
Si 4 élèves ont obtenu la note 12 et que c’est le plus grand effectif, le mode est 12

Dans le cas d’une variable continue dont les classes sont de même amplitude, le mode est le centre de la classe modale

Dans le cas d’une variable continue dont les classes ne sont pas de même amplitude, le mode est le centre de la classe modale associé au plus grand effectif rectifié
Ex : classe d’âge/effectif / effectif rectifié
{4;5{ = 12 / 12
{5;6{ = 14 / 14
{6;8{ = 30 / 15 –> Car la classe est d’amplitude 2 au lieu de 1, on divise par 2

{6;8{ est la classe modale car associé au plus grand effectif rectifié (15)
Le mode est le centre de classe : 7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

En statistiques descriptives, qu’est ce que la moyenne arithmétique ?

A

Le quotient de la somme des valeurs par l’effectif total N

X̅ = 1/N ∑xi avec i=1 et i=n
Lire : “somme des xi, i variant de 1 à n” divisé par N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

En statistiques descriptives, qu’est ce que la moyenne arithmétique pondérée ?

A

La moyenne des xi pondérés par les effectifs ni

X̅ = 1/N ∑ni x xi avec i=1 et i=p

On peut aussi la calculer en pondérant les xi par leur fréquence respective fi : dans ce cas, on ne divise pas par N puisque ça a déjà été fait pour calculer les fréquences

X̅ = ∑fi x xi avec i=1 et i=p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En statistiques descriptives, qu’est ce que la moyenne géométrique ?
A quoi sert-elle ?

A

La moyenne géométrique de n valeurs positives xi est la racine nième de leur produit
G = n√ x1 * x2 x3 …. * xn
= (x1* x2 x3 …. * xn)1/n

Utile pour calculer des moyennes de pourcentage : on calcule la moyenne géométrique G des coefficients multiplicatifs associés aux augmentations et diminutions successives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Calculer l’augmentation moyenne du prix d’un article ayant subi 3 hausses de 5%, 6%, 8% et 2 baisses de 3% et 4%

A

Pour déterminer l’augmentation moyenne, il faut d’abord calculer la moyenne géométrique G des coefficients multiplicatifs associés aux augmentations et diminutions successives

G = 5√1,05x1,06x1,08x0,97x0,96
G = (1,05x1,06x1,08x0,97x0,96)^1/5
G = 1,0228
L’augmentation moyenne est donc égale à 2,28%

17
Q

En statistiques descriptives, qu’est ce que la moyenne harmonique ?
A quoi sert-elle ?

A

La moyenne géométrique de n valeurs positives xi est le nombre H dont l’inverse est la moyenne arithmétique des inverses de ces n valeurs

Soit 1/H = 1/n * (1/x1 + 1/x2 + …. + 1/xn)
ou
H = n / ((1/x1 + 1/x2 + …. + 1/xn))

Elle est utile pour calculer des vitesses moyennes

18
Q

Un cycliste a parcouru 4 étapes de 80 km chacune à la vitesse respective de 10, 20, 16 et 32km/h
Quelle est sa vitesse moyenne ?

A

Moyenne harmonique des vitesses
Distance parcourue = 4 x 80km = 320km

On divise la distance totale par la somme des durées mises à parcourir chacune des étapes
(4x 80) / (80/10 + 80/20 + 80/16 + 80/32)

On peut simplifier par 80 :
4 / (1/10 + 1/20 + 1/16 + 1/32)

H = 16,41km/h

19
Q

Quelle moyenne utiliser pour calculer une vitesse moyenne ?

Une moyenne de pourcentages d’augmentations et diminitions

A
  • Vitesse moyenne : Moyenne harmonique

- Moyenne de pourcentages : Moyenne géométrique

20
Q

En statistiques descriptives, qu’est ce que les quantiles ?

A

Les valeurs du caractère xi qui partagent la série statistique en n séries de même effectif

Selon la valeur de n, les quantiles sont appelés :
Médiane : n=2
Quartiles : n=4
Déciles : n=10
Centiles : n=100
21
Q

En statistiques descriptives, qu’est ce que la médiane ?

A

La valeur de xi qui partage la série statistique en 2 séries de même effectif
Il y a donc autant de valeurs inférieures à la médiane que de valeurs supérieurs

22
Q

Comment calculer la médiane si la variable est discrète ?

A

Ranger les données dans l’ordre croissant

  • Effectif total N impair : valeur du caractère xi de rang N+1 /2
  • Effectif total N pair : moyenne arithmétique des 2 valeurs de xi de rang N/2 et N+1 /2
23
Q

Comment calculer la médiane si la variable est continue ?

A

Ranger les données dans l’ordre croissant

On retient la classe associée à l’effectif cumulé croissant représentant au moins 50% de l’effectif total

24
Q

En statistiques descriptives, qu’est ce que les quartiles ?

A

Les 3 valeurs Q1, Q2 et Q3 du caractère qui partagent la série en 4 parties de même effectif
25% de l’effectif total a une valeur inférieur à Q1
Q2 = Me
75% de l’effectif total a une valeur inférieur à Q3

25
Q

Comment calculer les quartiles si la variable est discrète ?

A

Ranger les données dans l’ordre croissant

Si l’effectif total n’est pas un multiple de 4, alors les quartiles Q1 et Q3 sont respectivement les termes de rang immédiatement supérieurs à N/4 et 3N/4

Si l’effectif total est un multiple de 4, alors les quartiles Q1 et Q3 sont respectivement les termes de rang N/4 et 3N/4

26
Q

Paramètres de dispersion : qu’est ce que l’étendue d’une statistique ?

A

La différence entre la plus grande valeur xmax et la plus petite valeur xmin du caractère
Notée e

27
Q

Paramètres de dispersion : qu’est ce que l’intervalle interquartile d’une statistique ?

A

{Q1 ; Q3} est l’intervalle interquartile d’une série, il contient 50% de l’effectif

A ne pas confondre avec l’écart interquartile

28
Q

Paramètres de dispersion : qu’est ce que l’écart interquartile d’une statistique ?

A

Q3-Q1 : mesure la dispersion des valeurs xi autour de la médiane
Plus l’écart est petit, plus les valeurs appartenant à l’intervalle interquartile sont proches de la médiane

29
Q

Avantage de l’écart interquartile d’une statistique en tant que paramètre de dispersion, par rapport à l’étendue ?

A

N’intègre que 50% de l’effectif total, ce qui a pour effet d’éliminer l’influence des valeurs extrêmes, souvent marginales

30
Q

Représentations graphiques : qu’est ce qu’un diagramme à secteurs ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?

A

Un camembert

L’effectif est représenté par un disque de mesure 360°
On partage ce disque en secteur angulaires dont les mesures des angles au centre sont proportionnelles aux fréquences de chaque modalité

Ex : le produit A a une fréquence de 24% : la part de disque correspond à un angle au centre de 360°x0,24 = 86,4°

Utilisé pour les variables qualitatives

31
Q

Représentations graphiques : qu’est ce qu’un diagramme à bandes ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?

A

Représente les modalités par des bandes dont la hauteur est proportionnelle aux effectifs

Utilisé pour les variables qualitatives

A ne pas confondre avec

  • l’histogramme, où les bandes sont “collées” : pour les variables quantitatives continues
  • le diagramme en bâtons : pour les variables quantitatives discrètes
32
Q

Représentations graphiques : qu’est ce qu’un diagramme en bâtons ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?

A

Représente les modalités par des bâtons dont la hauteur est proportionnelle aux effectifs

Utilisé pour les variables quantitatives discrètes

A ne pas confondre avec

  • l’histogramme, où les bandes sont “collées” : pour les variables quantitatives continues
  • le diagramme en bandes : pour les variables qualitatives
33
Q

Représentations graphiques : qu’est ce qu’un histogramme ?
Comment le construit-on ?
Dans quels cas l’utilise-t-on ?

A

Un diagramme composé de rectangles continus dont l’aire est proportionnelle à l’effectif de chaque classe

On associe à chaque classe {ai;ai+1{ un rectagle dont la largeur est ai+1 - ai et dont l’aire est propotionnelle à l’effectif ni associé à cette classe

Cas particulier : si les amplitudes des classes sont inégales : on divise les effectifs des classes d’amplitude plus importante pour obtenir des effectifs rectifiés à l’unité choisie (les hauteurs des rectangles) et ainsi obtenir des aire de rectangle proportionnelles à l’effectif de chaque classe
=> comme les cases sont “plus larges”, la hauteur doit être “rabaissée”

34
Q

Tracer la courbe des effectifs cumulés croissant ou décroissants

Cas particulier dans le cas où la variable est continue ?

A

Abscisse : variable ou classe
Ordonnée : ECC

Si la variable est continue : l’abscisse sera la borne supérieure de cette classe pour les ECC et la borne inférieure pour les ECD

35
Q

Déterminer graphiquement la médiane et les quartiles

A

Sur la courbe des ECC :
Me : abscisse du point d’ordonnée N/2
Q1 : abscisse du point d’ordonnée N/4
Q3 : abscisse du point d’ordonnée 3N/4

36
Q

Tracer un diagramme en boite (“seringue”)

A

Calculer Q1, Me et Q3
Tracer au dessus d’une droite graduée un rectangle délimité par Q1 et Q3 et coupé par Me
Ce rectangle constitue le diagramme en boîte
Tracer ensuite 2 segments délimités par les valeurs extrêmes