Cours 2 - Présentation des données Flashcards

1
Q

Sous quelles forme peut-on illustrer les données?

A
  • Tableau de contingence (ou de fréquence)
  • Graphiques (histogramme)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une série statistique simple?
Donner un exemple.

A

Une seule variable observée (mesurée) pour un ensemble d’éléments (l’échantillon)

Concentration plasmatique en cholestérol sur l’ensemble n de sujets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une série statistique double-triple-etc?

A

On mesure de multiples variables sur chaque élément

Âge, sexe, genre du sujet, etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une série statistique double-triple-etc?

A

On mesure de multiples variables sur chaque élément

Âge, sexe, genre du sujet, etc

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce qu’un tableau de contingence?

A

Un tableau à plusieurs dimensions (variable)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’un tableau de contingence?

A

Un tableau à plusieurs dimensions (variable)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qu’un diagramme à bâtons?

A

C’est une diagramme pour des variables qualitatives ou semi-quantitatives ou les variables quantitatives discrètes (si nombre de classes est restreint). Permet de visualiser un jeu de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les étapes de construction d’un histogramme?

A
  1. Calcul du nombre de classes
  2. Calcul de l’intervalle de classe
  3. Identifier les bornes des classes
  4. Attribuer chacune des observations à une seule classe
  5. Compter combien d’observations sont présentes dans chaque classe
  6. Vérifier que la somme des fréquences absolues est égale à n
  7. Identifier la classe qui a le plus de valeurs pour déterminer la borne supérieure de l’axe des y (fréquence absolue)
  8. Dessiner la structure de l’histogramme avec l’axe des x et y
  9. Dessiner le bâton pour chacune des classes en fonctions de sa fréquence absolue
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment calculer le nombre de classes pour construire un histogramme?

A

Règle de Sturges : Nb de classes = 1 + 3.3*log(n)

Règle de Yule : Nb de classes = 2.5*4racine(n)

On arrondit à l’entier supérieur dans les 2 cas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment calculer l’intervalle des classes pour construire un histogramme?

A

h = étendue de variation / nb de classes

étendue de variation : max - min

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment identifier les bornes pour construire un histogramme?

A

Il faut faire coïncider les bornes et indices de classes avec des nombres comportant peu de décimales (chiffres ronds).
Avec des variables quantitatives : histogramme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que la fréquence absolue ou l’effectif de classe?

A

Le nombre d’éléments appartenant à chaque classe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la fréquence absolue ou l’effectif de classe?

A

Le nombre d’éléments appartenant à chaque classe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que permet le diagramme à moustache?

A

D’illustrer des données quantitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est que le diagramme à moustache mets en lumière?

A
  • Médiane
  • Écart interquartile
  • Étendue de variation
  • Valeurs extrêmes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que représente le premier quartile ?

A

25% des observations ont une valeur inférieure au 1er quartile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Que représente la médiane?

A

50% des observations ont une valeur supérieure à la médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Que représente le troisième quartile?

A

25% des observations ont une valeur supérieure au 3e quartile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qu’est-ce que sont des séries statistiques doubles et que comprennent-elles?

A

Un ensemble d’éléments pour lesquels on a observé ou mesuré 2 variables.

1re variable : aléatoire
2e variable : aléatoire ou contrôlées

20
Q

Donne des exemples de séries statistiques doubles

A
  • Variable contrôlée est la dose d’hormone injectée et la variable aléatoire est le rythme cardiaque mesuré
  • 2 variables aléatoires : nombre de colonies et couleurs de colonies
21
Q

Dans une série de statistique double quel type de diagramme doit-on tracer lorsque les deux variables sont quantitatives?

A

Un diagramme de dispersion

22
Q

Quels sont les 3 paramètres de positions faisant partie de paramètres d’une distribution ?

A
  • Moyenne
  • Médiane
  • Mode
23
Q

Que sont les paramètres de position?

A

Ce sont les valeurs centrales autour desquelles se groupent les valeurs observées

24
Q

Que sont les paramètres de dispersion?

A

Renseignent quant à l’étalement de la distribution des valeurs autour des valeurs centrales

25
Q

Quels sont les paramètres de dispersion (3) des paramètres d’une distribution?

A
  • Variance
  • Écart-type
  • Coefficient de variation
26
Q

Que représente 𝜇x?

A

La moyenne de la distribution théorique (population statistique) des éléments x

27
Q

Pourquoi 𝜇x est elle une valeur moins réaliste a calculer?

A

Puisqu’elle comprend toute la population statistique, chose qui est irréaliste pour un scientifique ayant un budget serré

28
Q

Que représente 𝑥 (barre en haut)?

A

La moyenne chez les échantillons.
Une formule est accordée pour un diagramme à bande et une autre chez échantillons.

29
Q

Que représente Mex?

A

C’est le paramètre de position qui représente la médiane.

Valeur de l’observation qui se situe au centre de la série statistique classée en ordre croissant. La médiane sépare la série en deux groupes égaux.

30
Q

Qu’arrive t-il si n est pair, comment identifier la médiane?

A

La médiane est entre les deux valeurs centrales, on en fait la moyenne par convention.

31
Q

À quoi correspond Mox?

A

Valeur d’une variable ayant la plus grande fréquence.

Peut être poly modale s’il y a plusieurs classes non contigües

32
Q

Quels indicateurs de positions sont-ils à privilégier lorsqu’on se retrouve face à une distribution symétriques?

A

Analyse par la moyenne.

33
Q

Quels indicateurs de positions sont-ils à privilégier lorsqu’on se retrouve face à une distribution asymétriques?

A

Analyse par la médiane et le mode

34
Q

Quelles sont les principales caractéristiques de la moyenne?

A
  • facile à calculer
  • l’indicateur le plus précis (pour distribution unimodale), car minimise la Somme des Carrés des Écarts SCEE
  • très affectée par les valeurs extrêmes
35
Q

Quelles sont les principales caractéristiques de la médiane?

A
  • difficile à calculer (il faut trier les données) - plus précise que le mode
  • moins affectée que la moyenne par les valeurs extrêmes (dans les cas d’asymétrie)
  • contient moins d’information que la moyenne car basée seulement sur les rangs et non les valeurs
  • ne requiert pas des mesures aussi précises que la moyenne
36
Q

Quelles sont les principales caractéristiques du mode?

A
  • difficile à calculer mais facile à identifier sur un graphique
  • pas affecté par les valeurs extrêmes (indique bien la tendance centrale d’une distribution asymétrique) - convient bien dans les cas polymodaux et pour les variables qualitatives
37
Q

Définir la variance?

A

Mesure la variabilité des valeurs autour de la moyenne

38
Q

Quels sont les différents sigles pour différents jeux de données pour la variance?

A

Échantillon : s2x
Population statistique (entière) ou distribution théorique : 𝜎2

39
Q

Écrire les différentes formules de la variance

40
Q

Que représente le nombre de degrés de liberté?

A

La valeur (n - 1)
Permet d’éliminer le biais dû au fait qu’on doit utiliser les données x une première fis pour calculer la moyenne avant de calculer la variance,

41
Q

Quelles sont les propriétés de la variance?

A
  • Si tous les xi sontégaux, la variance est nulle.
  • La variance augmente quand variabilité augmente.
    Il faut au moins deux observations pour estimer la variance, sinon n – 1 est 0 et la valeur de la variance est indéterminée (division par 0!)
  • Unités de la variance sont celles de la variable au carré
42
Q

Que représente l’écart type et quel est son sigle pour une population statistique et pour un échantillon?

A

C’est la racine carrée de la variance

Population statistique : 𝜎
Échantillon : sx

43
Q

Que représente le coefficient de variation et quel est son sigle?

A

CV est une mesure de dispersion relative (%) qui permet de comparer la variation de variables exprimées dans des unités physiques ou des échelles différentes.

44
Q

En quoi le coefficient de variation diffère de la variance et de l’écart type?

A

Le CV mesure une dispersion relative, tandis que les deux autres sont des mesures de variation absolue.

45
Q

Écrire la formule de CV et expliquer pourquoi cette formule n’a de sens que pour les variables quantitatives à échelle relative à un vrai zéro.