Description et exploration des données 2 Flashcards

1
Q

Quelles sont les mesures de dispersion/variabilité?

A
  • Étendue
  • Écart semi-interquartile
  • Variance et écart-type
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que l’étendue?

A

Représente l’étalement des données (max-min)

**Sensible aux valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que l’écart semi-interquartile (Q)?

A
  • Cherche à déterminer à quoi correspond 25% du centre = donne un indice sur la dispersion des données (Q petit = dispersion petite)
  • Avantage: pas affecté par les valeurs extrêmes (mieux qu’écart-type pour ça)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quand utilisons-nous l’écart semi-interquartile?

A
  • Si on a une variable continue non normale (quand médiane est meilleure mesure de tendance centrale)
  • Si on a une variable ordinale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi est-ce qu’on n’utilise pas la moyenne des écarts à la moyenne?

A

Parce que ça donne toujours 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi est-ce qu’on n’utilise pas l’écart absolu moyen (EAM)/déviation de la moyenne?

A

Consiste à enlever les (-)… Parce qu’elle n’a pas d’utilité en statistiques (analyses développées en fonction de la variance: moyenne des écarts à la moyenne au carré)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la variance (S2)?

A

Caractérise l’éparpillement autour de la moyenne pour les variables CONTINUES (moyenne des écarts à la moyenne au carré)

C’est la principale mesure de dispersion!! Elle est à la base de plusieurs analyses inférentielles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les limites de la variance?

A
  1. Difficile à interpréter car pas même unité de mesure que la variable
  2. Très influencé par les valeurs extrêmes

**Rare qu’on voit le score de la variance dans les études

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les étapes du calcul de la variance?

A
  1. Calculer l’écart à la moyenne pour chaque observation
  2. Mettre les écarts au carré
  3. Faire la somme
  4. Diviser par le nombre d’observation -1 (pour faire la moyenne)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

En quoi consiste le degré de liberté (ddl)?

A

À chaque fois qu’on fait une estimation, on doit soustraire par 1 le nombre d’observation parce que cela correspond aux positions que l’on peut librement choisir en fonction de la moyenne fixée. (N-1)

Ex: équipe de soccer

**Si population complète (o2), pas de ddl perdu (juste N)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En quoi consiste l’écart-type (S)?

A
  • C’est la racine carrée de la variance
  • Même unité de mesure que la variable!
  • Valeur faible = petite dispersion autour de la moyenne
  • Si ÉT = 0, toutes les observations ont la même valeur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les avantages et limites de l’écart-type?

A

A:

  • Meilleur complément à la moyenne
  • Mesure de dispersion la plus utilisée

I:

  • Plus long à calculer
  • Sensible aux valeurs extrêmes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que se passe-t-il avec l’écart type si:
Changement d’origine (ex: +2 à toutes les valeurs)?
Changement d’échelle (on multiplie les valeurs ex: travail sur 20 amené sur 100)?

A

Origine: l’écart-type ne change pas!!

Échelle: Multiplier ou diviser l’écart-type par la même valeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelles mesures devons-nous présenter si on a une variable nominale?

A

Le mode

Les fréquences relatives pour TOUTES les catégories (excepté 0%)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles mesures devons-nous présenter si on a une variable ordinale?

A

Médiane et Écart semi-interquartile
Mode
Fréquences relatives pour toutes les catégories

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles mesures devons-nous présenter si on a une variable continue NORMALE?

A

Moyenne et Écart-type
Indices d’asymétrie et d’aplatissement
Min et Max pour étendue

17
Q

Quelles mesures devons-nous présenter si on a une variable continue NON-NORMALE?

A

Moyenne et Écart type
Indices d’asymétrie et d’aplatissement (préciser sens!)
Médiane et Écart semi-interquartile

18
Q

Qu’est-ce qu’une valeur extrême?

A
  • Valeur qui diffère de la distribution et qui s’éloigne de la moyenne de façon significative:
    1. transformant en score Z (Z plus grand ou = à ÉT de 3,29)
    2. Avec graphique boîte à moustache

-Biaise la moyenne, étendue, la variance et l’écart type

19
Q

Quelle est la différence entre une valeur extrême et une valeur aberrante?

A

La valeur extrême a un score Z au delà de 3,29 ÉT

La valeur aberrante est ATTENDUE dans une distribution et est comprise entre 1,96 et 3,28

20
Q

Quelles sont les 3 options lorsqu’on repère une valeur extrême?

A
  1. Vérifier si erreur et corriger (ex: 77 au lieu de 7)
  2. Traiter la valeur comme manquante pour l’exclure des analyses ET le mentionner
  3. Winsorizing: attribuer la valeur maximale non extrême (Z = 3) à la valeur extrême ET le mentionner
21
Q

Quelles sont les mesures de position?

A

Permettent d’évaluer la performance d’une personne par rapport aux autres

  • Centiles (pourcentile): sur 100 et noté Ck
  • Quartiles: bonds de 25
  • Quintile: bonds de 20
  • Déciles: bonds de 10
22
Q

En quoi consiste la cote standard/cote Z?

A
  • Décrit la distance d’une observation par rapport à la moyenne (en unité d’écart type)
  • Permet de comparer variables qui n’auraient pas la même unité de mesure (les rend = et comparables)