Tendance centrale, dispersion et position Flashcards

1
Q

Quelles sont les 3 mesures de tendance centrale?

A
  • Mode
  • Médiane
  • Moyenne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi on a besoin des mesures de tendance centrale?

A

Car on veut caractériser la distribution entière des données sur une variable
==> les mesures de tendance centrale permettent caractériser une série statistiques avec une valeur ou modalité typique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que le mode?

A

Le centre de concentration–> reflète la modalité la + fréquente
–>indiquent pas le nb d’ind. qui correspond au mode ni comment les ind sont dispersés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que la médiane?

A

divise une série statistique en 2 groupes: avec chacun 50% des données
==> l’échelle de mesure doit être au moins ordinale pour avoir une médiane
==> + robuste que la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment calculer la médiane pour une variable qualitative ordinale?

A
  1. classer les données par ordre croissant
    • si la série a un nb d’observation pair, la médiane est au rang n/2
    • si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment calculer la médiane pour une variable quantitative?

A
  1. Si pas groupée, on les classe par ordre croissant
  2. -si la série a un nb d’observation impair, la médiane est au rang (n+1)/2
    • si la série a un nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2) +1

Si elles sont groupées par valeurs:

  • si nb observations impair, la médiane est au rang (n+1)/2
  • si nb d’observation pair, la médiane est au rang de la moyenne des données de rang n/2 et (n/2)+1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la moyenne?

A

Le score moyen de tous les sujets
–>elle quantifie les distances qui séparent de la médiane
==> il faut une échelle de mesure au moins d’intervalles, mais souvent on calcule la moyenne d’une variable qualitative ordinale alors qu’elle a pas d’intervalle, mais on fait comme si
==> moyenne dépend bcp des codes arbitaires + sensibles aux valeurs extrême

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les 3 types de distributions unimodales?

A
  • distribution relativement symétrique (cloche)–> pas d’asymétrie car autant d’ind à droite qu’à gauche du centre (médiane)==> médiane, moyenne et mode se confondent
  • distribution asymétrique positive: car les valeurs poussent vers le + (la moyenne aussi)
  • distribution asymétrique négative: car les valeurs poussent vers le - (la moyenne aussi)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

A quoi sert une mesure de dispersion?

A

A quantifier l’étalement et la variabilité des données et donc leur degré d’homogénéité et de concentration

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les 4 mesures de dispersion?

A
  • L’étendue
  • La variance
  • L’écart-type
  • L’écart interquartile
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que l’étendue?

A

Distance entre le max et le min
==> pour échelle ordinale ou supérieures
==> très sensible aux valeurs extrêmes donc pas robustes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que la variance?

A

La distance à la moyenne

—>+ on est proche de la moyenne, + la variance est petite

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment calculer la variance?

A
  1. Calculer la moyenne des sujets
    2 On fait: (donnée 1- moyenne)2 + (donnée 2-moyenne)2 .. etc / n-1

Quand les valeurs sont regroupées:

  1. calculer la moyenne
  2. donné1 x(modalité-moyenne)2 + donné1 x(modalité-moyenne)2 etc /n-1

==> variance s’exprime pas dans la même échelle que la variable car au carré, donc besoin de l’écart type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’écart-type?

A

racine carrée de la variance
==>pour retomber sur une distance dans l’échelle
==>si l’écart type est petit, les données sont concentrées autour de la moyenne
==> donc même unité que la variable !

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que l’écart interquartile?

A

-Donne indication de ou se trouvent les 50% centraux de la dispersion
-+ robuste que la variance
==> pour échelles ordinales ou supérieures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les mesures de position?

A

Situent les données les une par rapport aux autres

17
Q

Quelles sont les différentes mesures de positions?

A
  • les rangs
  • quantiles
  • score z
18
Q

Qu’est-ce que les rangs?

A

Une mesure de postions
–> donne la position d’une donnée dans une série statistique ordonnée
==> échelle ordinale ou supérieure

19
Q

Qu’est-ce que les quantiles?

A

Une mesure de position
–> divise une série statistique ordonnée en groupe de même proportion de données
==> échelles ordinales et supérieures
- les quartiles: divisé en 4 groupes de 25%: 4 groupe et 3 quartiles –> q
- les quintiles: divisé en 5 groupes de 20%: 5 groupes et 4quintiles
- les déciles: divisée en 10 groupes de 10%: 10 groupes et 9 déciles
- les centiles: divisée 100 groupes de 1%: 100 groupes mais 99 centiles

20
Q

Qu’est-ce que le score z?

A

-Mesure de position
-indique à combien d’écart type on se trouve pas rapport à la moyenne==> position du sujet par rapport à la série statistique
==> échelle d’intervalle ou supérieure

z= (données - moyenne)/ écart-type

  • compris en -3 et 3 en général
  • pas d’unités
  • une série stat traduite en score z a toujours une moyenne de 0 et un écart-type de 1
21
Q

Qu’est-ce que l’écart interquartile?

A

écart ente Q3 et Q1 = écart entre les extrémité du groupe de données qui occupent les 50% du centre de la série stat

22
Q

Qu’est-ce qu’un box plot et de quoi est-il constitué?

A

Résume la distribution d’une variable quantitative continue
4 parties:
- un boite (=écart interquartile–>centre de concentration des données, indique ou sont les 50% des individus autour de la tendance centrale
- ligne/carré dans la boite: médiane
-moustaches: disent la distance de au max 1,5X l’écart interquartile–> dit si on a une asymétrie négative ou positive ou distribution centrale