Cours 2 Flashcards

1
Q

Statistique descriptive

A

Ensemble de techniques numériques et graphiques qui permettent de résumer et visualiser les donnéesq

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Distribution de données

A

Catégories avec valeurs les plus élevées est en haut;
Intervalles continus (étendue/nombre de catégories voulues);
Pas de données dans deux catégories
Limite réelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Trois approches des données extrêmes

A

Vérifier s’il y a une erreur
Les exclure ou utiliser des indices qui minimisent les biais
que celles-ci pourraient causer
Les inclure dans les analyses et les étudier davantage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Distribution relative des données

A

fréquence relative = f/ftotal(n)

utile si on veut comparer deux échantillons de tailles différentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Distribution cumulative des données

A

additionner à chaque catégorie la somme
de chaque catégorie en dessous
fréquences cumulatives ne font de sens avec des données qualitatives car les données ne peuvent pas être ordonnées en ordre de magnitude*

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Rang centile

A

proportion ou le
pourcentage des mesures dans la distribution qui ont une
valeur égale ou inférieure à celle-ci;
correspond au pourcentage cumulatif si distribution simple
rang centile de X = pourcentage cumulatif inférieur à X +
0,5*pourcentage à X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Histogramme (quantitatives)

A
X = catégories; 
Y = fréquences; 
Désavantage : nombre
de barres peut changer l’interprétation des
données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Polygone de fréquences (quantitatives)

A

Permet de comparer deux échantillons différents
et de mieux visualiser la forme de la distribution
Aussi tige et feuilles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
Effet plafond (asymétrie negative) v. effet plancher
(asymétrie positive)
A

observé dans une distribution lorsque la variable
ne peut plus être mesurée en haut d’un certain niveau v.
observé dans une distribution lorsque la variable
ne peut plus être mesurée en dessous d’un certain niveau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Aplatissement

A
Propriété relevant de la dispersion (proportion de
données extremes)
Leptocurtique (+, pic) 
Mésocurtique (0); 
Platycurtique 
-> Plus l’aplatissement
est positif, meilleure
est la moyenne
comme estimé de la
distribution, et viceversa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Médiane (tendance centrale)

A

valeur centrale lorsque les données sont ordonnées du
plus petit au plus grand;
si n est impair, la rang de la médiane = (n+1)/2
si ne est pair, (n/2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Asymétrie positive v. asymétrie négative

A

Mode < Médiane < Moyenne
Moyenne < Médiane < Mode
*symétrique : moyenne = médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Forces et faiblesses du mode

A

Pas sensible aux données extremes, interprétation facile, données bimodales
v. possiblement pas unique, peut varier selon la taille des intervalles
+ effectif avec données nominales/ordinales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Forces et faiblesses de la médiane

A

F : interprétation facile, insensible aux données extrêmes

Fa : difficile d’étudier ses propriétés statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Forces et faiblesses de la moyenne

A

F : bon estimateur de la moyenne de la pop (x avec une barre), bonnes propriétés statistiques (minimise l’erreur)
Fa : sensible aux données extrêmes, pas bon pour distribution asymétrique/multimodales, pas approprié aux données nominales/ordinales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Moyenne comme “point d’équilibre”

A

La somme de tous les scores d’une distribution, exprimés comme deviation positive ou negative de la moyenne, est toujours égale à zero.