Cours 4, 31 janvier: Statistiques descriptives Flashcards
1
Q
les 3 temps de l’analyse statistique
A
1-statistiques univariées 2-analyses bivariées et 3-analyses multivariées
2
Q
tendance centrale
A
mode, moyenne, médiane
3
Q
dispersion
A
écart-type
4
Q
forme
A
asymétrie
5
Q
truc entre nominal et ordinale
A
ordinal y’a un ordre mais nominal pas de sens
6
Q
à quoi sert l’histogramme
A
pour voir la distribution
7
Q
mode
A
- La valeur la plus fréquente dans une distribution
- Très rarement utile
- Aucun intérêt, peut être trompeur.
8
Q
moyenne
A
- Mesure la plus utilisée de tendance
centrale - Se calcule par la somme des valeurs
divisé par le nombre de valeurs - Est valide pour variable ordinale ou
intervalle, ou pour nominale dichotomique en forme 0-1. - Est valide seulement pour distribution
normale - S’il y a des valeurs extrêmes, il faut les
éliminer de la base de données - Est attirée par quelques valeurs plus
élevées
9
Q
Médiane
A
- Mesure fréquemment utilisée
- Indique la valeur qui permet de séparer en deux parties égales un ensemble de données
- La médiane n’est pas influencée par les valeurs plus élevées
- Est valide pour variable ordinale ou intervalle
- Est un meilleur indicateur de tendance centrale dans une distribution pas normale (dans distribution normale, médiane = la moyenne)
10
Q
l’écart-type
A
- L’écart-type est la principale mesure de dispersion utilisée. Il indique jusqu’ a quel point les observations se rapprochent ou se dispersent autour de la moyenne.
- Dans une courbe normale, à + ou - un ET de la moyenne, on retrouve 68% des sujets et a + ou – 2 ET on retrouve 95% des sujets
- Dans la classe ici, on a probablement une moyenne de 20 ans d’âge et un très petit écart type (1?).
- Renseigne sur la distribution, si on a une courbe platykurtique (applatie) ou leptokurtique (concentrée). Kurtose dans SPSS.
- La dispersion va jouer, lors des tests de moyenne, sur la signification
- Est valide pour variable ordinale ou intervalle/ratio (pas de dispersion pour variables dichotomiques)
11
Q
la courbe normale
A
- On se réfère souvent à la; courbe normale et la plupart de tests statistiques présupposent que la courbe de la distribution est normale.
- Mais les distributions sont rarement parfaitement normales.
- Pour savoir si la courbe est normale, on la regarde. Il existe des tests de normalité
mais ils sont problématiques.
12
Q
asymétrie
A
- Distribution asymétriques positive très fréquentes dans les sciences sociales: richesse, poids, éducation, fréquence cardiaque…
- Pour les fins des tests statistiques les courbes doivent être symétriques (ou pas trop asymétriques)
- Il y a des coefficients qui mesurent l’asymétrie et sont basés sur l’écart entre moyenne et médiane. Statistique d’asymétrie (skewness) dans SPSS
- Pour nous, il est suffisant de s’assurer que la moyenne et médiane ne sont pas trop loin et que la forme générale de l’histogramme n’est pas exagérément asymétrique.
- Si ca semble problématique, couper les valeurs extrêmes et dire dans la métho que l’étude porte sur les cas normaux.
- Par exemple, vous faites une étude sur les habitudes alimentaires et le surpoids et vous avec quelques sujets de 450 lbs dans votre échantillon. Out. L’étude porte alors sur les gens de 300 lbs et moins.
13
Q
majorité des formes asymétrie
A
asymétrie positive
14
Q
exemple distribution normale pas asymétrie positive
A