Cours 3 Flashcards
Quelles sont les différences entre analyse univariée, bivariée et multivariée ?
Univariée = 1 variable Bivariée = 2 variables Multivariée = 3 ou plus
Vrai ou faux. L’utilité de l’analyse univariée est d’expliquer.
Faux, son utilité est de décrire et de présenter les données.
Quelle est l’utilité de la mesure de tendance centrale ?
C’est de résumer en un seul nombre la valeur la plus représentative d’une série statistique.
Quel type de mesure ne fait pas partie des mesures de tendance centrale :
a) Moyenne
b) Étendue
c) Mode
d) Médiane
b) Étendue
Quelle est l’utilité des mesures de position ?
Elles renseignent sur la position d’une donnée par rapport aux autres données d’une distribution ordonnée.
Quel type de mesure ne fait pas partie des mesures de position:
a) Quartile
b) Déciles
c) Écart-type
d) Quintile
c) Écart-type
Quelle est l’utilité des mesures de dispersion ?
Elles mesurent le niveau de variation ou de dispersion des variables
Quels sont les types de mesures de dispersion ? (3)
- Étendue
- Variance
- Écart-type
Quel type de mesure de tendance centrale est énormément influencé par les valeurs extrêmes ?
La moyenne
Que ce passe-t-il lorsque la moyenne, le mode et la médiane ont des valeurs similaires ?
Il y aura une distribution normale (symétrique).
Quels sont les avantages et les inconvénients du mode (mo) ?
- Avantages: Simple, facile à identifier, s’utilise avec tous les types d’échelle de mesure
- Inconvénient: ne prend pas en considération toute l’information disponible sur la distribution.
Quels sont les avantages et les inconvénients de la médiane (md) ?
- Avantage: peu influencée par les valeurs extrêmes
- Inconvénient: prend seulement en considération l’ordre des données/valeurs
Quelle est la façon de mesurer la médiane avec une variable continue ?
Diviser notre échantillon total + 1 en deux
Quelles sont les façons de mesurer la médiane avec des données groupées ou une variable ordinale ?
Se fier au pourcentage cumulatif.
OU
On doit identifier le 50e percentile (50%)
Nommez l’avantage et l’inconvénient de la moyenne.
Avantage: elle prend en considération toutes les valeurs
Inconvénient: elle est grandement influencée par les valeurs extrêmes.
Vrai ou faux. Les quantiles sont des valeurs qui partagent une distribution en un certain nombre de parties inégales.
Faux. Ce sont des valeurs qui partagent une distribution en un certain nombre de parties ÉGALES.
L’étendue renseigne sur quoi en particulier ?
L’étendue renseigne sur l’étalement des données.
Que doit-on faire pour calculer l’étendue ?
Faire la différence entre la valeur la plus élevée et la valeur la moins élevée
La variance renseigne sur quoi en particulier ?
Elle renseigne sur la variabilité/homogénéité des données
Si la variance est élevée, qu’est-ce que cela signifie ?
Cela signifie que la distribution est hétérogène (plus de différences entre les sujets).
Si la variance est faible, qu’est-ce que cela signifie ?
Cela signifie que la distribution est homogène (plus de ressemblance entre les sujets).
L’écart-type renseigne sur quoi en particulier ?
Il renseigne sur la variabilité/homogénéité des données.
Si l’écart-type est élevé que se passe-t-il ? S’il est bas que se passe-t-il ?
Élevé = hétérogénéité des données Bas = homogénéité des données
Vrai ou faux. Les mesures de dispersion s’appliquent uniquement aux variables/données qualitatives.
Faux. Les mesures de dispersion s’appliquent uniquement aux variables QUANTItatives.
Vrai ou faux. Plus la variation/dispersion est grande, plus la variance est élevée.
Vrai
Le diagramme en bâton est particulièrement utile pour quel type de variable ?
Pour les variables ordinales.
Le diagramme circulaire est particulièrement utile pour quel type de variable ?
Pour les variables nominales (avec peu de catégories)
L’histogramme est particulièrement utile pour quel type de variable ?
Pour les variables continues.