MAT 350_COURS 1 Flashcards
Quelle est la première étape de l’analyse descriptive d’un jeu de données ?
La première étape est de représenter graphiquement les données à l’aide de tableaux et de graphiques appropriés.
Quelle est la deuxième étape de l’analyse descriptive ?
Mesurer et résumer les principaux aspects de la distribution des données en calculant des statistiques descriptives ou mesures échantillonnales.
Quelle est la troisième étape de l’analyse descriptive ?
Procéder à un certain nombre de validations et étudier certains aspects techniques importants des données.
Comment sont parfois appelées les données extravagantes ?
Les données extravagantes sont parfois appelées données extrêmes, aberrantes ou, en anglais, “outliers”.
Pourquoi est-il courant de vouloir vérifier l’hypothèse de la normalité des données ?
Il est courant de le vérifier car cela est nécessaire pour certaines techniques statistiques utilisées dans l’inférence statistique.
Quelles sont les trois principales mesures de tendance centrale ?
Les trois principales mesures de tendance centrale sont le mode, la médiane et la moyenne.
Comment est défini le mode d’un échantillon ?
Le mode d’un échantillon, noté Mo, correspond à la valeur qui revient le plus souvent.
Quelle est la particularité du mode par rapport à la moyenne et la médiane dans une distribution bimodale ?
Dans une distribution bimodale, le mode est la seule mesure de tendance centrale qui tient compte des deux “pics” de la distribution, alors que la moyenne et la médiane peuvent tomber à des endroits moins intéressants de cette distribution
La marge d’erreur de l’intervalle de confiance est-elle influencée par des valeurs extrêmes ?
Non, le mode et la médiane sont des mesures robustes, c’est-à-dire qu’elles ne sont pas influencées par des valeurs extrêmes. La moyenne, en revanche, n’est pas une mesure robuste
Quelle est la mesure de tendance centrale à privilégier pour une distribution fortement asymétrique ?
Pour une distribution fortement asymétrique, il est préférable d’utiliser la médiane.
Comment sont définies les distributions symétriques en relation avec la moyenne et la médiane ?
Pour des distributions symétriques, la moyenne et la médiane sont très proches.
Qu’indique une distribution avec une asymétrie positive concernant la moyenne et la médiane ?
Si la distribution présente une asymétrie positive (forte concentration de données à valeurs peu élevées), la moyenne sera nécessairement supérieure à la médiane.
Et qu’en est-il pour une distribution avec une asymétrie négative ?
Si la distribution présente une asymétrie négative (forte concentration de données à valeurs élevées), la moyenne sera inférieure à la médiane.
Comment choisir la mesure de tendance centrale à utiliser ?
On doit d’abord tracer le graphique pour représenter les données et choisir ensuite la mesure de tendance centrale à privilégier selon l’allure de ce graphique.
Quelle est la particularité du mode lorsqu’il est utilisé pour une variable qualitative ?
Le mode est la seule mesure de tendance centrale qui puisse être utilisée lorsque la variable est qualitative.