MAT 350_COURS 1 Flashcards

1
Q

Quelle est la première étape de l’analyse descriptive d’un jeu de données ?

A

La première étape est de représenter graphiquement les données à l’aide de tableaux et de graphiques appropriés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle est la deuxième étape de l’analyse descriptive ?

A

Mesurer et résumer les principaux aspects de la distribution des données en calculant des statistiques descriptives ou mesures échantillonnales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la troisième étape de l’analyse descriptive ?

A

Procéder à un certain nombre de validations et étudier certains aspects techniques importants des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment sont parfois appelées les données extravagantes ?

A

Les données extravagantes sont parfois appelées données extrêmes, aberrantes ou, en anglais, “outliers”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi est-il courant de vouloir vérifier l’hypothèse de la normalité des données ?

A

Il est courant de le vérifier car cela est nécessaire pour certaines techniques statistiques utilisées dans l’inférence statistique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les trois principales mesures de tendance centrale ?

A

Les trois principales mesures de tendance centrale sont le mode, la médiane et la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment est défini le mode d’un échantillon ?

A

Le mode d’un échantillon, noté Mo, correspond à la valeur qui revient le plus souvent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la particularité du mode par rapport à la moyenne et la médiane dans une distribution bimodale ?

A

Dans une distribution bimodale, le mode est la seule mesure de tendance centrale qui tient compte des deux “pics” de la distribution, alors que la moyenne et la médiane peuvent tomber à des endroits moins intéressants de cette distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

La marge d’erreur de l’intervalle de confiance est-elle influencée par des valeurs extrêmes ?

A

Non, le mode et la médiane sont des mesures robustes, c’est-à-dire qu’elles ne sont pas influencées par des valeurs extrêmes. La moyenne, en revanche, n’est pas une mesure robuste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la mesure de tendance centrale à privilégier pour une distribution fortement asymétrique ?

A

Pour une distribution fortement asymétrique, il est préférable d’utiliser la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment sont définies les distributions symétriques en relation avec la moyenne et la médiane ?

A

Pour des distributions symétriques, la moyenne et la médiane sont très proches.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’indique une distribution avec une asymétrie positive concernant la moyenne et la médiane ?

A

Si la distribution présente une asymétrie positive (forte concentration de données à valeurs peu élevées), la moyenne sera nécessairement supérieure à la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Et qu’en est-il pour une distribution avec une asymétrie négative ?

A

Si la distribution présente une asymétrie négative (forte concentration de données à valeurs élevées), la moyenne sera inférieure à la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment choisir la mesure de tendance centrale à utiliser ?

A

On doit d’abord tracer le graphique pour représenter les données et choisir ensuite la mesure de tendance centrale à privilégier selon l’allure de ce graphique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la particularité du mode lorsqu’il est utilisé pour une variable qualitative ?

A

Le mode est la seule mesure de tendance centrale qui puisse être utilisée lorsque la variable est qualitative.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Le mode est-il toujours unique ?

A

Non, le mode n’est pas nécessairement unique.

17
Q

Quelle est la relation entre la médiane et les quartiles ?

A

La médiane est aussi une mesure de position ; elle représente le deuxième quartile.

18
Q

Comment le mode et la médiane réagissent-ils face à des données extrêmes ?

A

Le mode et la médiane sont des mesures robustes, c’est-à-dire qu’elles ne sont pas influencées par des valeurs extrêmes.

19
Q

ans l’exemple donné, quelles sont les valeurs du mode, de la médiane et de la moyenne pour l’échantillon : 10, 10, 15, 20 et 25 ?

A

Mo = 10, Md = 15 et ˉx= 16.

20
Q

Qu’est-ce qu’une unité statistique ?

A

Une unité statistique est une unité d’observation ou de mesure pour laquelle des données sont recueillies ou dérivées. Par exemple, lorsqu’on fait un sondage dans une certaine population, les unités statistiques sont les individus qui forment cette population

21
Q

Comment définiriez-vous une variable en statistiques ?

A

Une variable est une caractéristique d’une unité statistique qui peut prendre différentes valeurs pour différentes unités statistiques.

22
Q

Quelles sont les modalités d’une variable ?

A

Les modalités sont les différentes valeurs qu’une variable peut prendre.

23
Q

Donnez un exemple illustrant une unité statistique, une variable et ses modalités.

A

Dans l’exemple où l’on s’intéresse à la note à l’examen final dans un cours de mathématiques pour un groupe d’étudiants ayant été préalablement soumis à une séance d’hypnose destinée à augmenter leur confiance en soi :
Les unités statistiques sont les étudiants soumis à la séance d’hypnose.
La variable d’intérêt est : X = “La note à l’examen final au cours de mathématiques”.
Les modalités de la variable sont [0, 100].

24
Q

Pourquoi est-il nécessaire de déterminer la nature et les modalités de chaque variable ?

A

Il est nécessaire de déterminer la nature et les modalités de chaque variable car cela déterminera l’ensemble des analyses statistiques qui seront disponibles, les graphiques qui pourront être utilisés, etc.

25
Q

Quel est l’objectif principal de la caractérisation d’un jeu de données en statistiques ?

A

L’objectif est de dresser un portrait général des données, d’identifier les variables, de comprendre ce qui est mesuré, dans quelles unités, et de déterminer l’allure des données.

25
Q

Quelle est la définition d’un diagramme à bâtons ?

A

Le diagramme à bâtons est un graphique qui associe à chaque valeur observée d’une variable quantitative discrète, un segment (bâton) dont la hauteur est proportionnelle à la fréquence de cette valeur.

25
Q

Qu’est-ce qu’une distribution unimodale ?

A

Une distribution unimodale est une distribution qui comporte un seul “pic” ou mode.

25
Q

Comment détermine-t-on si une distribution est symétrique ou asymétrique ?

A

Une distribution est considérée comme symétrique lorsque les données se répartissent comme une image miroir de chaque côté de la moyenne ou de la médiane.

26
Q

Comment définiriez-vous une variable qualitative nominale ?

A

Une variable qualitative nominale est une variable qui catégorise ou étiquette des unités statistiques sans ordre ou hiérarchie particulière entre les catégories.

27
Q

Quelle est la différence entre une variable quantitative discrète et une variable quantitative continue ?

A

Une variable quantitative discrète peut prendre un nombre fini ou dénombrable de valeurs, souvent le résultat de comptages. Une variable quantitative continue peut prendre une infinité de valeurs dans un intervalle donné, généralement le résultat de mesures.