cours 5 Flashcards

1
Q

Qu’est-ce que l’analyse exploratoire des données?

A

Elle constitue l’étape préliminaire à toute analyse statistique, même la plus sophistiquée

Elle aide à orienter les analyses subséquentes (paramétriques vs. non paramétriques)

On s’attarde habituellement à trois aspects: les mesures de tendance centrale, les mesures de dispersion et la distribution des résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que les mesures de tendance centrale?

A

Elle est une mesure qui indique où se trouve la majeure partie des données ou scores d’une distribution.

Elle est un effort de synthèse : représenter un ensemble sur la base d’un seul indicateur
C’est une mesure de groupe…

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les 3 types de mesures de tendance centrale?

A

mode, médiane, moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que le mode?

A

C’est la valeur la plus fréquente d’un ensemble de données (celle qui revient le plus souvent), il peut avoir 1 mode, plusieurs mode ou aucun mode Ex: 20, 21, 20, 24, 25, 20, dans ce cas-ci le mode sera 20

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la médiane?

A

Ça correspond à l’observation du milieu, c’est-à-dire la valeur de part et d’autre de laquelle se situe la moitié des observations. Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant et coupe 50/50
Ex: 26, 25, 43, 67, 18
Si on le met en ordre croissant: 18, 25, 26, 43, 67 , la médiane est donc 26

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la moyenne?

A

Elle représente la mesure la plus courante de tendance centrale des observations. Elle se calcule en additionnant les valeurs observées de chaque individu, somme divisée par le nombre de sujets observés.
Ex: 20, 20, 40, 30 on additione tout et on divise par le nombre de valeurs (20+20+40+30)/4= 27,5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce qui pourrait faire en sorte que la moyenne et la médiane ne sont pas pareils?

A

Les valeurs extremes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que les mesures de dispersion?

A

-Les mesures de dispersion sont des indices qui caractérisent l’étalement des valeurs d’une distribution d’une variable autour d’une valeur centrale.
-Les mesures de tendance centrale ne peuvent pas décrire pleinement une distribution de scores.
-Les indices de dispersion permettent de savoir si les scores individuels se rapprochent ou s’éloignent beaucoup des mesures de tendance centrale.
-Les mesures de dispersion ne permettent pas de comparer des distributions qui ne sont pas sur la même échelle (ex : prix des bananes et prix de voitures)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les 3 principales mesures de dispersion?

A

L’étendu, la variance, l’écart type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que l’écart-type?

A

Racine carrée de la variance. C’est la plus utilisée dans le cas de la description de variables continues. L’écart-type est une mesure de dispersion qui indique à quel point les valeurs d’un ensemble de données s’écartent en moyenne de la moyenne de cet ensemble

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que signifie un écart type élevé? Et au contraire un écart type faible?

A

Un écart-type élevé signifie que les valeurs sont très dispersées, tandis qu’un écart-type faible indique qu’elles sont proches de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que l’étendue?

A

indique entre quelles valeurs les résultats varient (de minimum à maximum)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que signifie une étendue élevé?

A

Plus l’étendue est grande, plus les valeurs sont dispersées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est- ce que la variance?

A

Elle mesure la dispersion de chaque observation autour de la moyenne (doit pas savoir le calcul pour l’exam)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la distribution?

A

-Les valeurs de chaque cas pour une variable donnée

-Typiquement, les réponses sont ordonnées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qu’un fractile?

A

Séparent la distribution en groupes égaux

17
Q

Quel type de fractile est la plus fréquent?

A

Le quartile (divise par 4)

18
Q

Qu’est-ce que le kurtose (k) ?

A

C’est une mesure d’aplatissement de la distribution

19
Q

Quels sont les 3 types et à quoi ressemblent-ils?

A

Mesokurtique (k=0): Normale

Leptokurtique (k>0): haute et mince

Platykurtique (k<0): basse et large

20
Q

Qu’est ce que la symétrie (skewness)?

A

C’est une mesure d’asymétrie de la distribution

21
Q

Quels sont les 3 types d’asymétrie et à quoi ressemble leur courbe?

A

Asymétrie positive: pointe de la courbe vers l’axe des y

Pas d’asymétrie: La normale pointe de la courbe au centre

Asymétrie négative: pointe de la courbe à l’opposé de l’axe des y

22
Q

Pour une courbe asymétrie négative dans quel ordre serons la moyenne, le mode et la médiane?

A

Moyenne - Médiane - Mode

23
Q

Pour une courbe asymétrie positivedans quel ordre serons la moyenne, le mode et la médiane?

A

Mode - Médiane - Moyenne

24
Q

Lorsque le N est de moins de 30, notre variable est par défaut… paramétrique ou non paramétrique?

A

non paramétrique

25
Q

Lorsque la distribution de notre variable est non normale… paramétrique ou non paramétrique?

A

non -paramétrique, Cela dit, on peut accorder du lousse à cette restriction.

26
Q

Une variable nominale ou ordinale est automatiquement… paramétrique ou non paramétrique?

A

non -paramétrique

27
Q

Quelles sont les quatre manières de distribution des résultats?

A

Fractile, distribution normale, kurtose, symétrie