Cours 2: Description des données Flashcards

1
Q

Quelles sont les 3 fonctions de la représentation graphique?

A
  1. Organisr les données selon un ordre logique
  2. Examiner la forme de la distribution
  3. Déterminer s’il existe des données extrêmes/aberrantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nomme les 4 types de représentationa graphiques utilisées en statistiques.

A
  1. Distribution de fréquences
  2. Histogramme
  3. Diagramme en tige-et-feuilles
  4. Diagramme et boîte-et-moustaches
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nomme les forces et faiblesses de la représentation graphique

Distribution des fréquences

A

Force: Permet de visualiser rapidement la distribution de l’ensembles des données
Faiblesse: Difficile à lire si grand nb de scores et variation des fréquences adjacentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nomme les forces et faiblesses de la représentation graphique

Histogramme

A

Force: Simplifie la figure tout en préservant les tendances importantes
Faiblesse: Ne permet pas de voir les données individuelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nomme les forces et faiblesses de la représentation graphique

Diagramme en Tige-et-feuilles

A

Force: Permet de visualiser à la fois la forme et les valeurs individuelles
Faiblesse: Aucune nommée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Nomme les forces et faiblesses de la représentation graphique

Diagramme en Boîte-et-moustaches

A

Force: Permet d’identifier la symétrie de la distribution et permet d’identifier les données extrêmes
Faiblesse: La forme n’est pas facilement visible et ne présente pas les valeurs individuelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

V/F Il est important d’utiliser plusieurs méthodes graphiques

A

Vrai, cela permet une meilleure représentation de la distribution de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les 2 cactéristiques qui différencient les distributions?

A
  1. Symétrie
  2. Voussure (concentration des scores)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les 4 degrés de symétrie?

A
  1. Normale (^)
  2. Bimodale (^^)
  3. Asymétrie NEG(-^)
  4. Asymétrie POS (^-)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les 3 degrés de voussure?

A
  1. Leptokutique (haut mince): peu de variabilité
  2. Mésokurtique (normale): scores centrés et quelques extrêmes
  3. Platikurtique (bas large): données étendues
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Notation

Que siginifie une lettre minuscule (Y) vs une lettre minuscule (y)?

A

Majuscule: Variable
Minuscule: Donnée de la variable

Ex: G=[5, 7, 8, 9]
g1= 5 et g3=8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Notation

V/F Lorsqu’il y a plus d’une variable, on précise la donnée avec plusieurs indices.

A

Vrai, ex: xij

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Notation

Que signifie Σ?

A

Sommation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment se lit:

9
ΣXi
i=3

A

La somme de tous les Xi pour les valeurs de i allant de 3 jusqu’à 9.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Propriété de la sommation?

(ΣX)^2=ΣX^2 ?

A

NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Propriété de la sommation

ΣXY = ΣX·ΣY ?

A

NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les 3 propriétés de la sommation?

A
  1. Σc=nC (la sommation de constante = n fois la constante)
  2. ΣcX=cΣX (la sommation d’une constante multipliée par une variable = constante multipliée par la sommation de la variable)
  3. Σ(x+y)=Σx + Σy (la sommation d’une somme de plusieurs quantités = la somme des sommations)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Tendance centrale

Définit ce qu’est une mesure de tendance centrale

A

Mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quels sont les 3 types de mesure de tendance centrale

A

Mode, médianne et moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Définit le mode

A

Résultat le plus fréquent

C’est LA réponse la plus populaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Comment nomme-t-on une ditribution à un mode? À deux modes?

A

Unimodale et bimodale

22
Q

V/F Lorsque deux modes sont adjacents, la distribution est bimodale.

A

FAUX, la ditribution est unimodale

Il faudra alors faire la moyenne des 2 valeurs

23
Q

Définit la médianne

A

Le point sur l’échelle des données ordonnées numériquement au-dessous duquel se situent 50% des cas

50e percentil d’une distribution

24
Q

Quels sont les calculs de la médianne?

A
  1. Localiser la POSITION de la valeur: (n+1)/2
  2. Noter la valeur (attention, si n est pair, la médianne est ;a moyenne des 2 données centrales)
25
Q

Quelles sont les 2 propriétés de la médianne?

A
  1. Elle n’est PAS affecté par les données extrêmes
  2. La somme des distances en valeur absoule entre chaque score et la médianne est toujours plus petite ou égale à la somme des distances en valeur absolue entre chaque score et tout autre score (EXCLUANT la médiane)
26
Q

Définit la moyenne

A

La somme des données d’une distribution pondérée par le nb de données

27
Q

Quelles sont les 5 propriétés de la moyenne?

A
  1. La somme de toutes les données est égale au nb de données multiplié par la moyenne
  2. La somme des distances entre chaque score et la moyenne est égale à 0.
  3. Addition/soustraction d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante
  4. Multiplication/division d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante
  5. Moyenne est affectée par les données extrêmes, contrairement à médiane ou mode.
28
Q

Nomme avantages du mode

A
  1. S’applique à des données nominales
  2. Représente le plus grand nb de données
  3. Non influencé par données extrêmes
29
Q

Nomme avantages de la médiane

A
  1. Non influencée par données extrêmes
30
Q

Nomme avantages de la moyenne

A
  1. Manipulations algébriques possibles
  2. Estimateur plus stable de la tendance centrale lorsqu’on prélève plusieurs échantillons dans une population
31
Q

Nomme désavantages du mode

A
  • Souvent peu représentatif de la distribution
  • Se prête difficilement aux manipulations algébriques
32
Q

Nomme désavantages médiane

A

Se prête difficilement aux manipulations algébriques

33
Q

Nomme désavantages de la moyenne

A

Biaisée par les scores extrêmes

34
Q

Quelles sont les 3 indices de dispersions?

A
  1. Étendue
  2. Variance
  3. Écart-type
35
Q

Définit ce qu’est un indice de dispersion

A

Degré de déviation des données individulles par rapport à la tendance centrale

36
Q

Définit l’étendu et nomme sa formule

A

Distance entre donnée plus élevée et donnée la moins élevée d’une distribution

Étendue= Xmax-Xmin

37
Q

Quelles sont les propriétés de l’étendue?

A
  1. Ignore presque toute la distribution
  2. Calculée à partir des données extrêmes (peut déformer)
  3. Utilise avec une distribution naturellemnt bornée, comme l’âge
38
Q

Qu’est-ce que l’écart-moyen?

A

Moyenne des écarts à la moyenne

Inutile CAR TJRS ÉGAL À 0

39
Q

Quelle est le défaut de l’écart-moyen? Quelle est la solution pour y remédier?

A

Est inutile car est tjrs égal à 0. SOlution: Écart-moyen ABSOLU

40
Q

Qu’est-ce que l’écart-moyen absolu? Quel est son défaut?

A

Moyenne des écarts en valeur absolue entre chaque donnée et la moyenne.
Difficilement manipulable algébriquement.

41
Q

Qu’est-ce que la variance?

A

Moyenne des carrés des écarts à la moyenne

42
Q

Quelle est la différence entre la formule de la variance d’une population et d’un échantillon?

A

Population: divisé par N
Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)

43
Q

Qu’est-ce qu’est l’écart-type?

A

Racine carrée de la variance

44
Q

Quelle est la différence entre la formule de l’écart-type d’une population et d’un échantillon?

A

Population: divisé par N
Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)

45
Q

Complète l’affrimation

Lorsqu’une distribution est normale et symétrique, ____________ des données se situent à +/- un écart-type de la moyenne et ____________ des données se situent à +/- 2 écart-type de la moyenne.

A
  1. 1/3
  2. 95%
46
Q

Quelles sont les 3 propriétés de la variance et écart-type?

A
  1. Très affectés par données extrêmes
  2. Addition d’une constante à chaque donnée de la distribution NE modifie PAS la variance/écart-type.
  3. La multiplication d’une constante à chaque donnée de la distribution produit une nouvelle variance égale à la variance originale multipliée par cette constante au carré et** un nouvel écart-type égal à l’écart-type original multiplié par cette constante.**
47
Q

Qu’est-ce que le coefficient de variation?

A

Indice de dispesion qui permet de comparer écarts-types qui proviennent d’échantillons dont les moyennes ou les échalles de mesure diffèrent.

48
Q

V/F La variance de la population et de l’échantillon sont tjrs égales.

A

Faux, à cause du N et n-1

49
Q

VRAI OU FAUX ? Un diagramme en tige-et-feuilles permet de visualiser les données individuelles d’une distribution, mais il ne permet pas de visualiser la forme de la distribution

A

Faux, permet de visualiser la forme.

50
Q

Le/la/l’ ________________ permet de visualiser rapidement toutes les données d’un ensemble à l’aide de barres verticales, tandis que le/la/l’ ____________________ permet de simplifier la représentation des données en les regroupant en intervalles.

A
  1. Distribution de fréquence
  2. Histogramme
51
Q

Quels indices de tendance centrale sont égaux lorsque la distribution est symétrique ?

A

Médiane et moyenne

PAS mode, car distribution peut être symétrique et bimodale