Cours 2 Flashcards

1
Q

Quelles sont les trois techniques d’organisation et de synthétisation des données ?

A

Tableaux (de fréquence)
Représentations graphiques
Numériques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi travaille-t-on le plus souvent avec des statistiques descriptives et non des paramètres ?

A

Car on travaille le plus souvent avec des échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une série statistique ?

A

Liste des valeurs observées d’un caractère (d’une variable) dans un échantillon
Nb d’observations (de données ) = taille de la série

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Par conviention, la variable est représentée par _________ et une observation spécifique par _______

A

une lettre majuscule

chiffre en indice

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment procède-t-on à un dépouillement ?

A

Placer les valeurs en ordre croissant

Utiliser une méthode en bâtons (barrer après 4)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une distribution de fréquences ? Quels en sont les avantages (3) ?

A

Tbleau où chaque valeur possible est représentée accompagnée de sa fréquence (ou effectif)

  1. synthétiser une masse de données
  2. identifier la fréquence de chaque valeur très rapidement
  3. possible à la fois pour les variables nominales (particulièrement pertinent), ordinales et intervalles (nb d’enfants)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quand est-ce que la distribution de fréquences devient moins pertinente ?

A

Lorsque la variable continue possède beaucoup de valeurs possibles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dinstinguez fréquence absolue (ou effectif) et relative

A

absolue : nb de fois qu’une valeur apparaît dans série (n =23)
relative : % de données prenant la valeur; on doit présenter toutes les catégories, niveaux (ex. 52,3% de femmes et 47,7% d’hommes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que la fréquence cumullée ?

A

fc ou fc % : nb de données qui prennent une valeur inférieure ou égale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quand on a une distribution de fréquences, qu’est-il important de rapporter (2)?

A

Le pourcentage valide (recaculé) et le nombre de valeurs manquantes
Ex. parmi ceux qui ont répondu, voici… mais X valeurs manquantes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’un groupement des valeurs en classes ? Quand est-ce surtout utile ?

A

Intervalles de nombres consécutifs, délimitées arbitrairement par des valeurs minimales et maximales
Pour variables quantitatives qui prennent un grand nombre de valeurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle mise en garde faites-vous par rapport au groupement en classes ?

A

Perte de précision de la variable continue: le faire seulement si demandé par un chercheur, un employeur ou un éditeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que l’amplitude, les frontières et le centre (point milieu) d’une classe ?

A

Amplitude : différence entre frontières (min et max); doit tjrs être la même
Frontières: 2 nb entre lesquels sont comprises les valeurs rangées dans la classe
Centre : moyenne des limites inférieures et supérieures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Considère-t-on une variable groupée en classes comme étant continue ?

A

Si toutes les classes sont égales : variable continue
Dès qu’au moins une classe est ouverte ou d’amplitude inégale (valeurs aberrantes, ex une seule personne fait plus de 100 000$) : variable ordinale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Sur quoi repose le choix du type de graphique ?

A

Sur l’échelle de mesure de la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels graphiques peut-on prendre lorsqu’on a une variable nominale ou ordinale ?

A

Diagramme en bâtons

Diagramme en secteurs

17
Q

Quels graphiques peut-on prendre lorsqu’on a une variable intervalle / rapport ?

A

Histogramme
Diagramme en tiges et feuilles
Boîtes et moustaches

18
Q

Le diagramme en bâtons est la représentation graphique de…

A

la distribution de fréquences

19
Q

Qu’est-ce qui se trouve sur l’axe de abscisses et des ordonnées pour un diagramme en bâtons ?

A

Abscisses: valeurs possibles de la série (niveaux / modalités pour variable nominale) qui peuvent être présentées en ordre ascendant (classes ou rangs d’une variable ordinale)
Ordonnées: la hauteur du bâton correspond à la fréquence absolue (n) ou relative (%) de la valeur
* Indiquer la fréquence associée à chaque bâton

20
Q

Quel est l’avantage du diagramme en secteurs ? Quand devrait-on se garder de l’utiliser ?

A

Présente un portrait rapide des fréquences (relatives ou absolues) d’une variable nominale ou ordinale
Affiches / Posters
Ne pas l’utiliser si moins de 3 valeurs ou plus de 8-10

21
Q

Qu’est-ce qu’un histogramme ?

A

Visualisation d’une série de valeurs groupées en classes (1er choix pour une variable continue)

22
Q

Qu’est-ce qui se trouve sur l’axe des abscisses et des ordonnées sur un histogramme ?

A

Abscisse: frontières des classes ; inscrire les frontières ou les centres
Ordonnées : rectangle dont la hauteur représente la fréquence (absolue ou relative) de chaque classe (PAS d’espace entre les rectangles)
* Indiquer la fréquence sur les rectangles

23
Q

Le diagramme en tiges et feuilles permet de pallier aux limites de ___________ et de ______________
Expliquez

A

l’histogramme
la distribution de fréquences
- Histogramme masque différences à l’intérieur des classes (pas assez de détails)
- Distribution de fréquence ne résume pas assez l’info ( trop de détails)
DONC réorganise les données brutes

24
Q

Qu’est-ce qui se trouve sur l’axe vertical et horizontal du diagramme en tiges et feuilles ?

A

Vertical (tige): chiffres principaux (unités); doivent avoir la même largeur
Horizontal (feuilles): chiffres secondaires (décimales)

25
Q

Chaque feuilles est un chiffre qui représente ________
Les ___________ sont indiquées pour chaque tige
Permet d’avoir une idée rapide de la __________________ si on regarde sur le côté

A

une seule observation
fréquences
distribution

26
Q

Vrai ou faux ? On ne fait jamais l’asymétrie et l’applatissement pour les variables nominales et continues

A

Faux : on ne fait jamais l’asymétrie et l’applatissement pour les variables nominales et ordinales (seulement pour les continues)

27
Q

Qui suis-je ?

L’histogramme s’étale vers la gauche (majorité des réponses à droite)

A

Asymétrie négative (valeur de l’indice est -)

28
Q

Qui suis-je ?

L’histogramme s’étale vers la droite (majorité des réponses à gauche)

A

Asymétrie positive (valeur de l’indice est +)

29
Q

Qu’est-ce que l’applatissement ?

A

Concentration relative des scores au centre de la distribution, dans les extrémités et aux épaules (entre le centre et les extrémités)

30
Q

Quel est l’applatissement désiré ?

A

Mésocurtique (indice = 0)

31
Q

Qui suis-je ?

Distribution plus large et aplatie (épaules larges)

A

Platycurtique (valeur de l’indice -)

32
Q

Qui suis-je ?

Distribution plus pointue (pas d’épaules)

A

Leptocurtique (valeur de l’indice +)

33
Q

Quelles sont les différentes mesures de tendance centrale ?

A

moyenne, médiane, mode

34
Q

Sur quels types de variables ne devrait-on jamais calculer la moyenne ?

A

ordinale + nominale

35
Q

Quelle est la limite de la moyenne ?

Il est important d’interpréter la moyenne en fonction de _______

A

sensible aux valeurs extrêmes

l’échelle de mesure

36
Q

Qu’est-ce qu’une médiane et sur quels types de variables se calcule-t-elle ?

A

Nombre qui partage la série en deux parties contenant chacune 50% des observations
Ordinales + continues

37
Q

Quelles sont les étapes pour calculer la médiane ?

A
  1. Placer en ordre croissant
  2. Vérifier si pair / impair
  3. Trouver médiane: position = (N + 1) / 2
    * si nombre impair: médiane = valeur centrale
    * si nombre pair : médiane == moyenne des deux valeurs centrales
38
Q

Quand le mode est-il surtout pertinent ?

A

Pour les variables nominales et ordinales

39
Q

Comment appelle-t-on une distribution avec
un mode
2 modes
plus de 2 modes

A

unimodale
bimodale
plurimodale