Chapitre 3 : distribution de fréquences et la représentation graphique des données Flashcards
À quoi sert la mise en tableau des données?
Pour quelle type de variable cela s’avère utile particulièrement.
Les données ne peuvent être interprétées rapidement et précisément si elles ne sont pas organisées de façon à en faire un sommaire. Plus simple de faire un tableau des fréquences pour voir la distribution des données.
Variables catégorielles : utile
Vrai ou faux, avec un grand nombre d’observations, la forme de la distribution devient plus évidente si les données sont organisées en fréquences regroupées en classes homogènes.
Vrai.
Vrai ou faux, avec un petit nombre d’observations, une mise en rang peut suffire pour donner une idée de la forme de la distribution.
Vrai.
Quels sont les 2 types de distribution de fréquences?
Définissez les 2 classes.
Donnez des exemples.
- Non regroupées :
Fréquences avec les valeurs brutes
Exemple : score de 50 = 2 personnes, score de 30 = 6 personnes, …
- Regroupées :
Fréquence avec les valeurs regroupées en classes homogènes (intervalles sont égaux entre les classes). Regroupe des intervalles de scores. Mieux d’avoir 10-20 catégories.
Exemple : score 0-9 = 4 personnes. Score 10-19 = 10 personnes, …
Quelles sont les 5 étapes pour construire une distribution de fréquences regroupées ?
Quel est le nombre de classes à ne pas dépasser?
Qu’est-ce qui arrive si on a trop de classes?
- Calculer l’étendue
-Étendue = Xmax – Xmin, donc le (score max – score min).
- Déterminer le nombre de regroupements (classes)
-Décision arbitraire
-Généralement, 10 participants pour 1 classe (10 : 1)
-Le nombre d’observations devrait être au moins 10 fois plus grand que le nombre de classe.
-Ne pas dépasser 30 classes
-Trop de classes donnent une apparence erratique à la distribution
- Définir les limites des classes
A. Choisir la longueur de la classe (Lc)
Lc = étendue / nombre de classes
B. limite des classes : chaque classe commence par un multiple de la Lc, 1ère classe induit le score minimal
- Regrouper les observations à l’intérieur des classes (combien de participants dans chacune des classes)
Méthodes informatiques : SPSS
- Compter la fréquence des observations à l’intérieur de chacune des classes (utile pour l’histogramme)
Calcul du nombre d’observations dans chacune des classes
Méthodes informatiques : SPSS
Quels sont les 5 types de diagrammes que l’on retrouve?
- Histogrammes
- Polygone de fréquences
- Ogive de fréquences cumulées
- Diagrammes à moustaches
- Diagrammes en feuilles
Quels sont les caractéristiques de l’histogramme?
Vrai ou faux, l’histogramme de fréquence en % sont plus simples à interpréter que celui de fréquences brutes.
Représenté par des bâtonnets
Longueur du bâtonnet représente la fréquence de la classe (brute ou en pourcentage)
L’abscisse est le point milieu de la classe (si 40-50, le point milieu est 45 sur l’axe des X) *
Vrai, l’histogramme de fréquence en % sont plus simples à interpréter que celui de fréquences brutes.
Quels sont les caractéristiques du polygone de fréquences?
Il est non approprié pour quelles types de variables?
Le polygone de fréquence en % sont plus simples à interpréter que celui de fréquences brutes.
Représente les fréquences de chacune des classes (brutes ou en %)
L’abscisse est le point milieu de la classe.
Le polygone de fréquences est fermé par l’ajout d’un vide au-dessous et au-dessus de la distribution.
Non approprié : échelle nominale (à cause de la continuité suggérée par la ligne brisée)
Plus efficace que l’histogramme pour la comparaison de 2 groupes d’observations ou plus
Vrai, le polygone de fréquence en % sont plus simples à interpréter que celui de fréquences brutes.
Quels sont les caractéristiques de l’ogive de fréquences cumulées?
Quel est l’utilité d’utiliser ce type de diagramme?
Quel est le principal inconvénient de ce type de diagramme?
Ogive dont les points (reliés), représentent la fréquence cumulée à la classe identifiée à l’abscisse
L’abscisse est la limite supérieure exclue (arrondie) de la classe
Exemple : dernier score = 22.4, arrondie à 23
But
-Estimer visuellement les rangs centiles et les centiles d’une distribution
Moins utile pour représenter la forme de la distribution
Quels sont les types de distribution ?
- Normale
o Symétrique en forme de cloche
o Distribution très répandue
o Importante en statistique - Bimodale
o Comporte 2 modes (majeur et mineur)
o Souvent l’indication de la présence de deux sous-groupes distincts - Rectangulaire
o Fréquences égales pour toutes les valeurs de l’abscisse - Dissymétrique
2 formes
-Positivement
* Étiré vers la droite (étirement vers le pôle positif)
-Négativement
* Étiré vers la gauche (étirement vers le pôle négatif)
Qu’est-ce que les quartiles?
Ils sont symbolisés comment ?
La médiane correspond à quel quartile?
Ils sont des scores bruts qui partagent une distribution en quatre parties égales
Symbolisé par : Q1, Q2, Q3
Correspondent aux centiles suivants
o Q1 = C25
o Q2 = C50 médiane (Md)
o Q3 = C75
Qu’est-ce que les rangs centiles?
Il varie comment ?
Le rang centile d’un score brut donné est le pourcentage des scores dans la distribution qui se situent en-dessous de ce score.
Varie entre 0 < RC < 100
o 0 et 100 ne sont jamais utilisés
o Toujours exprimé en entier
o C’est un pourcentage qui varie entre 1 à 99
o Plus la valeur du rang centile est élevée, meilleure est sa situation (ex. score pour la force de préhension).
o Pour les rangs ordinaires (1, 2, 3, …), c’est l’inverse.
Qu’est-ce que les centiles?
Ils sont symbolisés comment ?
Les centiles sont des points sur l’échelle des scores bruts qui divisent le nombre de scores en cent parties égales (chaque partie contient 1% des sujets)
Symbolisé par la lettre C accompagnée d’un indice approprié
Exemple : C35
Le centile est le score brut qui correspond à un rang centile déterminé
Comme le centile est un score brut, il peut prendre toutes les valeurs (-∞ à +∞)