Séance 10: distribution des données, tableaux croisés et représentations graphiques Flashcards
Pourquoi la distribution de données constitue une façon simple de résumer les données en analyse univariée?
- D’un nombre important à un nombre réduit de données
- De l’énumération de l’ensemble de données aux catégories qui les réunissent à la distribution de valeurs
- La distribution offre des résultats plus «parlants» que les fréquences
Qu’est-ce qu’une distribution cumulative?
Somme ou % de tous les scores inférieurs ou égaux à une valeur donnée
V/F? Une distribution cumulative n’est que pertinente que lorsque les valeurs de la variable peuvent être ordonnée.
Vrai
Est-il pertinent de mesurer que le % cumulatif pour une variable d’intervalles?
Oui, car le % cumulatif n’est que pertinent que lorsque les valeurs de la variables peuvent être ordonnées.
En quoi consiste le regroupement catégoriel?
À réduire à quelques caractéristiques simples, voire réduire le nombre de catégories déjà existantes.
En analyse bivariée ou multivariée, le regroupement catégoriel permet de …
- Obtenir un nombre de catégories qui se prête mieux à l’analyse
- Éviter de se retrouver avec des catégories comptant peu de cas, qui ferait en sorte que nous pourrions pas aller plus loin dans notre analyse.
Qu’est ce que ça veut dire «mutuellement exclusives» et «collectivement exhaustives»?
Mutuellement exclusive: les valeurs ne se chevauchent pas
Collectivement exhausitves: groupement de l’ensemble des données
À quoi sert la présentation visuelle d’une analyse univariée?
À faire saisir plus rapidement l’information, lui donner plus de sens au premier coup d’oeil, favorise la rétention de l’information.
Qu’est-ce qu’un tableau de contingence (tableau croisé)?
C’est une distribution de fréquences et de % à deux dimensions dans lesquelles les fréquences de deux variables sont croisées.
Qu’est-ce qu’une analyse bivariée?
Elle examine l’association entre deux variables en comparant des distributions de %.
Que permet le tableau croisé?
Il permet d’observer s’il y a relation entre les deux variables et d’avoir un aperçu de l’intensité de celles-ci (faible, modérée, forte).
Aussi, la présentation de ces données en % offre une meilleure base comparative pour comparer entre elles les catégories de la variable.
V/F? La direction d’une variable ne concerne que les variables ordonnées.
Vrai
Histogramme est pertinent pour les variables nominales.
Vrai
Un salaire passe de 20 000$ à 25 000$. Quelle est l’augmentation en %?
(25 000- 20 000)/ 20 000 x 100 = 25%