Cours 2 Flashcards
Quelles sont les trois techniques d’organisation et de synthétisation des données ?
Tableaux (de fréquence)
Représentations graphiques
Numériques
Pourquoi travaille-t-on le plus souvent avec des statistiques descriptives et non des paramètres ?
Car on travaille le plus souvent avec des échantillons
Qu’est-ce qu’une série statistique ?
Liste des valeurs observées d’un caractère (d’une variable) dans un échantillon
Nb d’observations (de données ) = taille de la série
Par conviention, la variable est représentée par _________ et une observation spécifique par _______
une lettre majuscule
chiffre en indice
Comment procède-t-on à un dépouillement ?
Placer les valeurs en ordre croissant
Utiliser une méthode en bâtons (barrer après 4)
Qu’est-ce qu’une distribution de fréquences ? Quels en sont les avantages (3) ?
Tbleau où chaque valeur possible est représentée accompagnée de sa fréquence (ou effectif)
- synthétiser une masse de données
- identifier la fréquence de chaque valeur très rapidement
- possible à la fois pour les variables nominales (particulièrement pertinent), ordinales et intervalles (nb d’enfants)
Quand est-ce que la distribution de fréquences devient moins pertinente ?
Lorsque la variable continue possède beaucoup de valeurs possibles
Dinstinguez fréquence absolue (ou effectif) et relative
absolue : nb de fois qu’une valeur apparaît dans série (n =23)
relative : % de données prenant la valeur; on doit présenter toutes les catégories, niveaux (ex. 52,3% de femmes et 47,7% d’hommes)
Qu’est-ce que la fréquence cumullée ?
fc ou fc % : nb de données qui prennent une valeur inférieure ou égale
Quand on a une distribution de fréquences, qu’est-il important de rapporter (2)?
Le pourcentage valide (recaculé) et le nombre de valeurs manquantes
Ex. parmi ceux qui ont répondu, voici… mais X valeurs manquantes
Qu’est-ce qu’un groupement des valeurs en classes ? Quand est-ce surtout utile ?
Intervalles de nombres consécutifs, délimitées arbitrairement par des valeurs minimales et maximales
Pour variables quantitatives qui prennent un grand nombre de valeurs
Quelle mise en garde faites-vous par rapport au groupement en classes ?
Perte de précision de la variable continue: le faire seulement si demandé par un chercheur, un employeur ou un éditeur
Qu’est-ce que l’amplitude, les frontières et le centre (point milieu) d’une classe ?
Amplitude : différence entre frontières (min et max); doit tjrs être la même
Frontières: 2 nb entre lesquels sont comprises les valeurs rangées dans la classe
Centre : moyenne des limites inférieures et supérieures
Considère-t-on une variable groupée en classes comme étant continue ?
Si toutes les classes sont égales : variable continue
Dès qu’au moins une classe est ouverte ou d’amplitude inégale (valeurs aberrantes, ex une seule personne fait plus de 100 000$) : variable ordinale
Sur quoi repose le choix du type de graphique ?
Sur l’échelle de mesure de la variable