Statistiques descriptives et inférentielles Flashcards
Le but de toutes les statistiques descriptives est de
décrire, de façon condensée (parfois un seul nombre), un ensemble de données
… la valeur des scores individuels d’un échantillon
on veut rarement savoir
les stats descriptives impliquent l’idée de
communication : On s’intéresse à des moyens standardisés de transmettre l’information
Rôle du tableau
condense l’info en colonnes et rangées
Première rangée identifie
le contenu des colonnes
première colonne identifie
le contenu des rangées (optionnel)
Important pour les tableaux (5)
Numéros séquentiels (Tableau 1, 2, 3…)
Titre bref et clair
Numéro et titre au dessus, centré, lignes séparées
Seulement trois lignes horizontales(*)
Aucune ligne verticale
tableau de distribution d’effectifs simple est idéal pour
variables nominales
ordre des rangées dans un tableau de distribution d’effectifs simple
choix perso
consignes distribution d’effectifs regroupés
- chaque score est associé à
- le nombre d’intervalles doit
- à utiliser avec des variables ___ ou ___
- intervalles de taille ______
- intervalles __________ aux ________ si besoin
- un (et un seul) intervalle de classe
- condenser l’info sans masquer des détails importants (tension économie-détail)
- intervallerapports
- constante
- ouverts aux extrémités si besoin
distribution cumulative d’effectifs regroupés
La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)
distribution relative d’effectifs regroupés
La fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais relative (i.e., la proportion de scores dans la classe rapportée)
Maximum et minimum dans une proportion
1 et 0
une proportion est
un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)
Vous décidez comment organiser vos données
Mais toujours avec le but de
résumer / simplifier l’information
données qualitatives : Puisque les scores se distinguent en fonction de leur essence, ils ne peuvent pas (2)
Ils ne peuvent se toucher lorsque représentés le long d’une dimension Ne peuvent pas être liés par des lignes ou autres connecteurs
données qualitatives : les scores se distinguent en fonction de leur …
essence
vrai ou faux
il y a une manière logique d’ordonner des variables quantitatives sur un continuum
faux
vrai ou faux
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum
vrai
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum (tel l’abscisse d’une figure)
On les met,
au choix, en ordre alphabétique, en ordre d’effectifs, en ordre selon les choix de réponse…
À noter sur le graphique à bâtons : (3)
*Pas de cadre autour du graphique (les seules lignes sont celles identifiant les axes)
*Pas de contact entre les bâtons
*Légende à texte aligné à gauche sous le graphique, débutant par Figure #. où # est séquentiel
Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques
à bâtons ou secteurs, à moins de transformer les scores en mesures nominales ou ordinales
Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques à bâtons ou secteurs, mais plutôt
des polygones de fréquences ou des histogrammes
Caractéristiques des polygones de fréquences
Il y a un point dans l’espace 2D pour chaque intervalle de classe
- Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse : Les étiquettes doivent référer à cette valeur centrale
- La fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée - Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)
Des lignes joignent les points voisins