Cours 11 : Statistiques descriptives Flashcards
Quel est le but des statistiques descriptives ?
But des statistiques descriptives = décrire un ensemble de données
- PAS savoir la valeur des scores individuels d’un échantillon
- Moyens standardisés de transmettre l’information
Quel est le but de tableaux ?
1ere rangée VS 1ere colonne ?
But : Condensent l’information en colonnes et rangées
- La première rangée identifie le contenu des colonnes
- La première colonne identifie le contenu des rangées
Quelles son les 4 caractéristiques du tableau de distribution d’effectifs simple ?
- Chaque score avec sa fréquence d’effectifs
- Score sans effectif peut être omis
- Idéal pour variables nominales
- Ordre des rangées = choix personnel
Quelles son les 5 caractéristiques du tableau de distribution d’effectifs regroupés ?
- Chaque score est associé à un intervalle de classe
- Le nombre d’intervalle doit condenser l’info sans masquer des détails importants
- À utiliser avec variables intervalle- rapports
- Intervalles de taille constante
- Intervalles ouverts aux extrémités si besoin
Qu’est qu’un tableau de distribution cumulative d’effectifs regroupés ?
La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)
Est-ce qu’il y a une manière d’ordonner des variables qualitatives ?
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum
Quels graphiques utilise-t-on avec des mesures intervalles ou rapports ?
polygones de fréquences ou des histogrammes
Quels graphiques illustrent la relation entre variables indépendantes et dépendantes ?
Graphiques à bâtons pour groupes
VD = axe y
VI = axe x
Quel graphique utilise-t-on pour représenter le score sur deux variables pour chaque membre de l’échantillon ?
Graphiques à dispersion
Qu’est-ce qu’une mesure ou tendance centrale ?
= Un nombre qu’on prétend typique ou représentatif d’un ensemble de scores
Quelles sont les 3 mesures plus communes en psychologie ?
Mode
Médiane
Moyenne
Qu’est-ce que le mode ?
= le score qu’on observe le plus souvent
- prédiction pour une personne inconnue
- 2 modes ou plus = bimodale/multimodales
- Pas pour intervalles de classe
Qu’est-ce que la médiane ?
= le score au milieu d’une distribution ordonnée
- 50e centile
- Si résultat entre 2 nombres = Faire moyenne des 2
- Pas pour intervalles de classe
Qu’est-ce que la moyenne ?
= la somme de tous les scores, divisée par le nombre de scores.
Dans une distribution normale comment sont la moyenne, la médiane et le mode ?
Identiques
Quelles mesures centrales choisir?
Données nominales : mode
Plus représentatif : Mode
Milieu : Médiane
Sensibilité à tous les scores : Moyenne
Qu’est-ce que la dispersion ?
= mesure de la variabilité entre les scores
Qu’est-ce que l’étendue ?
= la distance entre le score le plus élevé et le score le plus bas
- Étendue = maximum – minimum
Quels sont les 2 problèmes de l’étendue ?
- Basée sur deux mesures
- Augmente avec la taille de l’échantillon (nouveaux scores = jamais réduire l’étendue)
Qu’apporte l’étendue interquartile ? (3)
Dans quel contexte est-elle utilisée ?
Peu sensible aux scores extrêmes
Plus stable en fonction de la taille de l’échantillon
Devrait diminuer quand l’échantillon grossit
Graphiques boîte-et- moustaches :
- Permettent d’identifier les valeurs aberrantes
Qu’est-ce que l’écart-type ?
Quels sont les symboles de l’écart-type ?
= racine carrée de la déviation carrée moyenne
o = population
s = échantillon
qu’est-ce que la variance ?
= le carré de l’écart-type
- Indicateur de dispersion utilisé dans l’analyse de variance
o2 = population
s2 = échantillon
Pourquoi utilise-t-on la variance ?
Que doit-on tester ?
Pour évaluer la probabilité que ce que vous observez dans votre échantillon est vrai dans la population
Testent l’hypothèse nulle H0 et vous donnent la probabilité qu’elle soit vraie selon vos résultats
- Règle générale : on rejette H0 si sa probabilité est inférieure à 0.05 (5%)
À partir de quoi on détermine quel test utilisé ?
- La nature des scores (nominal, ordinal…)
- Ce qu’on veut savoir des données (différence ou relation)