Cours11_examen2 Flashcards
Le but de toutes les statistiques descriptives est de
écrire, de façon condensée (parfois un seul nombre), un ensemble de données
Stats descriptives : vrai ou faux : On veut rarement savoir la valeur des scores individuels d’un échantillon ?
vrai
Stats descriptives : Implique l’idée de …
On s’intéresse à des moyens … de transmettre l’information
communication
standardisés
Stats descriptives : but des tableaux
Condensent l’information en colonnes et rangées
Stats descriptives
Les tableaux
La première rangée identifie …
La première colonne identifie …
le contenu des colonnes
le contenu des rangées
Tableaux : aspects importants ? (4)
Numéros séquentiels (Tableau 1, 2, 3…)
Titre bref et clair
Numéro et titre au dessus, centré, lignes séparées Seulement trois lignes horizontales(*)
Aucune ligne verticale
Vrai ou faux : dans un même tableau, les différentes variables peuvent être mesurées sur différentes échelles ?
vrai
tableau de distribution d’effectifs simple : aspects importants ?
*Chaque score avec sa fréquence d’effectifs *Score sans effectif peut être omis
*Idéal pour variables nominales
*Ordre des rangées = choix personnel
tableau de distribution d’effectifs regroupés : aspects importants ?
*Chaque score est associé à un (et un seul) intervalle de classe
*Le nombre d’intervalle doit condenser l’info sans masquer des détails importants (tension économie-détail)
*À utiliser avec variables intervalle- rapports
*Intervalles de taille constante
*Intervalles ouverts aux extrémités si besoin
Comment faire le tableau de distribution cumulative d’effectifs regroupés ?
La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)
Tableau de distribution relative d’effectifs regroupés
La fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais relative (i.e., la proportion de scores dans la classe rapportée)
Qu’est-ce qu’une proportion ?
une proportion est un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)
Vrai ou faux : Le tableau est très flexible
VRAI
Vrai ou faux : Vous pouvez combiner fréquences absolues ou relatives dans un schème cumulatif
VRAI
Vrai ou faux : Vous décidez comment organiser vos données
VRAI
But tableaux ?
résumer / simplifier l’information
Figure de base ?
graphique x et y 2D
Figures : Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum
Figure données qualitatives : Puisque les scores se distinguent en fonction de leur essence … (2)
- Ils ne peuvent se toucher lorsque représentés le long d’une dimension
- Ne peuvent pas être liés par des lignes ou autres connecteurs
Figure données qualitatives : exemples ?
le graphique à bâtons
le graphique à secteurs (ou pointes de tarte)
Vrai ou faux : le graphique à secteurs (ou pointes de tarte) est fréquent en psychologie ?
FAUX
le graphique à bâtons : aspects importants (3) ?
*Pas de cadre autour du graphique (les seules lignes sont celles identifiant les axes)
*Pas de contact entre les bâtons
*Légende à texte aligné à gauche sous le graphique, débutant par Figure #. où # est séquentiel
Graphiques font partis des figures ou tableaux ?
figures
Vrai ou faux : on peut utiliser les graphiques à bâtons ou secteurs avec données quantitatives ? À moins de ?
faux,
à moins de transformer les scores en mesures nominales or ordinales
Données quantitatives : exemples de figures ?
Polygones de fréquences
Histogramme
Polygones de fréquences : 3 aspects importants ?
- Il y a un point dans l’espace 2D pour chaque intervalle de classe (ou rang)
- Des lignes joignent les points voisins
- Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)
Polygones de fréquences : La fréquence de l’intervalle de classe est représenté par… ?
la position du point selon l’ordonnée
Polygones de fréquences : Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse
Les étiquettes doivent référer à …?
cette valeur médiane
Histogramme : Très semblable aux … ?
polygones
Comment histogramme ? (2)
- une barre horizontale est placée à la hauteur adéquate au-dessus de chaque intervalle de classe
- Des lignes verticales (une de chaque côté) joignent la barre à l’abscisse
Histogramme : La largeur de la barre correspond à …?
la largeur de l’intervalle
Graphiques à bâtons pour groupes : utile pour … ?
illustrer la relation entre variables indépendantes et dépendantes
VDs représentées par axe …, VIs le long de l’axe des … ?
y = vd
x = vi
Graphiques à dispersion : Représentent le score sur … variables pour chaque membre de l’échantillon
deux
Graphiques à dispersion : 2 aspects importants ?
- Une variable est assignée à x, l’autre à y
- Pour chaque participant, un point représente son score sur les deux variables
Comment biaiser perception sur graphique (2)
- grandir l’échelle
- grossir le bonhomme largeur ET longueur (x2 est finalement x4)
Mesures centrales : c’est quoi?
Par mesure ou tendance centrale, on réfère à un nombre qu’on prétend typique ou représentatif d’un ensemble de scores
Mesures centrales : Les trois mesures plus communes en psychologie ?
Mode
Médiane
Moyenne
Mode ?
Le mode est le score qu’on observe le plus souvent
Le chiffre le plus fréquent est 3, donc le mode est ?
3
Une distribution peut avoir deux modes ou plus
En quel cas, on dit qu’elle est … ou …, respectivement
bimodale
multimodale
Mode : Pas approprié pour des intervalles de classe car ?
Le score modal n’est pas nécessairement dans l’intervalle modal
Médiane ?
La médiane est le score au milieu d’une distribution ordonnée
Synonyme de 50e centile ?
médiane
Médiane : Pour calculer ?
Mettre les scores en ordre de grandeur Calculer (n + 1) / 2
Si le résultat est un nombre entier, il vous donne la position de la médiane
Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19e et 20e scores)
Si ces deux scores diffèrent, on prend leur moyenne
Médiane : approprié pour des intervalles de classe ? pourquoi ?
non, L’intervalle médian ne crée pas nécessairement deux moitiés égales
Moyenne ?
La moyenne est la somme de tous les scores, divisée par le nombre de scores.
Moyenne : propriétés importantes ? (4)
La somme des déviations est égale à zéro
Minimise les déviations carrées (Comparé aux autres mesures centrales)
Représente la quantité que tout le monde aurait si la caractéristique était distribuée équitablement
Changer un seul score change la moyenne (Le même changement pourrait laisser le mode et/ou la médiane inchangés)
la moyenne, la médiane et le mode : lequel choisir avec données nominales ?
mode
la moyenne, la médiane et le mode : lequel choisir, Plus représentatif?
Mode
la moyenne, la médiane et le mode : lequel choisir, Milieu?
médiane
la moyenne, la médiane et le mode : Sensibilité à tous les scores?
moyenne
… peu utiles avec distribution bimodale
La moyenne et la médiane
Mode et médiane plus représentatives avec données …
biaisées
Pourquoi la dispersion?
Puisque les scores varient
C’est quoi dispersion ?
La dispersion est une mesure de la variabilité entre les scores
L’étendue ?
L’étendue est la distance entre le score le plus élevé et le score le plus bas
calcul étendue
Étendue = maximum – minimum
Problèmes avec l’étendue (2)
Basée sur les 2 mesures extrêmes
Augmente avec la taille de l’échantillon
Vrai ou faux : De nouveaux scores ne feront jamais réduire l’étendue
vrai
Étendue interquartile : Utilise les ..e et ..e centiles pour son calcul
25 et 75
les … de scores du milieu servent à évaluer l’étendue interquartile
50%
Étendue interquartile : sensible aux scores extrêmes ?
peu
Étendue interquartile :
stable en fonction de la taille de l’échantillon ?
oui
Étendue interquartile :
Devrait … quand l’échantillon grossit si la variable à une distribution … dans la population
diminuer
“normale”
Étendue interquartile : Rarement utilisée, sauf dans les graphiques …
boîte-et-moustaches
graphiques boîte-et- moustaches
Permettent d’identifier visuellement les : ?
valeurs aberrantes et extrêmes
L’écart-type ?
est la racine carrée de la déviation carrée moyenne
Vrai ou faux : Les formules d’écart-type diffèrent pour population et échantillon ?
vrai
Variance ?
Un indicateur de dispersion très commun, utilisé dans une variété de procédures (analyse de variance)
Variance formule ?
Est le carré de l’écart-type
Degrés de liberté ?
??? n-2 ?
Statistiques inférentielles ?
Méthodes qui vous permettent d’évaluer la probabilité que ce que vous observez dans votre échantillon est vrai dans la population
Testent l’hypothèse nulle H0 et vous donnent la probabilité qu’elle soit vraie selon vos résultats, quelle stats ?
inférentielles
Stats = ?
outils
La question “mais quel test utiliser?” est tjrs solutionnée par deux simple contraintes ? (2)
- La nature des scores (nominal, ordinal…)
- Ce qu’on veut savoir des données (différence ou relation…) en lien avec le plan de recherche
3.*forme de la distribution pour s’assurer qu’un test non paramétrique n’est pas plus indiqué