Cours 11 Flashcards
Quel est le but d’une statistique descriptive?
Le but de toutes les statistiques descriptives est de décrire, de façon condensée (parfois un seul nombre), un ensemble de données
- On veut rarement savoir la valeur des scores individuels d’un échantillon
- Implique l’idée de communication : On s’intéresse à des moyens standardisés de transmettre l’information
À quoi servent les tableaux?
Condensent l’information en colonnes et rangées
1- La première rangée identifie le contenu des colonnes
2 - La première colonne identifie le contenu des rangées (optionnel)
Le tableau est très flexible
Vous pouvez combiner fréquences absolues ou relatives dans un schème cumulatif ou non…
Vous décidez comment organiser vos données Mais toujours avec le but de résumer / simplifier l’information
Nommer 5 éléments important à noter pour les tableaux?
1 - Numéros séquentiels (Tableau 1, 2, 3…)
2 - Titre bref et clair
3 - Numéro et titre au dessus, centré, lignes séparées
4 - Seulement trois lignes horizontales(*)
5 - Aucune ligne verticale
Moyenne de mots rapportés selon le sexe et le niveau d’anxiété
Combien de variables?
3: Sexe, anxiété, et mots rapportés
Donner 4 trucs importants dans le cadre de tableau de distribution d’effectifs simple?
*Chaque score avec sa fréquence d’effectifs
*Score sans effectif peut être omis
*Idéal pour variables nominales
*Ordre des rangées = choix personnel
Donner 5 trucs importants dans le cadre de tableau de distribution d’effectifs regroupés?
*Chaque score est associé à un (et un seul) intervalle de classe
*Le nombre d’intervalles doit condenser l’info sans masquer des détails importants (tension économie-détail)
*À utiliser avec variables intervallerapports
*Intervalles de taille constante
*Intervalles ouverts aux extrémités si besoin
Donner 1 trucs importants dans le cadre de tableau de distribution cumulative d’effectifs regroupés?
*La fréquence rapportée est celle de l’intervalle de classe courant PLUS celle(s) de l’(des) intervalle(s) précédent(s)
Vrai ou faux, La fréquence rapportée est absolue (i.e., le nombre de scores de la classe) mais elle n’est pas relative (i.e., la proportion de scores dans la classe rapportée) ?
Faux
La fréquence rapportée est non pas absolue (i.e., le nombre de scores de la classe) mais relative (i.e., la proportion de scores dans la classe rapportée)
Rappel: une proportion est un nombre de choses particulières divisé par le nombre total de choses incluant les choses particulières (e.g., nombre d’hommes divisé par nombre de personnes = proportion d’hommes)
Minimum: 0.0
Maximum: 1.0
Vrai ou faux, Le tableau est peu flexible
Vous ne pouvez combiner fréquences absolues ou relatives dans un schème cumulatif ou non…
Faux, Le tableau est très flexible
Vous pouvez combiner fréquences absolues ou relatives dans un schème cumulatif ou non…
QU’est ce que des variables embarqués
Anxiété (basse ou élevé) (gentil on méchant) selon le sexe (femme ou homme) et la grandeur (petit ou grand)
Comment est ce que l’on ordonne des données qualitatives?
Il n’y a pas de manière logique d’ordonner des variables qualitatives sur un continuum (tel l’abscisse d’une figure)
1 - On les met, au choix, en ordre alphabétique, en ordre d’effectifs, en ordre selon les choix de réponse…
2 - Puisque les scores se distinguent en fonction de leur essence
- Ils ne peuvent se toucher lorsque représentés le long d’une dimension
- Ne peuvent pas être liés par des lignes ou autres connecteurs
Quels sont les éléments à noter pour les graphiques à bâton?
*Pas de cadre autour du graphique (les seules lignes sont celles identifiant les axes)
*Pas de contact entre les bâtons
*Légende à texte aligné à gauche sous le graphique, débutant par
Vrai ou faux, le graphique à secteurs est populaire en psychologie
Faux, il est très rare
Est ce qu’on utilise des graphiques à bâtons ou secteurs avec des mesures à intervalles ou à rapport.
Avec des mesures à intervalles ou à rapports, on n’utilise pas les graphiques à bâtons ou secteurs
À moins de transformer les scores en mesures nominales or ordinales
E.g., taille en format “petit, moyen, et grand”
On utilise plutôt des polygones de fréquences ou des histogrammes
Qu’est ce qu’un polygones de fréquences?
1- Il y a un point dans l’espace 2D pour chaque intervalle de classe
A) Le point est positionné au dessus du centre de l’intervalle le long de l’abscisse
- Les étiquettes doivent référer à cette valeur centrale
B) La fréquence de l’intervalle de classe est représenté par la position du point selon l’ordonnée
C) Généralement un intervalle vide à chaque bout (pas d’intervalle ouvert)
2- Des lignes joignent les points voisins
Qu’est ce que l’histogramme?
1 - Très semblable aux polygones
a) Plutôt qu’un point, une barre horizontale est placée à la hauteur adéquate au-dessus de chaque intervalle de classe
- La largeur de la barre correspond à la largeur de l’intervalle
b) Des lignes verticales (une de chaque côté) joignent la barre à l’abscisse
En quoi un graphiques à bâtons pour groupe est utile?
Utiles pour illustrer la relation entre variables indépendantes et dépendantes
E.g., score d’anxiété moyen (VD) par sexe et technique de relaxation (VIs)
Par convention, VDs représentées par axe y, VIs le long de l’axe des x
Vrai ou faux, par convention, VDs représentées par axe x, VIs le long de l’axe des y
Faux, Par convention, VDs représentées par axe y, VIs le long de l’axe des x
Que représente un graphique à dispersion?
Représentent le score sur deux variables pour chaque membre de l’échantillon
- Une variable est assignée à x, l’autre à y
- Pour chaque participant, un point représente son score sur les deux variables
A quoi est ce qu’il faut faire attention pour l’axe des x et y?
Il faut être explicites, faire attention aux écarts d’intervalle que l’on présente, pour pas qu’elles disent trop de chose seulement parce que les écarts sont trop grands ou trop petits
Qu’est-ce qu’une mesure de tendance centrale?
Par mesure ou tendance centrale, on réfère à un nombre qu’on prétend typique ou représentatif d’un ensemble de scores
Quelles sont les 3 mesures les plus communes en psychologie?
Mode Médiane Moyenne
Qu’est-ce que le mode?
1 - Le mode est le score qu’on observe le plus souvent
E.g., 2 3 5 3 5 3 2 2 3 3 3 5 3 2
- Le chiffre le plus fréquent est 3, donc le mode est 3
- Et non 7, qui est la fréquence de 3 dans l’exemple
- Votre meilleure prédiction pour une personne inconnue si vous ne savez rien d’autre
2 - Une distribution peut avoir deux modes ou plus
- En quel cas, on dit qu’elle est bimodale ou multimodale, respectivement
3 - Pas approprié pour des intervalles de classe
- Le score modal n’est pas nécessairement dans l’intervalle modal
Vrai ou faux, Une distribution peut avoir deux modes ou plus
Vrai, en quel cas, on dit qu’elle est bimodale ou multimodale, respectivement
Qu’est ce que la médiane?
1 - La médiane est le score au milieu d’une distribution ordonnée
- Synonyme de 50e centile
- La moitié des scores en dessous, la moitié au dessus
- Quoiqu’une proportion de scores peuvent être égaux à la médiane
2 - Pour calculer: Mettre les scores en ordre de grandeur. Calculer (n + 1) / 2 Si le résultat est un nombre entier, il vous donne la position de la médiane. Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19e et 20e scores)
- Si ces deux scores diffèrent, on prend leur moyenne
3 - Pas approprié pour des intervalles de classe
- L’intervalle médian ne crée pas nécessairement deux moitiés égales
Vrai ou faux, l’intervalle médian crée nécessairement deux moitié égale?
Faux, L’intervalle médian ne crée pas nécessairement deux moitiés égales
Comment on calcul la médiane?
Mettre les scores en ordre de grandeur. Calculer (n + 1) / 2 Si le résultat est un nombre entier, il vous donne la position de la médiane. Si le résultat est une fraction (e.g., 19.5), il vous dit entre quels scores trouver la médiane (i.e., les 19e et 20e scores)
- Si ces deux scores diffèrent, on prend leur moyenne
Est ce que la médiane est approprié pour des intervalles de classe?
POurquoi?
Pas approprié pour des intervalles de classe L’intervalle médian ne crée pas nécessairement deux moitiés égales
Est ce que le mode est approprié pour des intervalles de classe?
POurquoi?
Pas approprié pour des intervalles de classe
Le score modal n’est pas nécessairement dans l’intervalle modal
Qu’est ce que la moyenne?
1 - La moyenne est la somme de tous les scores, divisée par le nombre de scores. Elle a des propriétés importantes
- La somme des déviations est égale à zéro
- Minimise les déviations carrées : Comparé aux autres mesures centrales
- Représente la quantité que tout le monde aurait si la caractéristique était distribuée équitablement
- Changer un score change la moyenne Le même changement pourrait laisser le mode et/ou la médiane inchangés
2 - Degrés de liberté illustrés
Dans une distribution normale quelle mesure de tendance centrale regarder?
Dans une distribution normale, la moyenne, la médiane et le mode sont identiques
Mais quelle choisir?
- Données nominales: mode (autres ne font pas de sens)
- Autre échelles: dépend!
Plus représentatif?
Mode
Milieu?
Médiane
Sensibilité à tous les scores?
Moyenne
Est ce que la moyenne et la médiane est utiles avec distribution bimodale ?
La moyenne et la médiane peu utiles avec distribution bimodale
Quel mesure de tendance centrales sont représentatives avec des données qui sont biaisées?
Mode et médiane plus représentatives avec données biaisées
Pour cinq nombres entiers, la moyenne est 4, le mode est 1, et la médiane est 5.
Quels sont les 5 nombres?
1, 1, 4, 6, 7
Pourquoi la dispersion?
Connaître l’étendue des données est un élément d’information important
La dispersion est une mesure de la variabilité entre les scores
Qu’est ce que l’Étendue?
L’étendue est la distance entre le score le plus élevé et le score le plus bas
- Étendue = maximum – minimum
Facile à calculer et comprendre
Exemple: Les QIs de l’échantillon vont de 103 à 138
L’étendue des QI est de 35 points
Nommer deux problèmes liés à l’Étendue?
1 - Basée sur seulement deux mesures
Et pas n’importe lesquelles: les plus extrêmes!
2 - Augmente avec la taille de l’échantillon
- De nouveaux scores ne feront jamais réduire l’étendue
- Par contre, un nouveau score qui change le minimum ou le maximum augmente l’étendue
Qu’est ce que l’étendue interquartile?
1 - Corrige certains problèmes de l’étendue
- Utilise les 25e et 75e centiles pour son calcul
- En d’autres mots, les 50% de scores du milieu servent à évaluer l’étendue interquartile
- Peu sensible aux scores extrêmes
- Plus stable en fonction de la taille de l’échantillon
- Devrait diminuer quand l’échantillon grossit si la variable a une distribution “normale” dans la population
2 - Rarement utilisée, sauf dans les graphiques boîte-et-moustaches
- Permettent d’identifier visuellement les valeurs aberrantes / extrêmes
Qu’est ce que l’Écart type?
L’écart-type ((rond à casquette) dans la population, s dans un échantillon) est la racine carrée de la déviation carrée moyenne
- Les formules diffèrent pour population et échantillon
Qu’est ce le calcul de la somme des carrée (SS)
VOIR NOTES
Qu’est ce que la variance?
Un indicateur de dispersion très commun, utilisé dans une variété de procédures (non la moindre: analyse de la variance)
Est le carré de l’écart-type
- Enlevez le symbole de racine carrée des formules précédentes et vous avez les formules de variance pour population et échantillons
- Les symboles pour population et échantillon sont s2 et s2, respectivement
Qu’est ce que les statistique inférentielles?
Méthodes qui vous permettent d’évaluer la probabilité que ce que vous observez dans votre échantillon est vrai dans la population
- Testent l’hypothèse nulle H0 et vous donnent la probabilité qu’elle soit vraie selon vos résultats
- Règle générale: on rejette H0 si sa probabilité est inférieure à 0.05 (soit 5% ou, comme les sondages aiment rapporter, 1 fois sur 20)
La question “mais quel test utiliser?” est toujours solutionnée par deux simple contraintes, lesquels?
1 - La nature des scores (nominal, ordinal…)
2 - Ce qu’on veut savoir des données (différence ou relation…) en lien avec le plan de recherche
L’étudiant-e en psychologie bien éduqué-e à qui on donne des mesures à rapports de groupes contrôle et expérimental va…
choisir le bon test t dans le menu SPSS
L’étudiant-e super bien éduqué-e va commencer par regarder la forme de la distribution pour s’assurer qu’un test non paramétrique n’est pas plus indiqué