COURS 10 Flashcards
Qu’est-ce qu’une mesure à items multiples? (échelles dans des questionnaires)
Plusieurs items (généralement de type Likert) mesurent le même construit et un score global est calculé à partir de ces items
quelles sont les quatre qualités d’une bonne mesure?
Exclusivité: Mesure-t-elle juste ce que je veux mesurer/seulement mon construit?
Exhaustivité (sensibilité): Mesure-t-elle la totalité du construit?
Validité: Mesure-t-elle ce qu’elle doit mesurer? (le construit comme tel, est-ce qu’on mesure ce qu’on veut mesurer)
Fidélité: Est-elle est précise et stable? (α) (comment l’échelle est-elle répondue? au niveau statistique, comment notre mesure performe?)
Que peut-on tester pour vérifier la fidélité?
- stabilité temporelle
- équivalence (formes parallèles, inter-observateur)
- cohérence interne
quelles questions peut-on se poser par rapport à la stabilité temporelle (test-retest?)
Est-ce que cette mesure est stable? Est-ce que les résultats obtenus avec cette mesure sont reproductibles?
voir si la mesure est stable dans le temps
quelles questions peut-on se poser par rapport à l’équivalence?
est-ce que les estimations issues de plusieurs observateurs indépendants ou de versions parallèles de la mesure sont constantes?
pour voir si la grille fonctionne, on fait remplir deux personnes en même temps et on arrivera au même résultat
quelles questions peut-on se poser par rapport à la cohérence interne?
Est-ce que le alpha de Cronbach (α) témoigne d’une bonne cohérence interne, stable d’un échantillon à un autre présentant des caractéristiques similaires? (indice variant entre 0 = aucune cohérence et 1 = cohérence maximale), ou encore, est-ce que les résultats de deux moitiés d’un instrument sont comparables/multicollinéaires?
dit à quel point les items de notre mesure vont bien les uns avec les autres ou pas du tout. on veut qu’il soit entre .6 et .9 (en dessous, items trop éloignés, trop disparate, pas de cohérence interne, au dessus, les items sont trop similaires les uns avec les autres)
quels sont les 4 types de fidélité?
- Fidélité temporelle (aussi appelée stabilité, ou fidélité test-retest)
- Fidélité moitié-moitié («split-half»)
- Fidélité inter-juges (équivalence inter-codeurs)
- Cohérence interne
qu’est-ce que la fidélité temporelle?
Corrélation entre les résultats de deux passations d’un même questionnaire espacées dans le temps où les résultats vont être constants
forme parallèle: 1ere forme à un moment (questions 1 à 10) et 2eme forme plus tard (questions 11 à 20)
qu’est-ce que la fidélité moitié-moitié?
Corrélation entre les deux moitiés des items d’un instrument
ex. est-ce que la première moitié corrèle avec la 2eme, est-ce que les deux moitiés ont été répondues de la même façon
qu’est-ce que la fidélité inter-juges?
Mesure du degré d’accord entre au moins deux juges différents, représenté par l’indice statistique kappa (κ)
ex. les gens répondent de la même façon et on peut se baser sur l’un ou l’autre
qu’est-ce que la cohérence interne?
Degré d’homogénéité des énoncés d’un instrument mesuré par l’alpha de Cronbach (α): indice de cohérence interne qui augmente généralement avec le nombre d’énoncés d’une mesure (items)
ex. plus on a d’items, plus le l’alpha augmente, mais il faut que les items soient cohérents entre eux
peu importe qui donne le test, les résultats sont les mêmes
quel est le but des analyses factorielles?
L’analyse factorielle permet de comprendre les liens entre divers énoncés (ou «items») d’une échelle de mesure pour en extraire des facteurs
qu’est-ce que la métaphore?
les facteurs sont des assiettes et les données sont des grains de riz. Le but est de voir de combien d’assiettes on a besoin, inclinées à quel angle, pour échapper le moins de grains de riz possible (voir diapo 13 cours 10)
vrai ou faux: Seules certaines statistiques descriptives peuvent être faites sur des variables qualitatives (mais toutes sur les variables quantitatives).
vrai!
quels sont les 4 différents indicateurs statistiques descriptifs?
- Les mesures de tendance centrale (des données de l’échantillon)
- Les mesures de dispersion (des données de l’échantillon)
- Les indicateurs de forme (de la distribution des données de l’échantillon)
- Les mesures de position (positionnement d’un individu par rapport au reste de l’échantillon)
Qu’est-ce que le mode?
- La valeur ou catégorie la plus représentée de l’échantillon (celle dont la fréquence est la plus élevée) ex. groupe 19-21 ans qui revient le plus souvent
- La seule mesure de tendance centrale possible pour les variables nominales
- Pour les variables ordinales ou quantitatives, on peut aussi préciser si la distribution est unimodale (1 mode), bimodale (2 modes, par exemple taille H-F) ou multimodale (3+ modes) (des groupes ou la valeur est la même)
qu’est-ce que la médiane?
- Lamédianeest la valeur qui permet de partager une série numérique ordonnée en deux parties de même nombre d’éléments (la valeur en plein milieu)
- autant de personnes qui ont un score plus élevé que la médiane que de gens qui ont un score moins élevé que la médiane
- Si n est impair, la médiane est la valeur du milieu.
- Si n est pair, la médiane est la moyenne arithmétique des deux valeurs centrales.
- interessant par exemple dans un cas de revenu, où les ultra riches iraient tirer la moyenne vers le haut
vrai ou faux: il n’y a pas d’importance dans l’ordre des valeurs lorsqu’on parle de médiane
faux! il faut que les valeurs soient en ordre croissant
quelle formule utiliser pour trouver rapidement la position de la médiane?
(n+1)/2
qu’est-ce que la moyenne?
Lamoyenne («mean», 𝑥̅) correspond à la somme (∑)des valeurs (𝑥), divisée par le nombre de valeurs (𝑛)
La moyenne est plus facile à calculer que la médiane, mais elle est plus affectée par les valeurs extrêmes
EXERCICE
L’une des explications aux différences observées dans les études quant à l’âge de la 1ère relation sexuelle rapporté est la variation dans les mesures de tendance centrale utilisées…
Vous administrez un questionnaire à 11 adolescents âgés de 17 ans qui sont actifs sexuellement pour determiner à quel âge ils ont eu leur première relation sexuelle.
Les âges rapportés sont: 13, 13, 14, 14, 14, 15, 15, 16, 16, 17, 17
Quel est l’âge moyen? médian? modal?
l’âge moyen: 14.91
l’âge médian: 15
l’âge modal: 14
qu’est-ce qu’une mesure de dispersion?
Ladispersiond’une distribution témoigne de la variabilité au sein de l’échantillon sur la variable, c-à-d des différentes valeurs que prend une variable dans un échantillon donné.
quels sont les 4 types de mesures de dispersion?
- étendue
- écart moyen
- écart-type
- variance
qu’est-ce que l’étendue?
L’étendue («range») est la différence entre la valeur maximale et la valeur minimale de la variable
qu’est-ce que l’écart moyen?
Après avoir calculé lamoyenne, on peut chercher à savoir de quelle façon les valeurs s’éloignent de cette moyenne. On crée alors une nouvelle série statistique: les écarts à la moyenne (𝒆, ou, (𝒙−𝒙̅)).
quel est le problème avec l’écart moyen?
La moyenne des écarts à la moyenne (l’écart moyen) est toujours égale à zéro…
qu’est-ce que l’écart type et la variance?
- L’écart-type et la variance pallient les limites de l’écart moyen en passant par le carré des écarts à la moyenne (𝑒^2, ou, (𝑥−𝑥̅)^2), qui est ainsi toujours positif
- La variance (s^2) est la moyenne des carrés des écarts à la moyenne (quel est l’écart à la moyenne de chaque score au carré, carré de l’écart type)
- L’écart-type (s) est la racine carrée de la variance
à quoi sert la variance?
- Pour pouvoir tester des hypothèses, il doit y avoir variabilité (variance) dans les données des participants.
- Si tout le monde a le même score, il n’y a pas de différence à expliquer/prédire/tester
- La variance (𝒔^𝟐) exprime la dispersion des scores (données) autour de la moyenne.
qu’est-ce que l’écart type (s)?
c’est la racine carrée de la variance
à quoi ressemble l’écart type dans une distribution normale?
- Environ 68% des valeurs sont à +/- 1 écart-type
- Environ 95% des valeurs sont à +/- 2 écarts-types
- Environ 99% des valeurs sont à +/- 3 écarts-types
donc si il y a une moyenne de 20 heures de personnes qui regardent la télé
- entre 18 et 22 heures: 68% de la pop
- entre 16 et 24 heure: 95% de la pop
pourquoi mets-on les écarts-types au carré?
pour enlever les négatifs
pourquoi l’écart-type est-il plus utilisé que la variance?
L’écart-type (É.T.) est plus utilisé que la variance car il utilise les mêmes unités que la variable (au lieu du carré des unités)
si les données sont exprimées en pourcentages et se distribuent normalement, une moyenne de 80% avec un É.T. de 5 indique que 68% des participants ont obtenu un score entre _______ et _______.
75% et 85%
qu’est-ce que la distribution?
un résumé de l’ensemble des données, souvent exprimée par un tableau de fréquences ou un histogramme (en barres ou en pointes de tarte). La forme d’une distribution est un élément pertinent.
comment nomme-t-on le modèle normal de distribution?
distribution normale ou gaussienne
quelles sont les trois dimensions sont souvent évoquées pour décrire l’écart entre une distribution et le modèle normal
- L’asymétrie
- L’aplatissement
- Le nombre de modes
qu’est-ce que la distribution normale?
- ce modèle suit la loi statistique du même nom
- Toute distribution normale peut être décrite simplement en précisant sa moyenne et son écart-type
- Si la moyenne est 0 et l’écart-type est 1, on parle d’une distribution normale centrée réduite (Z).
pourquoi avons-nous la distribution normale comme modèle de base?
- Des mesures faites sur une populationde grande taille donnent souvent des valeurs qui sont distribuées selon une loi similaire à la loi normale, par exemple la taille des femmes cisgenres adultes d’une population donnée.
- La loi normale est un bon modèle pour les variations aléatoires d’une caractéristique dans un grand échantillon
quels sont les trois coefficients d’asymétrie?
- coefficient d’asymétrie nul
- coefficient d’asymétrie positif
- coefficient d’asymétrie négatif
qu’indique un coefficient d’asymétrie nul?
indique une distribution symétrique : c’est par exemple le cas de la courbe dite normale.
qu’indique un coefficient d’asymétrie positif?
indique une distribution décalée à gauche de la moyenne, et une queue de distribution vers la droite. (pente de ski tentante vers le positif, vers la droite)
qu’indique un coefficient d’asymétrie négatif?
indique une distribution décalée à droite de la moyenne, et une queue de distribution vers la gauche. (pente de ski tentante vers le négatif, vers la gauche)
quand retrouve-t-on le plus souvent un coefficient d’asymétrie positif?
lorsque les valeurs les plus élevées sont rares (ex.: salaire qui tire la moyenne vers le haut)
quand retrouve-t-on le plus souvent un coefficient d’asymétrie négatif?
lorsque les valeurs les plus faibles sont rares (ex.: compétition sportive ou les plus faibles tirent la moyenne vers le bas)
quels sont les 3 types de coefficients d’aplatissement?
- coefficients d’aplatissement nul
- coefficients d’aplatissement positif
- coefficients d’aplatissement négatif
qu’est-ce qu’un coefficients d’aplatissement nul?
implique une distribution «intermédiaire» ou mésokurtique
qu’est-ce qu’un coefficients d’aplatissement positif?
implique une distribution «pointue» ou leptokurtique – les données sont très près de la moyenne (petit écart-type)
qu’est-ce qu’un coefficients d’aplatissement négatif?
implique une distribution «aplatie» ou platikurtique – les données sont éloignées de la moyenne (grand écart-type)
qu’est-ce que la standardisation (Z)?
La normalisation/standardisation d’une distribution est sa transformation en distribution centrée réduite, en centrant la moyenne à 0 et en réduisant l’écart-type à 1. Cela transforme les scores en cotes Z, qui sont des valeurs standardisées, plus faciles à interpréter et à comparer lorsque les échelles de mesures diffèrent d’une variable à l’autre, d’un groupe ou d’un n à l’autre.
placer la moyenne à zéro et positionne les personnes par rapport à cette moyenne (position relative au reste du groupe) seulement possible avec la loi normale
quelles sont les étapes pour résoudre le score Z?
- calculer la moyenne du groupe
- calculer l’écart-type
- résoudre la formule du score z ([score de chaque participant - moyenne] / écart-type)
pourquoi des personnes pourraient avoir des scores Z négatifs?
parce que leur score Z est en dessous de la moyenne
dans quel cas quelqu’un pourrait avoir un score Z de zéro?
quand son score Z est équivalent à la moyenne
la cote Z est l’emplacement de la personne sur __________________________.
la courbe de la loi normale