Cours du 23 et 30 mars - Final Flashcards
Pourquoi est-ce qu’on utilise les quartiles plutôt que l’écart-type?
L’écart-type est sensible aux données extrêmes (outliers)
Définition de l’écart interquartile + pourquoi on l’utilise?
Mesure la dispersion autours de la médiane
Représente les 50% des données au centre de la distribution
Permet d’enlever les outliers
Les quartiles sont divisés en combien de parties et combien de % des données contiennent-elles?
4 parties et contiennent 25%
Définition du rang centile + ce que ça permet
Division d’un ensemble de données en 100 intervalles
Le rang s’il y avait juste 100 valeurs
Caractéristiques d’une distribution normale
Distribution symétrique
Moyenne, mode et médiane sont identiques
68% des observations sont à +/- un écart-type de la moyenne
Utilité du score-z et spécification sur les données brutes
Permet de déterminer position relative de chaque observation par rapport à la moyenne
Données brutes DOIVENT être normales
Définition des statistiques inférentielles + les 2 techniques
Généraliser résultats d’un échantillon vers une population
Différences entre les groupes et relations entre les variables
Pourquoi est-ce qu’on fait calcule les différences entre les groupes? + Les méthodes de différences entre les groupes?
Pour comparer les moyennes de deux ou plusieurs groupes
- Test-t pour échantillon unique
- Test-t pour échantillon appariés (pré-post)
- Test-t pour échantillon indépendants ( Groupe A vs Groupe B)
- Analyse de variance (ANOVA) (plusieurs groupes pour une VD)
- Analyse de variances multivariées (MANOVA) (Plusieurs groupes, pour plusieurs VD)
- Analyse de covariance (ANCOVA) (3 groupes ou plus, co-variable)
Pourquoi est-ce qu’on fait la relation entre les variables? + les méthodes pour variables “de catégories” et “continues”
Pour déterminer degré d’association (lien) qui peut exister entre 2 ou plusieurs variables
“De catégories” : Test de Chi-2 (fréquences attendues vs observées)
“Continues” : Corrélation de Pearson, Régression linéaire
À quoi sert la corrélation? + Quelles sont les méthodes pour calculer une corrélation?
Étudier le lien entre deux variables, vérifier la linéarité de leur relation
Nominale : Chi-2
Ordinale : Spearman
Intervalle/de rapport : Pearson
Vrai ou faux? La corrélation nous permet d’établir un lien de cause-effet (causalité)
Faux, on peut uniquement dire qu’il y a une corrélation
Qu’est-ce qu’on considère une bonne ou très bonne corrélation?
0,3 à 0,6 et 0,6 à 0,8
Qu’est le minimum pour une fidélité test-retest?
0,7-0,8
On vise 0,8 et 0,9 ou plus
Quels sont les niveaux de signification couramment utilisés pour les corrélations?
P < 0,05
P < 0,01
P < 0,001
Qu’est-ce qu’on utilise pour interpreter corrélation?
Coefficient de corrélation au carré -> Coefficient de détermination
Définition de la régression + régression simple
Variation de la variable X sur la variable Y. (VI sur VD)
Prédiction de VD par VI
Les 3 propriétés psychométriques des tests
Sensibilité, Validité et fidélité
Définition de la sensibilité
Capacité à classer la performance des participants, en les différenciants nettement les uns des autres.
La capacité à détecter une variation du score vrai sur le trait mesuré.
Différence entre sensibilité et spécificité
Sensibilité: Capacité de l’instrument à identifier correctement les personnes présentant la caractéristique qu’on veut étudier
Spécificité: capacité de l’instrument à identifier correctement personnes qui ne présentent pas la caractéristique qu’on veut étudier.
Qu’est-ce qui affecte la sensibilité, dans le construit d’un test?
Le nombre d’items -> plus on a d’items, plus c’est possible d’établir différences entre les individus
Le niveau de difficulté des items -> les items doivent être de difficultés différentes pour discriminer les sujets et éviter effet plafond/plancher
Comment est-ce qu’on étudie la sensibilité d’un test?
On établit la distribution des résultats et on examine la forme avec les indices de dispersions.
Si la distribution n’est pas normale, le choix d’item est potentiellement mauvais.
Qu’est-ce que la fidélité?
Fait référence à la stabilité des scores, pour plusieurs passations du même test
Le degré de précision et de constance des scores
Pour la fidélité : qu’est-ce que la précision et la constance des scores?
Précision : capacité à produire un score observé qui est le plus proche du score vrai (donc moins d’erreur de mesure).
Constance : capacité à obtenir des résultats hautement similaires pour le même instrument, à 2 moments dans le temps
Par quoi est influencée la fidélité?
Plusieurs choses, mais notamment : échelle de mesure utilisée, le mode d’administration, la clarté des concepts à mesurer, la consistance des évaluateurs, etc.
Quelles sont les principales méthodes (3 catégories + sous-catégories) pour calculer le coefficient de fidélité?
- Méthode de stabilité (répétabilité)
- Méthode d’équivalence (reproductibilité)
- Méthode de cohérence interne (ou homogénéité des items)
- Split-half
- Alpha de Cronbach
Comment est utilisée la méthode de stabilité (fidélité) et à quoi sert-elle?
Comment est-ce qu’on interprète la corrélation test-retest?
Avec un test-retest et permet de mesurer la stabilité de mesure dans le temps, auprès d’un individu
Plus la corrélation est importante, plus le test est considéré “répétable” et donc fidèle
Qu’est-ce qui est considéré une bonne valeur pour un test-retest?
Indiquer pour test perceptif, test subjectif et test d’attitude
Test perceptif : 0,90 +
Test subjectif : 0,50 +
Test d’attitude : 0,70 +
Comment réalise-t-on la méthode d’équivalence (fidélité) et qu’est-ce que ça nous donne comme information?
On administre 2 versions du même instrument
La reproductibilité (méthode d’équivalence) nous donne de l’information sur la variation inter-opérateur (la personne qui administre le test)
Quel sont les désavantages de la méthode d’équivalence?
Faire 2 versions, ça coute plus cher et les 2 versions seront jamais 100% pareils
Qu’est-ce que la méthode de cohérence interne mesure + quels sont ses caractéristiques + les 2 méthodes possibles?
La méthode de cohérence interne mesure la cohésion entre les items, le fait qu’ils mesurent le même construit.
Il s’agit de la méthode utilisée la plus fréquemment, et elle nécessite une seule passation
Méthodes:
- Corrélation de scores obtenus à 2 moitiés de l’instrument (split-half)
- Corrélations entre couples d’items (2 à 2) ou les corrélations entre chaque item et l’instrument dans son ensemble (alpha de Cronbach)
Comment fonctionne une corrélation split-half?
On divise le questionnaire en deux et on compare les résultats à chaque moitié
Quelles sont les méthodes de séparation pour la corrélation split-half?
- Partition aléatoire (random split)
- Séparation pair/impair
- Partition appariée (en fonction du contenu et de la difficulté) (Matched-split)
Quelles sont les informations utilisées pour un Alpha de Cronbach ?
Les corrélations inter-items et les corrélations items-totals
Qu’est-ce que les corrélations inter-items + quel est l’intervalle de valeur visée pour une corrélation inter-item?
Corrélation des items entre eux (2 par 2)
Entre 0,30 et 0,80 est l’intervalle de valeur visée
Qu’est-ce que les corrélations item-total + quel est l’intervale de valeur visée pour une corrélation item-total?
Corrélation entre chaque item et le score total
On vise entre 0,20 et 0,40
Qu’est-ce qui cause un alpha de Cronbach très faible ou négatif?
- Plus d’un concept mesuré
- Certains items mesurent mal le concept
- Échelle aurait du être inversée pour les items
- Contient des sous-concepts
Comment est défini l’alpha de Cronbach ( de manière mathématique mais PAS la formule)
L’estimé split-half moyen de tous les estimés split-half possibles
Quelles sont les valeurs visées pour l’Alpha de Cronbach?
Seuil minimal de 0,70
On aimerait toutefois que ce soit 0,80 ++
Qu’est-ce qu’indique un alpha de Cronbach élevé? +
Vrai ou faux - Est-ce que l’alpha de Cronbach assure l’unidimensionnalité?
Indique que le test mesure quelque chose, mais n’indique pas quoi -> pourrait donc mesurer plusieurs concepts
Faux - L’alpha de Cronbach n’assure pas l’unidimensionnalité
Quelles sont les grandes lignes pour l’interprétation des coefficients de fidélité?
Doit être assez élevées, puisqu’on veut qu’elles mesurent le même concept
Doivent toutefois pas être trop élevées, ce qui indiquerait qu’elles mesurent la même chose exactement et pas juste même concept
Quelle est la différence entre validité et fidélité?
La fidélité concerne la précision avec laquelle un test mesure une caractéristique.
La validité concerne la qualité de ce qui est mesuré.
Vrai ou faux - Un test non fidèle peut être valide
Faux - un test non fidèle est nécessairement non-valide
Définition de la validité
Relation qui existe entre les éléments théoriques (modèles, concepts, définitions, hypothèses, etc.) et la réalité empirique qui doit les représenter
Vrai ou faux - La validité est le concept le plus important et fondamental en psychométrie?
Vrai
Vrai ou faux - On détermine si un instrument est valide ou non?
Faux - on détermine son degré de validité pour un attribut précis, pour une population cible précise et pour un contexte spécifique
Quels sont les types de validité?
Validité de contenu
Validité de construit
Validité de critère
Validité d’apparence
Définition de la validité d’apparence
En lien avec la crédibilité du test pour les personnes qui le passent
Par qui est évalué la validité d’apparence?
Habituellement, des experts
Vrai ou faux - La validité d’apparence est la méthode la moins rigoureuse pour évaluer la validité?
Vrai - Elle est toutefois importante et nécessaire
Définition de validité de contenu
Évalue dans quelle mesure les items/épreuves sont représentatifs du ou des construits mesurés et leurs différentes facettes
Quelles sont les analyses réalisées pour la validité de contenu?
Qualitative : validation de la définition des construits, etc.
Quantitative : Calcul de coefficient d’accord inter-juge, corrélations, etc.
Quelles sont les 7 règles de la validation de contenu?
- Définir domaine et facettes du construit + valider la définition précise
- Soumettre tous les éléments de l’instrument à validation de contenu
- Utiliser échantillon de la pop cible pour créer items initiaux
- Consulter plusieurs juges pour valider le contenu de l’instrument + quantifier jugement avec échelles formalisées
- Examiner représentations proportionnelles (poids relatif) des items aux différentes facettes du construit
- Présenter résultats de la validation de contenu dans publication du nouvel instrument
- Utiliser analyses psychométriques ultérieures pour améliorer validité de contenu
Qui a écrit la théorie des règles essentielles de la validation de contenu?
Haynes, Richard et Kubany ( 1995)