La mesure Flashcards
Donnez une définition de ce qu’est une qualité psychométrique et dites quelles sont les deux principales
qualités qui permettent de juger la valeur des mesures en psychologie; plus les mesures ont des bonnes qualités psychométriques, plus notre étude est rigoureuse
fidélité et validité
Qu’est-ce que la fidélité ?
la précision de l’instrument peu importe ce qu’il mesure (ou constance)
Complétez les phrases suivantes concernant la fidélité:
Une mesure est considérée fidèle si son application entraîne______________, donc qu’elle mesure toujours le _________________ de la même façon.
La fidélité d’une mesure est rattachée à____________
toujours des résultats semblables
concept psychologique
la notion d’erreur de mesure
Score observé = _____________ + ______________
Expliquez
vrai score + erreur de mesure
Plus le test en fidèle (moins les observations varient), plus le score observé se rapproche du vrai score
Qu’est-ce que l’erreur de mesure systématique ? Donnez un exemple
Des facteurs inhérents au test l’influencent: distorsion systématique des résultats (tjrs + haut ou tjrs + faible)
Lorsque des items du test sont problématiques : dans un test sur la dépression, les personnes âgées auront des résultats bas, car pour eux la question sur le suicide est tabou
Qu’est-ce que l’erreur non-systématique ? Remet-elle la fidélité en question ?
erreur provenant des facteurs extérieurs au test; aléatoire découlant des différentes caractéristiques des individus
ne remet pas la fidélité en question, car se distribue normalement
Qu’est-ce que la fidélité temporelle, ou stabilité test-retest ?
capacité d’un même test à reproduire les mêmes résultats à la suite d’applications répétées de ce test; constance des résultats obtenus entre deux passations séparées par intervalle de temps
Décrivez comment se mesure concrètement la fidélité temporelle
demander à un échantillon de participants de se soumettre à 2 administrations du même instrument, avec intervalle de temps d’environ 1 mois entre les deux passations
Comment se calcule statistiquement la fidélité temporelle ?
corrélation de Pearson (r) calculée entre scores des 2 passations (plus la corrélation est élevée, plus le test est jugé fidèle)
Vrai ou faux : la fidélité temporelle se mesure autant pour les concepts stables que pour les états passagers ou influencés par la mémoire / apprentissage
faux: OK pour concepts stables, mais pas pour états passagers (humeur, émotions) ou influencés par mémoire / apprentissage
Qu’est-ce que la fidélité par formes équivalentes (ou parallèles) ? Décrivez comment elle se mesure concrètement
Technique qui compare deux versions d’un même test
participants remplissent deux versons différentes mais équivalentes qui contiennent même nombre d’items, même présentation, mêmes directives, etc.
une seule passation ou deux passations (augmente erreur)
Décrivez comment la fidélité par formes équivalentes (ou parallèles) se mesure statistiquement
corrélation de Pearson (r) calculée entre les deux scores (mesure jugée fidèle si corrélation élevée)
Quel est l’avantage de la fidélité par formes équivalentes par rapport à la fidélité temporelle ?
Limite les effets de l’apprentissage, mais ne l’exclut pas totalement (problèmes à résoudre peuvent se ressembler dans la première et dans la deuxième version)
Quel est le type de fidélité le plus utilisé en psychologie ?
La cohérence interne (homogénéité ou consistance interne)
À quoi fait référence la cohérence interne ? Concrètement, combien de passation(s) est (sont) requise(s) ?
Fait référence au degré d’homogénéité des items d’un test
degré de consistance qu’offrent les réponses d’un individu aux questions variées d’un test (jusqu’à quel point ses réponses vont dans le même sens)
1 passation
Statistiquement, comment mesure-t-on la cohérence interne avec des échelles de mesure ordinales ou d’intervalles ?
Avec l’alpha de Cronbach: plus coefficient est élevé, plus test est fidèle (varie entre 0 et 1)
Statistiquement, comment mesure-t-on la cohérence interne avec des échelles de mesure nominales dichotomiques (vrai ou faux)?
Avec l’alpha de Kuder-Richardson : plus le coefficient est élevé, plus le test est fidèle
Vrai ou faux : la cohérence interne peut être utilisée pour les concepts stables ou qui varient selon temps et la situation
Vrai: personnalité, estime de soi ET humeurs, émotions
Quels sont les quatre types de fidélité ?
Fidélité temporelle
Fidélité par mesures équivalentes
Cohérence interne
Accord inter-juges
Qu’est-ce que la fidélité de type accord inter-juges et comment se mesure-t-elle concrètement?
niveau d’accord entre les jugements d’observateurs et de juges concernant la présence ou l’absence d’une caractéristique
des juges doivent évaluer la présence d’un comportement ou porter un jugement clinique sur plusieurs individus (souvent avec mesures d’observation, ex. grilles structurées)
Quel est le rôle du kappa de Cohen dans la mesure statistique de la fidélité inter-juges ?
Il corrige le pourcentage d’accord en tenant compte de l’influence du hasard
La validité est le degré d’adéquation avec lequel un instrument de mesure correspond au construit qu’il prétend; la relation entre construit psychologique théorique et le test qui le mesure. Résumez cela à l’aide d’une question.
est-ce que l’instrument mesure bien ce qu’il est supposé mesurer?
Quels sont les quatre types de validité ?
Validité apparente
Validité de contenu
Validité de critère
Validité de construit
Donnez une définition de la validité apparente
correspondance logique entre les items du test et ce qu’il prétend mesurer: questions sont liées à ce qu’on veut vraiment voir
Dites comment on mesure la validité apparente concrètement et statistiquement
concrètement: évaluation de surface des items d’un test par des juges (sans qu’ils soient experts); ils donnent leur avis sur la qualité des items pour mesurer le construit (sans méthodologie)
statistiquement: aucune analyse statistique n’est requise pour ce type de validité (procédure de validation la moins scientifique)
Nommez un avantage de la validité apparente
créer tests mieux acceptés par les utilisateurs, car leur paraissent légitimes
Nommez des exemples de questions appropriées pour un test pour dépister la délinquance. La validité est-elle apparente ?
validité non-apparente questions indirectes : mon père était un homme bon / j’aurais aimé travailler dans un cirque ou une fête foraine (lié à l’antisociabilité) / je suis certain que je n’ai pas été gâté par la vie (aussi lié à l’antisociabilité)
PAS: j’aime voler des choses, je me bats fréquemment
Sur quoi porte la validité de contenu ? Nommez deux éléments importants de cette validité
sur le fait que les items que contient un test sont pertinents au construit visé, tel qu’il est défini (selon opérationnalisation)
- à quel point les énoncés tu test couvrent l’ensemble du construit
- à quel point les énoncés du test ne contiennent pas de variables non-pertinentes
Comment mesure-t-on concrètement la validité de contenu ?
Des experts évaluent la validité de chaque item en lien avec le construit visé
Vrai ou faux : mis à part un peu d’accord inter-juges, aucune analyse statistique n’est nécessaire pour la validité de contenu
vrai
Qu’est-ce que la validité de critère ?
Cette validité est démontrée lorsque ________
efficacité d’un test à prédire le comportement psychologique dans diverses situations (p. ex., affects, cognitions, actions)
la mesure est reliée à un comportement (le critère) auquel elle est censée être reliée
Donnez un exemple de critère
Nombre de ventes, nombre de cours réussis, etc.
Quelles sont les deux formes de validité de critère ?
Validité concomitant et validité prédictive
On peut effectuer une validité de critère concernant l’appartenance à un groupe en déterminant la ____________ et la _______________ d’une mesure.
sensibilité
spécificité
Donnez un exemple d’une mesure trop sensible mais pas assez spécifique
On dit que cette mesure a trop de ___________
Qui a bu au moins 2 consommations la semaine dernière ? Vous devez allez en désintox.
Faux +
Donnez un exemple d’une mesure trop spécifique et pas assez sensible
On dit que cette mesure a trop de ___________
On ne t’hospitalise pas à moins que tu nous montres ton arme à feu et nous décrivez les étapes de ton suicide
Faux -
Quelle est la différence entre la validité concomitante et la validité prédictive ?
La validité concomitante est la capacité de prédiction d’un test alors que le test et le critère son mesurés au même moment, tandis que le critère est mesuré ultérieurement dans la validité prédictive
Donnez un exemple où on mesure concrètement la validité concomitante; comment cela se calculte-t-il statistiquement ?
Renverser son café sur quelqu’un après lui avoir fait passé un test sur les attitudes colériques
Coefficient de corrélation de Pearson calculé entre critère et test (plus il est élevé..)
Donnez un exemple où la validité prédictive est mesurée concrètement: comment cela se calcule-t-il statstiquement ?
Test qui mesure niveau de stress au travail est administré et 6 mois plus tard, psychologue vient évaluer épuisement au travail
Corrélation calculée entre critère et test
Les limites de la validité prédictive sont :
La grandeur de l’échantillon (au moins 200, car on perdra des participants) et __________
fidélité (du test et du critère) à moins que le critère ait une fidélité parfaite
À quoi sert la validité de construit ?
À vérifier la justesse avec laquelle le test permet de bien mesurer le construit, tel qu’il est défini par son cadre théorique de base
Quels sont les deux éléments permettant de rendre compte de la validité de construit ?
La structure du construit
Validité convergente / divergente
Dans la validité de construit, distinguez validité convergente et divergente
Convergente : corréler avec item approprié
Divergente : démontrer que test n’est pas corrélé avec items non-pertinents
À propos de la structure du construit:
Un test possédant un haut niveau de validité de construit devrait être en mesure de démontrer
_________
Les items doivent aller ________
Un structure en accord avec la théorie sous-jacente
dans les bonnes dimensions
Concrètement et statistiquement, comment vérifie-t-on la structure du construit ?
Administrer test à échantillon de grande taille Analyse factorielle (exploratoire / confirmatoire) permet de valider structure factorielle du test
Dans la validité de construit, qu’est-ce que la validité convergente ?
capacité d’une mesure de produire des résultats semblables à ceux produits par d’autres mesures qui sont reliées au construit en question
Dans la validité de construit, qu’est-ce que la validité divergente ?
démontrer que test n’est pas significativement corrélé avec construits non-pertinents
Pour la validité convergente :
Concrètement: administrer l’instrument de mesure ainsi qu’une autre mesure déjà validée qui mesure un construit similaire
statistiquement: corrélation de pearson ( r ) est calculée entre mesure (score total) et le test déjà existant → corrélation doit être significative et élevée
Qu’en est-il de la validité divergente ?
Concrètement : administrer instrument de mesure ainsi qu’une autre mesure validée qui mesure construit non-pertinent
Statistiquement : Corrélation de Pearson doit être non-significative
Donnez un exemple de validité divergente
échelle d’estime de soi est mise en lien avec mesure existante du narcissisme. 2 scores totaux montrent corrélation de -0,024 = corrélation nulle
Complétez :
La _________ engendre habituellement la __________
fidélité
validité
Comment la fidélité limite-t-elle la validité ?
Bonne fidélité = moins d’erreur de mesure = meilleure validité
Complétez:
c’est la somme des _______________ qui permet d’avoir une certitude ______________
mesures par convergence d’indices sur le terrain
clinique raisonnable