Cours 10 - Validité Flashcards
Un score à un test psychologique n’est utile que s’il…
…est relié à quelque critère externe ou construit théorique ayant un certain intérêt.
En d’autres termes, dans quelle mesure les différences individuelles quant aux scores obtenus reflètent des différences pertinentes quant à une question posée.
Quel est le but de la validation d’un test?
Préciser deux aspects fondamentaux:
- Ce que le test mesure et;
- avec quel degré de précision il le mesure.
La validité d’un test réfère à quoi?
Au degré avec lequel un test mesure ce qu’il est supposé mesurer, mais plusieurs facteurs, théoriques et pratiques, justifient l’utilisation des tests psychologiques et chacun de ceux-ci influence différemment la notion de validité.
V ou F
Il n’y a pas de définition absolue de la validité d’un test.
Vrai
Puisque cette validité dépend du contexte d’utilisation de ce test, des fins pour lesquelles il est utilisé et des questions auxquelles il tente de répondre. Par exemple, un thermomètre risque de fournir une mesure valide de la température de votre corps, mais invalide de votre compréhension de la psychométrie. C’est donc dire qu’un test n’est jamais valide en soi, mais c’est plutôt son utilisation spécifique qui est valide ou invalide. De façon globale, la validité d’un test réfère donc à la pertinence des inférences que l’on tire des résultats fournis par le test.
Comment peut-on illustrer la validité d’un test?
En se rappelant la notion de score vrai. Le score au test s’exprime ici sous la forme…
Formule du score vrai.
Ici, c’est comme si on décomposait le score vrai en score pertinent (Xp) et en score non pertinent (Xn), i.e.
Quelles sont les trois grandes méthodes de validation d’un test?
- Validation de contenu: (que l’on a étudié lors de l’analyse des items) et qui porte en fait sur la pertinence et la couverture des contenus.
- Validation de construit: cohérence avec la «structure théorique».
- Validation critériée ou pragmatique: relation avec un critère externe.
Qu’est-ce que la validation pragmatique?
La validation pragmatique ou critériée est une méthode qui s’applique à tous les cas où il existe une mesure indépendante et directe de la caractéristique que le test est supposé mesurer. On appelle cette mesure: critère (externe).
La méthode consiste à calculer la corrélation entre le résultat au test et le critère.
Quelques exemples de validité critériée (pragmatique).
- Test d’aptitudes mécaniques -> performance ultérieure comme machiniste (critère) (prédictif)
- Test d’aptitudes scolaires au secondaire-> résultats scolaires au collégial (critère) (prédictif)
- Test de tendances névrotiques -> diagnostic clinique professionnel. (critère) (concomitante)
Cette méthode de validation présuppose l’existence de quoi?
Du critère.
Par conséquent, le test ne mesure pas un construit purement théorique, mais a plutôt pour but de prédire où se situe l’examiné par rapport à ce critère.
Quels sont les deux types de validation critériée?
- La validation concomitante (lorsque l’administration du test et la mesure du critère sont simultanées)
- La validation prédictive (lorsque l’administration du test précède d’un certain intervalle de temps la mesure du critère).
La méthode de validation concomitante s’avère appropriée lorsque le test à valider sera éventuellement utilisé à des fins de…
…diagnostic, c’est-à-dire à la mesure d’un état actuel.
Par exemple, un test de connaissances en pilotage d’avions commerciaux chez des pilotes commerciaux.
La méthode de validation prédictive s’avère appropriée lorsque le test à valider sera éventuellement utilisé à des fins de…
…pronostic, c’est-à-dire que le test servira à prédire un état futur.
Par exemple, un test d’aptitudes au pilotage (utilisé avant un cours).
Quelle est l’exception à cette règle?
Lors de l’étape de validation, il s’avère parfois que l’intervalle de temps qui sépare l’administration du test de la mesure du critère est trop long. On s’en remet alors à la validation concomitante en contrastant la performance d’échantillons «pré-sélectionnés», i.e. composés d’examinés pour lesquels les données critériées sont déjà disponibles.
Par exemple, en passant le test d’aptitudes au pilotage à un groupe de pilotes et à un groupe de non-pilotes.
Quelles sont les grandes catégories de critères qui sont souvent considérés lors de l’analyse de la validité de certains types de tests?
- La performance académique
- La performance à un cours spécialisé
- Rendement au travail
- Groupes contrastés (critère composite)
- Diagnostic psychiatrique
- Jugements appréciatifs
- Liens avec les tests existants
Exemples de critères de performance académique.
- Notes scolaires
- promotion de classe
- obtention d’un diplôme
- niveau d’éducation atteint (chez les adultes)
- etc.
Utilisé pour mesurer la validité des tests d’«intelligence générale», des tests d’aptitudes scolaires.
Exemples de critères de performance à un cours spécialisé.
- Appréciations par les instructeurs
- achèvement vs abandon du cours
- etc.
Utilisés pour mesurer la validité de tests visant à mesurer des aptitudes spécifiques (aptitudes mécaniques, de pilotage, etc.).
Exemples de critères de rendement au travail.
- Mêmes fins que dans l’exemple précédent (i.e. performance à un cours spécialisé).
- La standardisation est plus difficile car il peut y avoir beaucoup de différences d’un lieu de travail à l’autre.
Exemples de critères de groupes contrastés (critère composite, non homogène).
- Par exemple, un test d’aptitudes musicales -> comparaison entre les élèves du conservatoire de musique et ceux des autres disciplines.
- Cette méthode est souvent utilisée pour «valider» les tests de personnalité.
- Par exemple, Leadership -> comparaison entre les directeurs d’entreprise et les employés de bureau.
Exemples de critères de diagnostic psychiatrique.
Le diagnostic sert de critère pour établir la validité de certains tests de personnalité qui pourraient éventuellement faciliter le travail diagnostic.
Exemples de critères de jugements appréciatifs.
Les jugements appréciatifs servent surtout à valider les tests de personnalité.
- Pour certains types de «traits», les appréciations de l’entourage de l’examiné sont possiblement le meilleur critère.
- Par exemple, votre conjoint est en mesure de porter un jugement sur votre «niveau de libido».
- C’est comme le critère précédent (i.e. «diagnostic psychiatrique»), mais ce sont les personnes de l’entourage immédiat qui agissent comme «experts».