Cours 5 : Propriétés psychométriques - validité Flashcards

Question 1

Q

La validité d’un test ou d’une mesure doit être évaluée relativement à trois aspects. Lesquels?

Answer

A

Est-ce qu’il mesure bien le construit qu’il prétend mesurer ?
Est-ce qu’il mesure bien ce construit pour la population ciblée ?
Est-ce qu’il mesure bien ce construit pour une application particulière (e.g., classifier dans des groupes diagnostiques) ?

Question 2

Q

La validité c’est une question de ______.

Answer

A

degré (est-ce que l’instrument est valide, pas oui ou non, mais plutôt à quel degré est-il fiable)

Question 3

Q

Les organisations professionnelles soulignent trois points à propos de la validité des tests?

Answer

A

La validité concerne l’interprétation des scores procurés par un test pour un construit spécifique; ce n’est pas une caractéristique du test
La validité est une question de degré ; ce n’est pas une question absolue, de «tout ou rien»
La validité d’un test repose sur de solides bases théoriques et empiriques

Question 4

Q

Quelles sont les 3 grandes sources de validité?

Answer

A

Validité de contenu, validité de construit et validité de critère

Question 5

Q

Quelques facteurs peuvent venir influencer la vraisemblance, lesquels?

Answer

A

Format de présentation de l’instrument
Contexte d’évaluation
Capacités cognitives du répondant
Santé mentale et état psycho. du répondant
Personnalité du répondant
Motif de l’évaluation

Question 6

Q

C’est quoi la vraisemblance?

Answer

A

Ce n’est pas une forme ou une source de validité
Mais plutôt le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement :

des personnes qui sont évaluées avec le test
des personnes qui utilisent le test

Question 7

Q

La validité de contenu réfère au degré de __________.

Answer

A

représentativité des items (questions) pour mesure un certain construit (impulsivité par exemple)

Question 8

Q

«Est-ce que tous les domaines et les sous-domaines sont bien représentés?»
On se pose cette question dans quelle source de validité?

Answer

A

La validité de contenu (pour rendre compte de la représentativité)

Question 9

Q

On peut quantifier la validité de contenu au lieu de juste prendre verbatim les informations

Question 10

Q

À partir de quoi les chercheurs définissent ils un construit ?

Answer

A

Cadre théorique
Recherches empiriques (recension de la littérature)
Connaissances et expériences professionnelles/pratiques

Question 11

Q

Quels sont les deux types de validité de contenu ?

Answer

A

Nominale : définie par les auteurs du test
Consensuelle : définie par un groupe de spécialistes indépendants

Question 12

Q

Quelles sont deux grandes menaces à la validité de contenu?

Answer

A

Inclusion de contenu conceptuellement non pertinent
–> ex: des items d’hyperactivité sont intégrés dans une échelle d’inattention
Sous-représentation conceptuelle de certains domaines du construit
–> ex: Théoriquement, le construit Extraversion inclue les domaines de l’activité, la sociabilité, la dominance sociale et la recherche de sensation, mais une échelle ne contient que des items de sociabilité et de dominance sociale

Question 13

Q

Comment estimer empiriquement le degré de validité de contenu?

Answer

A

Demander à des experts.es indépendants.es d’évaluer :
- La pertinence et la représentativité de chaque item du test
- La représentativité globale de l’ensemble des items

Question 14

Q

C’est quoi la validité de construit?

Answer

A

Réfère au degré de :
1. reproductibilité de la structure interne théorique sous-jacente à l’instrument
2. relations du construit d’intérêt avec d’autres construits externes

Question 15

Q

Quelles sont les deux grandes manières de vérifier la validité de construit?

Answer

A

validité factorielle
validité convergente

Question 16

Q

Quelle est la théorie sous-jacente à la validité de construit?

Answer

A

Le réseau nomologique : la théorie expliquant le construit par le biais de ses interrelations avec d’autres construits –> devrait donc représenter la structure interne et les interrelations (ordonnées et prévisibles) entre les domaines (ou sous-domaines) importants du construit

Nomologie : l’étude des lois, donc bien plus qu’une liste de domaines ou sous-domaines

Question 17

Q

C’est quoi la validité factorielle? Et c’est quoi un facteur?

Answer

A

Validité factorielle fait partie de la validité de construit.

Question 18

Q

L’objectif de la validité factorielle est de vérifier deux choses :

Answer

A

les items (questions) sont-ils significativement associés au construit?
dans le cas d’un instrument multidimensionnel
–> Les items sont-ils significativement associés au bon facteur et non associés aux autres facteurs ?
–> Dans le cas d’une structure hiérarchique, est-ce que les sous-domaines sont significativement associés au domaine général (ex: traits spécifiques associés à trait général) ?

Question 19

Q

C’est quoi une analyse factorielle exploratoire VS. une analyse factorielle confirmatoire en quelques mots?

Answer

A

Analyse factorielle exploratoire (AFE) :
Sert à identifier la structure sous-jacente d’un ensemble de variables sans hypothèse préalable. Elle aide à déterminer combien de facteurs existent et comment chaque variable y contribue.

Analyse factorielle confirmatoire (AFC) :
Sert à tester si un modèle factoriel défini à l’avance correspond aux données observées. Elle permet de vérifier si les relations entre les variables et les facteurs sont conformes aux attentes théoriques.

Question 20

Q

Validité convergente

Définition : Degré auquel les scores d’une échelle sont associés à ceux d’une autre échelle qui mesure le même construit.

Validité discriminante

Définition : Degré auquel les scores d’une échelle ne sont pas associés à ceux d’une échelle mesurant un autre construit (corrélation faible attendue).

Matrice multitraits-multiméthodes

Utilité : Test rigoureux des validités convergente et discriminante.

Particularité : La diagonale contient une estimation de la fidélité et non des corrélations égales à 1.

Validité de critère

Définition : Degré auquel les scores d’une échelle sont associés à l’adaptation ou la performance des individus, comparés à un critère externe.

Critère externe : Doit être objectif, indépendant et conceptuellement lié au construit évalué.

Types de validité de critère

Concomitante : Mesure simultanée des variables X et Y chez une même personne.

Méthodes :

Corrélation avec un critère indépendant.

Méthode des groupes contrastés (différences de scores moyens entre groupes).

⏩ Prédictive : Prédiction des résultats futurs sur un critère externe.

Validité incrémentielle

Définition : Valeur ajoutée des scores d’un test pour prédire un critère externe au-delà d’autres facteurs prédictifs.

Théorie de la décision et validité de critère

Objectif : Analyser l’effet quantitatif des décisions prises avec des tests.

But : Déterminer si les scores permettent une classification adéquate des individus.

Tableau de prédiction (2x2)

But : Évaluer la capacité d’un test à classer correctement les individus.

Axes =

Lignes : Statut réel (présente ou non le trouble).

Colonnes : Résultat du test (positif ou négatif).

Sensibilité et Spécificité

🔍 Sensibilité : Capacité d’identifier positivement les personnes ayant le trouble.

🚫 Spécificité : Capacité d’identifier négativement les personnes n’ayant pas le trouble.

Calcul : Proportion des individus correctement classés par rapport au score critère établi par les auteurs du test.

Pouvoir prédictif

But : Évaluer la confiance à accorder à un résultat obtenu pour un individu.

Deux types :

✅ PPP (Pouvoir Prédictif Positif) : Probabilité qu’un individu ayant un résultat positif ait réellement le trouble.

❌ PPN (Pouvoir Prédictif Négatif) : Probabilité qu’un individu ayant un résultat négatif n’ait pas le trouble.

Différence Sensibilité/Spécificité vs. les Pouvoirs Prédictifs

Sensibilité et spécificité : Paramètres internes au test, influencés par le score critère.

PPP et PPN : Indices extrinsèques, dépendants de la prévalence du trouble.

Attention : Si la prévalence est très faible, la fiabilité du pouvoir prédictif diminue.