Cours 5 Flashcards
Qu’est-ce que la validité?
Lorsqu’on évalue la validité d’un instrument de mesure, on veut généralement savoir s’il mesure vraiment ce qu’il prétend ou devrait mesurer. On veut savoir si l’échantillon d’items (i.e., les questions)de l’échelle représente bien le construit qu’on veut mesurer
Le degré de validité détermine l’________________________ et les _____________________ que l’on peut faire à partir des scores d’une échelle
Le degré de validité détermine l’INTERPRÉTATION et les INFÉRENCES que l’on peut faire à partir des scores d’une échelle
Vrai ou faux
Le nom d’un test ou d’une échelle constitue toujours un indice adéquat du construit mesuré
Faux
Le nom d’un test ou d’une échelle ne constitue pas toujours un indice adéquat du construit mesuré – Soyez toujours méfiants.es !
La vraie question n’est pas «est-ce que ce test est valide ou pas», mais bien:
«est-ce que ce test est une mesure valide de ce construit, pour cette population et pour cette application particulière»
Vrai ou faux
Pour plusieurs auteurs.trices, demander si un test «mesure vraiment ce qu’il prétend ou devrait mesurer» est trop général et fait peu de sens
Vrai
La validité d’un test ou d’une mesure doit être évaluée relativement à trois aspects, quels sont-ils?
- Est-ce qu’il mesure bien le construit qu’il prétend mesurer ?
- Est-ce qu’il mesure bien ce construit pour la population ciblée (e.g., groupe d’âge, niveau académique, groupe clinique particulier, etc.) ?
- Est-ce qu’il mesure bien ce construit pour une application particulière (e.g., classifier dans des groupes diagnostiques, donner une valeur quantitative sur continuum, etc.) ?
Les organisations professionnelles soulignent trois points clés à propos de la validité des tests, quels sont-ils?
- La validité concerne l’interprétation des scores procurés par un test pour un construit spécifique; ce n’est pas une caractéristique du test
- La validité est une question de degré ; ce n’est pas une question absolue, de «tout ou rien»
- La validité d’un test repose sur de solides bases théoriques et empiriques
Quelles sont les 3 sources de validité?
- Contenu
- Construit (factorielle, convergente, discriminante)
- Critère (concomitante, prédictive, incrémentielle)
Vrai ou faux
La vraisemblance est une source de validité
Faux
Les auteurs font parfois l’erreur. La vraisemblance est parfois confondue avec la validité de contenu.
Qu’est-ce que la vraisemblance?
- Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de (a) les personnes qui sont évaluées avec le test (i.e., clients.es, profanes, non-experts.es qui sont évalués) et/ou (b) les personnes qui utilisent le test (i.e., intervenants.es, mais peut aussi être des représentants légaux reliés à la population ciblée, etc., par ex. parents, enseignants, etc.)
- Une mesure détient une bonne vraisemblance lorsque les personnes évaluées ou celles qui l’utilisent jugent qu’elle «semble pertinente et adéquate» pour mesurer le construit
- Si l’instrument ne paraît pas valide ou vraisemblable pour les personnes évaluées/utilisatrices dans les situations concrètes d’évaluation, cela peut devenir une menace à la validité
Quels sont les facteurs qui peuvent influencer la vraisemblance?
- Contexte d’évaluation (e.g., endroit physique de l’administration, les consignes, attitude et apparence physique de l’évaluateur.trice, etc.)
- Capacités cognitives des répondants.es
- Santé mentale et état psychologique des répondants.es
- Personnalité des répondants.es
- Motif de l’évaluation (désirabilité sociale [+ ou -])
- etc.
Qu’est-ce que la validité de contenu?
- La plus importante (pourtant négligée)
- Réfère au degré de représentativité des items (questions) utilisés pour mesurer un construit
- La plupart du temps établie de façon déductive
- Les auteurs.trices du test demandent à un groupe d’experts.es indépendants.es de se prononcer sur la pertinence des items
On demande est-ce que :
1. Chaque item individuellement correspond bien au construit ?
2. Tous les items d’une échelle considérés comme un groupe constituent un échantillon représentatif de tous les domaines (et sous-domaines) expliqués par le construit d’intérêt ?
Vrai ou faux
Il est difficile de faire un bon échantillonnage de contenu pour des construits psychologiques complexes – et ici, les méthodes statistiques ne sont d’aucune aide … ou presque
Vrai
Comment pouvons-nous vérifier la représentativité du validité de contenu?
- Tous les domaines (et sous-domaines) du construit sont-ils représentés ?
e.g., Échelle d’agressivité: agressivité directe, indirecte, réactive, proactive, physique, relationnelle, etc. - Éviter la sur- ou sous-représentation d’items des différents sous-domaines du construit
Avant de construire une échelle, les auteurs.trices doivent toujours décrire en détails et de façon compréhensive les différents _______________ et ______________ du construit d’intérêt
Avant de construire une échelle, les auteurs.trices doivent toujours décrire en détails et de façon compréhensive les différents DOMAINES et SOUS-DOMAINES du construit d’intérêt
À partir de quoi les chercheurs.euses définissent un construit (et donc, son contenu) ?
- Cadre théorique
- Recherches empiriques (recension)- expérience/observation
- Connaissances et expériences professionnelles/pratiques
Nommer 2 types de validité de contenu
Nominale : fait par auteurs.trices du test
Consensuelle : fait par groupe de spécialistes indépendants
Comment pouvons-nous quantifier le degré de validité de contenu?
Donner aux experts.es un choix de réponse avec une gradation à propos de chaque item afin de systématiser le tout
ex., Extraversion : «Dans une situation sociale impliquant plusieurs personnes, j’ai de la difficulté à faire les premiers pas pour aller vers les autres»
Pas du tout pertinent / représentatif = 0
Un peu pertinent / représentatif = 1
Assez pertinent / représentatif = 2
Très pertinent / représentatif = 3
Puisque nous avons des données numériques, on peut donc calculer un ___________________________________. En calculant un indice pour chaque item et pour l’échelle totale.
indice de validité de contenu
Quelles sont les 2 grandes menaces à la validité de contenu?
- Inclusion de contenu conceptuellement non pertinent
e.g., des items d’hyperactivité sont intégrés dans une échelle d’inattention - Sous-représentation conceptuelle de certains domaines du construit
Qu’est-ce que la validité de construit?
Réfère au degré de (a) reproductibilité de la structure interne théorique sous-jacente à l’instrument ainsi que les (b) relations du construit d’intérêt avec d’autres construits externes
Vrai ou faux
La validité se situe sur un continuum (on ne peut pas dire que qqchose est complètement valide ou non)
Vrai, on parle de degré de validité
Quelles sont les deux grandes façons de vérifier la validité de construit?
- Validité factorielle
- Validité convergente / discriminante