cours 5 : Validité Flashcards
Quelles est la propriété psychométrique la plus importante et la plus négligée?
la validité
Qu’est-ce que la validité des scores/ instruments ?
- Lorsqu’on évalue la validité d’un instrument de mesure, on veut généralement savoir s’il mesure vraiment ce qu’il prétend ou devrait mesurer (et non en partir un autre concept rattaché)
- On veut savoir si l’échantillon d’items (i.e., les questions) de l’échelle représente bien le construit qu’on veut mesurer (ex. est-ce que les 10 questions choisies représentent bien la sensibilité maternelle)
Le degré de validité détermine quoi ?
détermine l’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle (plus le degré de validité est élevé plus on peut faire des inférences solides, ex. se prononcer sur la condition d’une personne)
Est-ce que le nom d’un test ou d’une échelle continue un indice adéquat du construit mesuré?
Non, pas toujours
Quelle question doit-on poser au lieu de « « est-ce que ce test est valide ou pas » ?
« est-ce que ce test est une mesure valide de ce construit, pour cette population et pour cette application (utilisation) particulière »
Quels trois éléments doit-on évaluer pour déterminer la validité d’un test ou d’une mesure ?
- Est-ce qu’il mesure bien le construit qu’il prétend mesurer ?
2. Est-ce qu’il mesure bien ce construit pour la population ciblée (e.g., groupe d’âge, niveau académique, groupe clinique particulier, etc.) ? (un instrument peut être valide pour une population mais pas nécessairement pour une autre) 3. Est-ce qu’il mesure bien ce construit pour une application particulière (e.g., classifier dans des groupes diagnostiques, donner une valeur quantitative sur continuum, etc.) ? (les instruments peuvent être utilisés pour différentes raisons : ex. dépister pour classer en 2 groupes VS identifier les individus le long d'un continuum --> on ne va pas nécessairement utiliser le même instrument pour faire les deux car pour l'un il peut être valide mais pas pour l'autre utilisation)
Quels sont les 3 points clés à propos de la validité des teste que soulignent les organisations professionnelles ?
- La validité concerne l’interprétation des scores procurés par un test pour un construit spécifique; ce n’est pas une caractéristique du test (ne s’applique pas un test en soi car l’instrument peut généré des scores avec une bonne validé pour une utilisation particulière, mais pas pour une autre)
2. La validité est une question de degré ; ce n’est pas une question absolue, de « tout ou rien » (en fonction de l'application et la population) 3. La validité d’un test repose sur de solides bases théoriques et empiriques (les deux contribuent à la validité des scores générés)
Quelles sont les différentes sources de la validité ?
- contenu
- construit (factorielle, convergente, discriminante)
- critère (concomitante, prédictive, incrémentielle)
Est-ce que la vraisemblance fait partie des sources de validité ?
Non
Qu’est-ce que la vraisemblance ?
Aussi appelée validité d’apparence (« face validity »)
Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de (a) les personnes qui sont évaluées avec le test (i.e., clients.es, profanes, non-experts.es qui sont évalués.es) et/ou (b) les personnes qui utilisent le test (i.e., intervenants.es, mais peut aussi être des représentants légaux reliés à la population ciblée, etc., par ex. parents, enseignants, etc.)
Une mesure détient une bonne vraisemblance lorsque quoi ?
lorsque les personnes évaluées ou celles qui l’utilisent jugent qu’elle « semble pertinente et adéquate » pour mesurer le construit
Si l’instrument ne paraît pas valide ou vraisemblable pour les personnes évaluées/utilisatrices dans les situations concrètes d’évaluation, est-ce que cela peut devenir une menace à la validité ?
Oui, en l’influençant.
ex. les personnes ne prennent pt pas le questionnaire au sérieux s’ils ne le jugent pas pertinent
* e.g., mesurer le niveau d’agressivité d’un enfant en lui faisant faire un dessin ? * e.g., l’item « je sens parfois mon âme sortir de mon corps » serait-il perçu comme peu valide dans plusieurs contextes (e.g., sélection du personnel) ?
Quels facteurs peuvent influencer la vraisemblance ?
- Format de présentation de l’instrument (en ligne = plus sérieux VS papier)
- Contexte d’évaluation (e.g., endroit physique de l’administration, les consignes, attitude et apparence physique de l’évaluateur.trice, etc.)
- Capacités cognitives des répondants.es
- Santé mentale et état psychologique des répondants.es
- Personnalité des répondants.es
- Motif de l’évaluation (désirabilité sociale [+ ou -])
etc.
Qu’est-ce que la validité de contenu ?
Réfère au degré de représentativité des items (questions) utilisés pour mesurer un construit (à quel point les items (questions/symptômes/etc.) sont représentatives du concept que l’on souhaite mesurer)
- La plupart du temps établie de façon déductive
Les auteurs.trices du test demandent à un groupe d’experts.es indépendants.es de se prononcer sur la pertinence des items (avec qui je ne travaille pas, pour qu’ils se sentent libre de donner leur vrai opinion, sans être biaisés) - On demande est-ce que :
1. Chaque item individuellement correspond bien au construit ?
2. Tous les items d’une échelle considérés comme un groupe constituent un échantillon représentatif de tous les domaines (et sous-domaines) du construit d’intérêt ?
Q’est-ce qui est central dans la validité de contenu ?
- La représentativité
- Tous les domaines (et sous-domaines) du construit sont-ils représentés ? (sinon la validité de contenu diminue)
§ e.g., Échelle d’impulsivité: impulsivité cognitive, impulsivité émotionnelle, impulsivité comportementale, etc. - Éviter la sur- ou sous-représentation d’items des différents sous-domaines du construit (ex. 15 pour un sous-domaine et 5 pour un autre, à moins qu’un sous-domaine soit plus important que les autres pour représenter un construit)
- Tous les domaines (et sous-domaines) du construit sont-ils représentés ? (sinon la validité de contenu diminue)
Avant de construire une échelle, les auteurs.trices doivent toujours faire quoi ?
décrire en détails et de façon compréhensive les différents domaines et sous-domaines du construit d’intérêt
* Quels sont les domaines inclus selon la théorie/recherches? - Quelle est l’importance relative de chacun? * Y a-t-il des sous-domaines selon la théorie/recherches? - Quelle est leur importance relative? * Avec quels items (et de quel format) peut-on bien représenter ces domaines et/ou sous-domaines? (avec combien d'items? Quels sont les plus importants?)
À partir de quoi les chercheurs.euses définissent un construit (et donc, son contenu) ?
1) Cadre théorique (un concept théorique, une théorie, un amalgame de théories…Ex. Bandura dit que l’auto efficacité c’est …)
2) Recherches empiriques (recension)
3) Connaissances et expériences professionnelles/pratiques
Quels sont les deux types de validité de contenu?
- Nominale : selon les auteurs.trices du test
- Consensuelle : selon un groupe de spécialistes indépendants (mieux encore que la nominale)
De quelle manière peut-on estimer le degré de validité de contenu empiriquement ?
- Avec une échelle de mesure quantitative, on demande à des experts.es indépendants.es d’estimerA. à quel point (degré) chacun des items d’un test est pertinent et représentatif du construit d’intérêt
B. à quel point (degré) l’ensemble des items constitue un bon échantillon représentatif du contenu du construit
Afin de quantifier le degré de validité de contenu qu’est-ce qu’on fait ?
on donne aux experts.es un choix de réponse avec une gradation à propos de chaque item afin de systématiser le tout
Pas du tout pertinent / représentatif = 0
Un peu pertinent / représentatif = 1
Assez pertinent / représentatif = 2
Très pertinent / représentatif = 3
- Puisque nous avons des données numériques, on peut donc calculer un Indice de validité de contenu (IVC; Polit & Beck, 2006)
- On calcule un indice pour chaque item (IVC-I) et pour l’échelle totale (IVC-É)
- IVC-I = Nombre d’experts.es qui ont jugé l’item représentatif (choix 2 ou 3), divisé par le nombre total d’experts.es
- IVC-É = Proportion d’items jugés représentatifs (choix 2 ou 3) – ou dit autrement, la moyenne des IVC-I – divisée par le nombre total d’experts.es