Cours #5: la validité Flashcards
Qu’est-ce qu’on veut savoir lorsqu’on évalue la validité d’un instrument?
-S’il mesure vraiment ce qu’il prétend ou devrait mesurer.
-On veut savoir si l’échantillon d’items (i.e., les questions)de l’échelle représente bien le construit qu’on veut mesurer
Que détermine le degré de validité?
L’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle.
Est-ce la fidélité ou la validité qui est souvent négligée?
La validité.
En termes de validité, quelle est la question que nous devons poser?
Est-ce que ce test est une mesure valide de ce construit, pour cette population et pour cette application particulière?
La validité d’un test ou d’une mesure doit donc être évaluée relativement à trois aspects, quels sont-il?
1) Est-ce qu’il mesure bien le construit qu’il prétend mesurer ?
2) Est-ce qu’il mesure bien ce construit pour la population ciblée (e.g., groupe d’âge, niveau académique, groupe clinique particulier, etc.) ?
3) Est-ce qu’il mesure bien ce construit pour une application particulière (e.g., classifier dans des groupes diagnostiques, donner une valeur quantitative sur continuum, etc.) ?
Lorsqu’un instrument est valide, est-ce que cela veut dire qu’il est valide pour plusieurs contextes?
Non.
Quels sont les trois points clés que soulèvent les organisations professionnelles quant à la validité des tests?
1) La validité concerne l’interprétation des scores procurés par un test (instrument) pour un construit spécifique; ce n’est pas une caractéristique du test permet de faire de bonnes inférences.
2) La validité est une question de degré ; ce n’est pas une question absolue, de «tout ou rien» on ne peut pas dire: test valide ou non… on compte en degrés selon l’application.
3) La validité d’un test repose sur de solides bases 1) théoriques et 2) empiriques
Quels sont les 3 sources de validité (sous-sources)?
1) Contenu
2) Construit: factorielle, convergente, discriminante.
3) Critère: Concomitante, prédictive et incrémentielle.
Est-ce que la vraisemblance est une source de validité?
Non!
Quelle est le synonyme de vraisemblance?
validité d’apparence
Qu’est-ce que la vraisemblance?
Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de (a) les personnes qui sont évaluées avec le test (i.e., clients.es, profanes, non-experts.es qui sont évalués.es) et/ou (b) les personnes qui utilisent le test (i.e., intervenants.es, mais peut aussi être des représentants légaux reliés à la population ciblée, etc., par ex. parents, enseignants, etc.).
Comment peut-on s’assurer que la mesure détient une bonne vraisemblance?
Les personnes évaluées ou celles qui l’utilisent jugent qu’elle «semble pertinente et adéquate» pour mesurer le construit.
La vraisemblance est parfois confondu avec quoi?
la validité de contenu. Mia ce n’est pas la même chose. La vraisemblance n’est pas une validité.
Quels sont les facteurs qui influencent la vraisemblance?
1) Format de présentation de l’instrument.
2) Contexte d’évaluation.
3) Capacités cognitives des répondants.es.
4) Santé mentale et état psychologique des répondants.es.
5) Personnalité des répondants.es.
6) Motif de l’évaluation.
À quoi se réfère la validité de contenu?
Réfère au degré de représentativité des items (questions) utilisés pour mesurer un construit
La plupart du temps établie de façon déductive.
Quelles sont les deux questions à poser concernant la validité de contenu?
Chaque item individuellement correspond bien au construit ?
Tous les items d’une échelle considérés comme un groupe constituent un échantillon représentatif de tous les domaines (et sous-domaines) du construit d’intérêt ?
Qui peut valider le contenu?
Des personnes indépendantes.
Qu’est-ce qui est centrale à la validité de contenu
La représentativité.
Que veut-on dire par représentativité?
Tous les domaines (et sous-domaines) du construit sont-ils représentés ? Si non, degré de validité de contenu diminue…
Que doivent faire les auteurs avant de faire une échelle?
Décrire tous les domaines et sous-domaines du construit d’intérêt.
À partir de quoi les chercheurs définissent un construit?
1) Cadre théorique (une théorie ou plusieurs)
2) Recherches empiriques (recension)
3) Connaissances et expériences professionnelles/pratiques
Quels sont les Deux types de validité de contenu ?
1) Nominale : auteurs.trices du test
2) Consensuelle : groupe de spécialistes indépendants
Quelle est la façon d’estimer le degré de validité de contenu empiriquement ?
échelle de mesure quantitative
L’échelle de mesure quantitative estime quoi?
1) à quel point (degré) chacun des items d’un test est pertinent et représentatif du construit d’intérêt.
2) à quel point (degré) l’ensemble des items constitue un bon échantillon représentatif du contenu du construit.
Comment on fait pour quantifier le degré de validité de contenu?
un choix de réponse avec une gradation.
Quelles sont les deux grandes menaces de la validité de contenu?
1) Inclusion de contenu conceptuellement non pertinent (autres concepts).
2) Sous-représentation conceptuelle de certains domaines du construit.
À quoi se réfère la validité de construit?
au degré de
(a) reproductibilité de la structure interne théorique sous-jacente à l’instrument ainsi que les
(b) relations du construit d’intérêt avec d’autres construits externes.
Quelles sont les deux grandes façons de vérifier la validité de construit?
1) Validité factorielle
2) Validité convergente / discriminante
Qu’est-ce que le réseau nomologique?
C’est la théorie expliquant le construit par le biais de ses interrelations avec d’autres construits (structure interne et théorique) .
Que signifie nomologie?
Étude des lois
Qu’est-ce que peut inclure le réseau nomologique?
relations concurrentes, facteurs étiologiques, précurseurs, facteurs de risque, conséquences développementales.
Qu’est-ce qui est rarement dans le manuel du test?
Le réseau nomologique.
Que vise la validité factorielle?
On veut vérifier si la structure factorielle théorique qui représente le construit est reproduite sur le plan empirique.
Que signifie facteur?
Une réduction parcimonieuse de plusieurs variables (items ou questions) expliquées par une variable latente.