chapitre 5.1 Flashcards
Qu’est-ce que la validité? (6)
1) La validité d’un test répond à la question suivante:
“Est-ce qu’un test mesure ce qu’il doit mesurer (dans un contexte particulier)?”
2) 2 précisions:
1. Ce qu’on peut en dire selon les contextes d’utilisation (se référer aux objectifs du test).
2. C’est une question de degré, pas « c’est tout ou rien ». Ex. À quel degré le Rorschach est-il valide pour détecter la gravité d’une dépression?
3) Un test n’est pas valide en soi; c’est ce qu’on peut en faire qui est valide ou non.
4) C’est souvent en se référant à l’objectif du test qu’on détermine la validité.
5) Un test ne peut jamais être valide à 100%. Un test est plus ou moins valide. La notion de validité fait référence aux convictions qu’on a de la réalité; On s’approche de la réalité mais on ne la touche jamais totalement.
6) Maxwell (1992) pense que la validité «n’est pas une caractéristique propre à une méthode particulière, mais concerne plutôt les données, les résultats et les conclusions issus de l’utilisation de cette méthode dans le cadre d’un contexte et d’un objectif précis»
Explique ce qu’est la validité de contenu?
Question de base: Le contenu du test correspond-il aux objectifs du test?
La validité de contenu concerne la relation existant entre le contenu d’un test et certains domaines bien définis de la connaissance du comportement.
Pour que le contenu du test soit valide, il doit bien correspondre au contenu du domaine étudié
Aussi, le contenu du test doit couvrir un échantillon représentatif de tous les éléments possibles du test. Plus il couvre l’ensemble des dimensions ou sous-dimensions théoriques, plus il risque d’être valide.
Le contenu d’un test s’inspire souvent d’un canevas, d’un énoncé de principe ou d’objectifs
*voir taxonomie de Bloom
Quelles sont les sous-représentations du construit et et de la variance non-reliée au construit? Quelle est celle qu’on veut atteindre? Comment arrive-t-on à déterminer ces résultats?
voir diapo 7 ch5
partie grise: ce qui est important
sc: sous-représentation du construit
en blanc: variance mesurée par notre test mais qui n’est pas mesurée par le construit.
La sous-représentation à atteindre et la B.
On peut arriver à déterminer ces résultats avec l’analyse factorielle
Quel est le classement traditionnel des types de validité ?
1) Validité de contenu = apparente
2) Validité critériée (est-ce que mon test est relié à qqc en même temps (concomitant) ou évalué plus tard (prédictif)?:
- Validité concomitante
- Validité prédictive
3) Validité de construit: englobe toutes les autres formes de validité; toutes les autres formes de validité contribuent à la validité de construit. Reflète la théorie sous-jacente au test. C’est l’objectif à atteindre.
**Nomenclature très fréquente, mais obsolète?
Quel est le nouveau classement des types de validité?
1) Validité de contenu
2) Relations avec les autres variables
- Validité de convergence ou divergente (ou discriminante)
- Relations entre les critères du test
3) Processus de réponse
4) Structure interne
5) Conséquences
Qu’est-ce que la validité apparente/d’apparence (face value)?
On se pose la question: “Est-ce que le test semble valide?”
S’oppose à une analyse empirique et systématique. C’est le jugement de la personne qui détermine si le test est valide ou non.
Des points de vue divergents sur ce type de validité:
Peut-être une opinion professionnelle ou non professionnelle sur la qualité d’un test
Aucune analyse statistique n’entre ne ligne ici.
Utile dans le cas où 2 tests ont la même validité empirique; on peut alors se référer à la validité apparente et choisir celui dont la validité apparente est la meilleure.
Qu’est-ce que la taxonomie de Bloom?
*voir manuel p.107-108
Utilisé pour construit la validité de contenu d’un test.
La taxonomie de Bloom énumère en rangées les contenus touchés. En colonne, on veut des items basés sur les faits, les concepts et les applications. Pour chaque colonne, on check le contenu (source d’erreur, test-retest, fidélité inter-juge, cohérence interne, erreur-type, etc)
Voir manuel p.107 et 108
Qu’est-ce que la validité didactique?
Pose la question: est-ce que la personne a eu l’occasion de faire l’apprentissage des contenues durant le cours? Est-ce que le contenu a été bien enseigné?
C’est une application de la validité de contenu.
S’applique surtout aux tests de rendement scolaires
Quelles sont les applications de la validité de contenu? (3)
1) test de rendement scolaire (ex: validité didactique; le contenu du test correspond aux occasions d’apprentissages saisies par l’étudiant.e)
2) test d’aptitude professionnelle (le contenu du test correspond aux pourcentages de compétences et connaissances nécessaires pour oeuvrer dans un emploi donné selon des experts)
3) autres domaines d’applications; ex: personnalité; Le contenu doit s’aligner sur ce qui est opportun selon des experts (recension des écrits ou le contenu d’autres tests)
Quels sont les problèmes reliés à la validité de contenu?
1) Il est difficile d’établir le domaine des items (voir le modèle de stress parental)
2) Il est difficile d’établir jusqu’à quel point un item mesure un contenu donné
* La validité de contenu ne se détermine pas par les analyses statistiques. Elle s’applique plutôt sur le jugement des experts.
Ex. « Je suis satisfait-e du dernier vêtement que j’ai acheté ». Dépression oui, mais jusqu’à quel point considérant. « Je n’ai plus autant de plaisir qu’avant ».
- Contrairement aux autres types de validité, aucune démonstration à faire avec les réponses effectives des sujets
- pas de statistiques sur les réponses des sujets
- à l’occasion, des statistiques, par ex., sur le jugement des experts
Qu’est-ce que la validité de critère?
Question de base: Existe-t-il un lien, tel qu’attendu, entre les résultats du test et des critères externes (ne pas confondre avec l’évaluation critériée)
- Approche traditionnelle: concomitante et prédictive
Trois approches les plus communes:
- Critère réaliste -externe
- Groupe de contraste
- Un autre test
Qu’est-ce que la validité prédictive et concomitante?
Les 2 appartiennent à la validité de critère
1) prédictive: le test vise à prédire la valeur que prendront certains critères à l’avenir.
2) Concomitante: concerne la concordance entre les résultats à un test et la valeur actuelle d’autres variables.
Explique l’approche du critère réaliste externe pour établir la validité de critère **voir manuel p.112
Le critère externe est le sujet sur lequel on souhaite vrm avoir de l’info. Il donne une définition réaliste du construit à l’étude.
On mesure le lien entre le test et le critère. Ici, la validité s’exprime habituellement sous la forme de coefficient de corrélation. (appelé ici “coefficient de validité”)
**voir exemple p.112 tableau 5.3 et 5.2
Explique la méthode des groupes contrastés pour établir la validité de critère
- Dans le cas où le test est destiné à faire des distinctions entre des groupes de répondants par ex. Clinique vs non clinique
- Dans le cas où une distinction entre deux groupes de répondants serait une indication de validité, par ex. Les enfants de 4 ans réussissent moins bien un test de FE que les enfants de 5 ans.
- Dans le cas où le critère n’est pas distribué sur un spectre. ex: dépression. Certains items sont répartis en catégories. Bcp de probs de santé mentale sont dichotomisés; on doit alors avoir recours à la méthode des groupes contrastés.
Explique la méthode d’utilisation d’un autre test pour établit la validité de critère
Corrélations avec d’autres tests
Exemples: Pourquoi ? Quand?
- Deux tests qui mesurent la même chose (convergence)
- Deux tests qui mesurent des choses différentes (divergence ou discriminante; corrélation:0) C’est facile de confirmer des choses qu’on sait déjà, de faire converger des infos qui vont ensembles. Mais on veut chercher à se contredire soi-même en se mettant à l’épreuve.
- Attention au piège des appellations; ne pas se fier seulement aux noms des test ou à ce qu’ils sont censés mesurer.
- une simple application de la corrélation