Cours 6 : Construction et analyse d'items d'un test Flashcards
Quand est-ce que se fait l’analyse des items d’un test ?
Après la mise à l’essai des tests
4e étape de la construction d’un test, soit celle de l’évaluation des items
2 types d’analyse des items d’un test qui font partie de la validité de contenu
Une analyse qualitative
Des analyses quantitatives
2 grands objectifs parallèles de l’analyse du test
Augmenter la fidélité du test;
Augmenter la validité du test
À quoi aident les méthodes d’analyse, qualitative et quantitative ?
Sélectionner les meilleurs items;
Substituer les items qui donnent peu ou pas d’information;
Réviser les items qui posent problème
Raisons de contrôler la difficulté des items
-Items de difficulté croissante dans un test : Confiance du sujet examiné ; Moins de perte de temps
-Choix du niveau adéquat de difficulté pour augmenter la
sensibilité du test : Aucune information apportée par les items trop faciles ou trop difficiles dans les tests autres que les tests de maîtrise
Deux façons de définir et de mesurer la difficulté d’un
item
1-Façon empirique traditionnelle, selon la théorie
classique des tests (TCT) à partir des scores bruts : Pourcentage de personnes qui réussissent l’item ;
2-Façon théorique, selon la théorie de la réponse à l’item (TRI) à partir de la courbe caractéristique de l’item (CCI). Le modèle le plus utilisé en TRI est celui de Rasch.
TRI
modèle à 1 paramètre : difficulté de l’item (+ important, le modèle de Rasch)
modèle à deux paramètres : difficulté de l’item et pouvoir discriminant
modèle à trois paramètres : difficulté de l’item, pouvoir discriminant et pseudo-chance
CCI
Représente le rapport entre d’une part ou habileté que veut mesurer l’échelle (Thêta) et d’autre part la performance à l’item
Le score Thêta
Situé sur l’axe des X et peut varier de -4 (item facile) à +4 (item difficile) en passant par 0 (item de
difficulté moyenne). On ajoute habituellement +5 au Thêta pour n’avoir que des scores positifs variant de 1 à 9.
La performance à un certain item (probabilité de bonne réponse) est située sur l’axe des Y.
On compare la difficulté des différents items (thêta) requis pour atteindre 50% de probabilité de bonne réponse.
Quand est-ce qu’on obtient un maximum d’info dans une grille dichotomique (TCT) ?
lorsque le pourcentage de réussite est de 50%
Quels groupes peut on différencier si tous les items ont un même pourcentage de réussite ?
Ceux qui ont un score nul (i.e. échec à tous les 59 items) et ceux qui ont un score parfait (i.e. succès à tous les
items)
Comment faire pour contrer le fait d’avoir un même pourcentage de réussite pour tout le monde ?
Maximiser
simultanément l’homogénéité du test et les différences
individuelles sur les scores totaux, pour ce faire, on fait varier les pourcentages de réussite des items autour de la valeur optimale de 50%
Quels sont les meilleurs items, sur des différenciations entre les sujets ?
Seront ceux pour lesquels toute l’échelle est utilisée ou en termes plus techniques, ce seront ceux dont la
60 distribution des scores (intra-items) possède une variance élevée
Sur quoi dépend le choix de distribution des scores à un test (meilleurs items) ?
De ce que l’on sait de la distribution du construit;
Des objectifs du test
Effet plancher
Lorsqu’un test a pour objectif de déterminer les
meilleurs candidats (par exemple pour une bourse d’excellence), il est inutile d’obtenir des différences entre
les plus faibles. Dans ce cas, le test peut être formé uniquement d’items difficiles