Cours 6 - Construction et analyse des items d'un test Flashcards
Il existe deux types d’analyse des items d’un test qui font partie de la validité de contenu. Quels sont-ils?
- Analyse qualitative
- Analyse quantitative
L’analyse d’items poursuit deux grands objectifs parallèles. Quels sont-ils?
- Augmenter la fidélité du test
- Augmenter la validité du test
À quoi aident les méthodes d’analyse qualitative et quantitative?
- Sélectionner les meilleurs items
- Substituer les items qui donnent peu ou pas d’information
- Réviser les items qui posent problème
Quelles sont les raisons de contrôler la difficulté des items?
- Items de difficulté croissante dans un test : Confiance du sujet examiné ; Moins de perte de temps
- Choix du niveau adéquat de difficulté pour augmenter la sensibilité du test : Aucune information apportée par les items trop faciles ou trop difficiles dans les tests autres que les tests de maîtrise
Quels sont les deux façons de définir et de mesurer la difficulté d’un item?
- Façon empirique traditionnelle, selon la théorie classique des tests (TCT) à partir des scores bruts : Pourcentage de personnes qui réussissent l’item
- Façon théorique, selon la théorie de la réponse à l’item (TRI) à partir de la courbe caractéristique de l’item (CCI). Le modèle le plus utilisé en TRI est celui de Rasch.
Qu’est-ce que la CCI représente?
Courbe Caractéristique de l’Item (CCI)
La CCI représente le rapport entre d’une part, le trait ou habileté que veut mesurer l’échelle (Thêta) et d’autre part la performance à l’item.
Qu’est-ce que le score Thêta?
Le score Thêta est situé sur l’axe des X et peut varier de -4 (item facile) à +4 (item difficile) en passant par 0 (item de difficulté moyenne). On ajoute habituellement +5 au Thêta pour n’avoir que des scores positifs variant de 1 à 9. La performance à un certain item (probabilité de bonne réponse) est située sur l’axe des Y. On compare la difficulté des différents items (thêta) requis pour atteindre 50% de probabilité de bonne réponse.
Quand est-ce qu’on obtient un maximum d’info dans une grille dichotomique fr pourcentage de réussite (TCT)?
Lorsque le pourcentage de réussite (p) est de 50%.
Quels groupes peut on différencier si tous les items ont un même pourcentage de réussite?
Ceux qui ont un score nul (i.e. échec à tous les items) et ceux qui ont un score parfait (i.e. succès à tous les items).
Comment faire pour contrer le fait d’avoir un même pourcentage de réussite (TCT) pour tout le monde?
Maximiser simultanément l’homogénéité du test et les différences individuelles sur les scores totaux, pour ce faire, on fait varier les pourcentages de réussite des items autour de la valeur optimale de 50% (généralement, environ de 30% à 70%).
Le tableau suivant indique une variation de 20% à 80% de réussite (en excluant l’item 1 qui est trop facile) pour un test composé de 5 items.
Quels sont les meilleurs items pour les différenciations entre les sujets?
Ceux pour lesquels toute l’échelle est utilisée ou en termes plus techniques, ce seront ceux dont la distribution des scores (intra-items) possède une variance élevée.
Sur quoi dépend le choix de distribution des scores à un test?
De ce que l’ont sait de la distribution du construit, des objectifs du test.
Qu’est-ce que l’effet plancher?
Lorsqu’un test a pour objectif de déterminer les meilleurs candidats (par exemple pour une bourse d’excellence), il est inutile d’obtenir des différences entre les plus faibles. Dans ce cas, le test peut être formé uniquement d’items difficiles (effet plancher).
Qu’est-ce que l’effet plafond?
Lorsqu’un test a pour objectif de déterminer les candidats en difficulté, il est inutile d’obtenir des différences entre les candidats qui fonctionnent bien (effet plafond) (par exemple: test de dépistage des difficultés graves d’apprentissage).