Cours 8 - post intra Flashcards
Définition des objectifs du test
L’élaboration d’un test commence par une déclaration d’intention (aussi appelée « usage anticipé »).
Déclaration consiste en :
- Une description détaillée du construit que mesure le test
- Le public cible du test
Une fois le précédent défini, il faut…
vérifier s’il existe déjà un test approprié
Il vaut la peine de prendre le temps de bien vérifier : l’élaboration d’un nouveau test est un travail long, difficile, coûteux…
Avant de rédiger les items d’un test, il est nécéssaire de prendre en compte une série de questions préliminaires :
Le monde d’administration (individuelle VS. en groupe)
La longueur (nombre d’items, durée, précision)
Les formats d’items (choix de réponses, vrai-faux, échelle de Likert, à développement)
Le nombre de scores (score total, scores des dimensions)
La formation des utilisateurs (administration, correction, interprétation)
La réponse à ces questions peut entraîner une reformulation de l’énoncé d’intention du test…
3 raisons principales qui motivent l’élaboration de nouveaux tests :
- La nécéssité de combler un besoin concret / un besoin pratique
(p.ex. le test d’intelligence de Binet → échelle de Stanford-Binet → échelle de Wechsler) 2. Apporter des données probantes / soutenir une théorie - Apporter des données probantes/ soutenir une théorie
(p.ex. le Test des aptitudes mentales primaires a été développé pour soutenir la théorie de l’intelligence de Thurstone) - Réviser ou adapter des tests existants
(p.ex. mettre à jour un test, adapter un test à une population particulière, adapter un test dans une autre langue)
La préparation des items comprend…
- leur formulation
- leur révision
Anatomie d’un item
Stimulus : toute question, phrase, image, etc. qui demande une réponse
Format de réponse : choix multiple, à développement
Conditions de réponse : limite de temps, en papier/en ligne, etc.
Items à choix de réponse
choisir parmi 2 ou plus des options de réponse.
o En test de rendement et d’aptitudes : réponses correctes ou incorrectes.
o En test de personnalité, d’intérêt et d’attitudes : réponses qui vont dans une certaine direction (p.ex. plus anxieux, mieux adapté, etc.)
Items à développement
la personne n’est pas contrainte de choisir une réponse, elle doit formuler sa propre réponse.
Bien que la réponse soit « libre », elle est soumise à certaines règles (p.ex. limite de temps, réponse orale/par écrit, etc.).
La cotation des items à développement s’accompagne de défis particuliers :
Garantir la fidélité inter-juges.
Conceptualise un système de cotation.
Avantages des items à choix de réponses
- Fidélité de la cotation
- Optimisation temporelle
- Optimisation de la cotation
Avantages des items à développement
o Facilitent l’observation du comportement
o Exploration de certaines zones inhabituelles
Analyse items
Analyses statistiques des données obtenues lors de la mise à l’essai des items (prétest)
Trois phases de l’analyse d’items
La mise en essai (prétest)
L’analyse statistique
La sélection d’items
La mise en essai (prétest)
o Mise en essai informelle (essai auprès de quelques participants)
o Mise en essai formelle (administration à un échantillon de
participants)
Il est important de réaliser un prétest afin de :
Obtenir des données préliminaires
Pouvoir identifier des détails importants qui ont pu passer inaperçus lors de la rédaction des items.
Analyse statistique en test de rendement ou d’aptitudes
Difficulté de l’item
Pouvoir discriminant de l’item
Analyse statistique en test de personnalité, d’attitudes, cliniques
Analyse de la cohérence interne
Analyses factorielles
Difficulté de l’item
pourcentage de participants qui ont répondu correctement à l’item. C’est un indice de la « facilité » des items.
o Elle est représentée habituellement comme la « valeur p » (p pour « pourcentage » ou « proportion »)
o P.ex. un item avec une valeur p de 0,85 → 85% de participants y ont répondu correctement.
ATTENTION : ne pas confondre avec la « valeur p » (p-value) utilisée dans les analyses statistiques pour voir si les résultats sont significatifs (p < ,05).
Pouvoir discriminant de l’item
capacité de l’item à distinguer divers groupes de participants (individus qui présentent le trait vs. individus qui le présentent moins).
Méthode externe
il y a 2 groupes contrastés par rapport au trait mesuré, selon un critère externe
Méthode interne
les groupes sont contrastés selon un critère interne : le score au test
Le degré de discrimination peut être représenté par la valeur …
la « valeur D » (D pour « différence ») → différence, en pourcentage, des personnes qui répondent correctement à l’item dans chacun des groupes.
P.ex. 80% de réponses correctes dans le groupe 1 et 50% de réponses correctes dans le groupe 2 → 80% - 50% = 30% = valeur D de 0,30.
Quel autre indice peut aussi être utilisé pour représenté le degré de discrimination ?
Le coefficient de corrélation bisérial (r) est aussi utilisé: corrélation entre la performance à un item et la performance au score total du test.