La fiabilité des mesures Flashcards
Quand peut-on dire si une mesure est fiable?
Si elle ne **comporte pas d’erreurs trop importantes. **
Quels sont les deux types d’erreur de mesure?
Erreur systématique : se manifeste toujours dans le même sens et avec la même intensité. Il faut s’assurer que le test ne mesure pas
autre chose que ce qu’il est censé mesurer.
Erreur aléatoire : ** forces et sens différents** d’une passation à une autre.
La théorie classique de la fidélité.
Spearman, début XXème: toute mesure est décomposable en une “mesure vraie” et une “erreur” (indépendantes) = théorie du score vrai.
Comment estime-t-on la mesure vraie?
Non observable. On la calcule grâce à la moyenne des mesures observées.
Qu’est-ce que le coefficient de fidélité? A quoi sert-il?
**Variance vraie / variance observée = pourcentage de la variance attribuable à mesure vraie. **En pratique, coefficient de fidélité = corrélation entre une série de mesures et sa répétition.
Ne s’intéresse qu’aux erreurs
aléatoires –>déterminer si les différences individuelles de score au test peuvent être attribuées aux caractéristiques
des sujets ou à des erreurs: passations, choix des items, observateurs différents, conditions différentes.
Un coefficient de corrélation entre la mesure à un test et la mesure au retest est effectué. Coefficient proche de 1 : erreur peu importante. Si proche de 0–> construction d’un autre test.
Quelles sont les trois sources d’erreurs possibles de la répétition de la mesure et les erreurs associées?
Répéter la mesure à des moments différents –> événements manifestés différemment d’un passage à l’autre.
Répéter la mesure en faisant varier le contenu de la situation qui conceptuellement demeure identique –>décisions prises lors de l’opérationnalisation des idées sur lesquelles est fondé le test (échantillonnage des items)
Demander à deux personnes d’évaluer une même conduite –> subjectivité de l’observateur (neutralisé par la standardisation de la procédure d’application et de neutralisation
Qu’est-ce que le coefficient de constance ou de stabilité?
**Corrélation test-retest avec le même groupe de sujets **
- Renseigne sur les erreurs aléatoires si l’intervalle test-retest est court ~ coefficient de fidélité
- Sinon, effet d’apprentissage –> hausse des performances, ou démotivation–> baisse des performances.
Comment vérifier que le test mesure bien la même dimension dans ses différentes parties ou items, ou si le choix des items modifie le résultat (3 méthodes, trois coefficients)?
Méthodes de vérification :
- Méthode des formes parallèles : deux versions d’un même test -> calcul de la corrélation entre les deux = coefficient d’équivalence
- Méthode du partage par moitié (split-half): un même test, coupé en deux parties –> corrélation entre les deux = coefficient d’homogénéité
- Coefficient α de Cronbach (méthode la plus utilisée) : postulat: tous les items ont la même variance, homogénéité maximale quand α=1
Qu’est-ce que la théorie de la généralisabilité?
Extension de la théorie du score vrai. Permet d’évaluer le poids respectif de chaque source d’erreur.
Pour chacun des univers (erreur)–> définition d’un score d’univers, estimé en répétant la mesure –> moyenne.
–> coefficients de généralisabilité. Repose sur l’analyse de la variance.
Indique la précision des généralisations que l’on peut faire à partir d’une observation.
L’erreur type de mesure
Estimation de la zone d’incertitude (intervalle de confiance) autour de la note observée.
Erreur type ou erreur standard de mesure = écart type de la distribution des notes observées pour ce sujet
Si ce n’est pas possible de répéter la mesure: calcul de l’erreur-type à partir du coefficient de fidélité.
Distribution normale : la note note vraie a 99% de chances d’être à ±2,5σ, 68% d’être à ±1σ
Quels sont les trois facteurs qui affectent la fidélité? En quoi peuvent-ils l’affecter?
- Homogénéité du groupe: individus ~”semblables” –> risque d’erreurs toujours dans le même sens. Groupe hétérogène : plus de chance de compenser les erreurs, réduisant ainsi leurs effets.
- Longueur du test : plus le test est long (items nombreux), plus il y a de mesures, plus on tend à mesurer le score vrai : en additionnant les erreurs aléatoires on réduit leur poids.La formule de Spearman et Brown permetd’estimer le gain de fidélité quand on rallongele test.
- Différence entre deux scores
La fidélité du score de différence dépend
de la fidélité des scores de base et de leur
corrélation. Corrélation élevée –>fidélité élevée du score de différence.