Cours 4 Flashcards
Qu’est-ce que la fidélité?
La fidélité concerne la PRÉCISION de notre mesure, c’est-à-dire le niveau d’erreur qu’elle génère.
(Un instrument devrait donner les memes résultats d’une administration à l’autre.)
Devrait-on dire qu’un test est fiable? **
NON. La qualité de fiabilité de s’applique pas au teste en tant que tel, mais s’applique plutot aux scores que le test génère. Ce n’est pas le score qui est fiable ou non, ce sont les scores qui sont fiables ou non.* Un test ne peut tjrs etre fiable (il sera fiable en fonction de certaines populations, certaines utilisation, etc.).
LA FIDELETÉ EST UNE CARACTÉRISTIQUE DES SCORES. *
Affirmer qu’un test est fiable sous-entend que la fidélité a été établie de façon permanente, pour toutes les utilisations, avec tous les utilisateurs (mais faux).
La fidélité est-elle un concept dichotomique?
Non, elle n’est pas dichotomique (fiable vs pas fiable). Tout est une question de degré (peut etre fiable à un certain niveau).
Qu’est-ce qui est crucial en évaluation psychoéducative concernant les variations des scores?
Sur le plan clinique, avant de prendre des décisions importantes, on veut savoir à quel point les variations des scores (entre différents individus ou moments de mesure), résultent de différences RÉELLES dans le construit qui nous intéresse, ou plutot d’imprécisions (d’erreurs) de l’instrument de mesure qu’on utilise.
- DONC, on veut savoir à quel point le score vrai est estimé avec justesse.
Qu’est-ce que la théorie du score vrai?
score observé = score vrai + erreur de mesure
Qu’on le veuille ou non, il y a tjrs de l’erreur de mesure, dans TOUS les instruments.
Les chercheurs tentent de de construire des instruments qui vont limiter l’erreur, le plus possible.
Les praticiens doivent bien connaitre la fidélité des instruments qu’ils utilisent, pour faire une interprétation rigoureuse et prudente des scores. Ce qu’on veut savoir, c’est à quel point il y a des erreurs.
Est-ce qu’une seule mesure moins fiable peut avoir de grandes répercussions?
Oui, avec une seule mesure moins fiable, l’erreur de mesure peut devenir bcp plus grand, ce qui diminue fortement la corrélation. Il faut donc etre prudent puisque les erreurs peuvent affecter la corrélation estimé entre deux variables.
Quels sont les deux grands types d’erreurs (leur définition, cause et comment les minimiser ou évaluer)
- Aléatoires
Définition: Fluctuations statistiques non reproductibles (elles surviennent dans n’importe quelle direction et à n,importe quel moment); TJRS présentes pour tous les instruments.
Autant au-dessus qu’en dessous de la moyenne.
Distribuées normalement (pcq ces erreurs se rapprochent souvent de la moyenne)
Cause: Variation dans l’échantillonnage
Comment les minimiser ou évaluer: Plus grands échantillons, plus de moments de mesure, peuvent etre plus facilement estimées ou controlées statistiquement. - Systématiques (ou biais)
Définition: Fluctuations constantes et reproductibles, qui sont toujours dans la meme direction (ex. si un groupe est favorisé, sera tjrs le meme) et qui ne sont pas présents dans tous les instruments.
Surestimation ou sousestimation constante des paramètres (ex la moyenne) pour un sous-groupe donné.
Pas distribués normalement (pcqu’il y a tjrs un groupe au dessous ou en dessous de la moyenne).
Cause: Mauvaise utilisation de l’instrument. Conditions d’administration inadéquates. Imperfections de l’instrument.
Comment les minimiser ou évaluer: Difficiles à détecter, souvent ne sont pas connues. Plus difficile à quantifier statistiquement.
Quels sont les 4 types de fidélité en fonction des sources d’erreur de mesure possibles?
- Erreur d’échantillonnage de contenu
- Erreur d’échantillonnage dans le temps
- Incohérence interne, ou inter-items
- Incohérence inter-informateurs
Quel est le type d’instruments sujets à la source d’erreur et l’indice de fidélité pour estimer l’erreur d’échantillonnage de contenu?
Type d’instruments: Instruments pour lesquels des résultats cohérents au sens large sont souhaités
Indice de fidélité utilisé pour estimer l’erreur: coefficient de fidélité des formes parallèles (ou coefficient de congruence)
Quel est le type d’instruments et l’indice de fidélité pour estimer l’erreur d,échantillonnage dans le temps?
Type d’instruments: Instruments de mesure de traits ou comportements relativement stables dans le temps.
Indice de fidélité: Coefficient de fidélité test-retest (ou de stabilité temporelle)
Quel est le type d’instruments et l’indice de fidélité pour estimer l’incohérence interne (ou inter-items)?
Type d’instruments: Instruments qui requiert une grande cohérence interne ou inter-items (grande cohérence entre les items d’une meme échelle = pas bon).
Indice de fidélité: Coefficient de fidélité moitié-moitié ou coefficient de cohérence interne
Quel est le type d’instruments et l’indice de fidélité pour estimer l’incohérence inter-informateurs?
Type d’instruments: Instruments qui impliquent un degré relativement élevé de subjectivité (lorsque comportements mesurés sont subjectifs, va y avoir des incohérences entres les informateurs).
Indice de fidélité: Coefficient de fidélité inter-juges (ou accord inter-juges).
Peut-on évaluer le degré de fidélité d’un instrument de mesure avec l’évaluation d’une seule personne?
Non. Il faut collecter les données d’un échantillon d’individus qui sont évalués avec l’instrument.
De quelle manière est représentée la fidélité selon la théorie du score vrai, avec des données (variance)?
rx = VARvraie divisé par VARerreur
Que nous dit la variance sur la fidélité?
La variance est la variabilité entre les gens (les différences de scores obtenus).
Plus la part de variance VRAIE sera grande, plus le coefficient de fidélité s’approchera de 1.0, alors que plus la part de variance ERREUR sera grande, plus le coefficient ‘approchera de 0.
Qu’est-ce que l’indice de fidélité des formes parallèles?
On développe deux formes équivalentes du meme instrument et on estime la corrélation des scores entre les deux formes pour les memes individus.
On parle ici d’instruments tout à fait similaires conceptuellement, mais avec des ITEMS légèrement différents. (Donc, pas exactement les memes questions, mais mesurent de façon fiable et valide les memes construits. Les instruments se présentent sous différentes formes, mais offrent essentiellement le meme résultat.)
- DOIT OFFRIR LE MEME RÉSULTAT, SINON SERT À RIEN (doit y avoir une forte corrélation entre les résultats des deux versions pour que soit valide)
La question d’ÉCHANTILLONNAGE DE CONTENU est cruciale pour pourvoir interpréter avec confiance cette forme de fidélité.
Quel type de sélection d’items faut-il privilégier dans les formes parallèles? Pourquoi
Il faut faire une sélection quasi- aléatoire des items (on ne peut choisir des items au hasard dans une grande banque d’items).
- Ceci est important puisque tous les domaines ou sous-domaines spécifiques du construit doivent etre représentés proportionnellement.
Quel est l’objectif des formes parallèles?
Comme les deux formes parallèles sont supposées mesurer le construit de la meme façon, l’objectif est de voir LE DEGRÉ D’ERREUR DANS LE CONTENU.
Qu’est-ce qui suggère peu d’erreurs de mesure dans les formes parallèles?
Après la collecte de données, si la corrélation est élevée, suggère une bonne précision (peu d’erreurs de mesure)
Y a t-il un coefficient minimum concernant la corrélation attendue dans les formes parallèles? Si oui, combien?
Il n’y a pas vraiment de coefficient minimum attendu, puisque la corrélation dépendra du contenu (complexité du construit), en plus de facteurs personnels des individus évalués (ex. rxns différentes aux deux formes).
Mais, on s’attend quand meme à 0.70 au minimum pour que la corrélation soit considérée bonne.
Qu’est-ce que l’indice de fidélité test-retest?
Certains instruments prétendent mesurer des construits relativement stables dans le temps (ex. traits de personnalité).
Ici, on tente donc d’évaluer les memes individus, avec le meme instrument à deux reprises dans le temps , afin de déterminer s’ils obtiennent les memes résultats (scores).