Chapitre 4 Flashcards
Qu’est-ce que la fiabilité?
La fiabilité = est-ce que l’on obtient toujours les mêmes scores dans des contextes divers ?
La fiabilité c’est obtenir les mêmes résultats en passant un même test, une version parallèle, ou des moitiés d’un test aux mêmes sujets.
Permet d’estimer si les conditions de passation sont de bonnes qualités.
La fiabilité est une condition nécessaire, mais insuffisante pour déterminer la qualité d’un test
Que peut-on faire pour augmenter la fiabilité d’un test?
Réduire l’erreur de mesure conduit à augmenter la fiabilité d’un test (ex: condition de passation du test (si la salle est bruyante. peuvent être contrôlées plus ou moins )
On peut réduire toutes les erreurs de mesure sauf celles qui concernent le sujet(ex: si il est malade)
Comme aucun test ne sera parfaitement fiable, on accepte une certaine marge d’erreur de mesure (cette marge est fluctuante. Elle est obtenue par consensus. Dans cas importants : marge faible. Ex: dans un test de conduite)
Quelles sont les distinctions qu’on doit garder en tête lorsqu’on parle de fiabilité?
1) Fiabilité versus validité (voir les cibles)
2) Dimensions technique et quantitative (grâce aux corrélations (surtout de pearson), tester la fiabilité, la constance, la reproductibilité des scores bruts)
3) Changement réel ou temporaire
4) Erreur aléatoire versus erreur systématique
- (erreur systématique: on a bcp de difficulté à l’identifier. Ex: biais par rapport aux groupes d’appartenance (ex: personne allophone qui passe un test en français alors son score sera mauvais…est-ce que c’est pcq le test est mauvais ou pcq la personne a pas les coméptences voulues?)
- L’erreur aléatoire se comporte tjrs de la meme facon et grace a ca, on peut essayer de la controler. L’erreur aléatoire va tjrs en plus ou en moins par rapport au score. (elle va jouer en faveur ou en défaveur)
Définis ce qu’est la notion de corrélation
Les divers indices de corrélation estiment une possible relation linéaire entre deux variables (souvent appelées x et y)
Coefficient de corrélation = outil principal pour mesurer la fiabilité.
Quels sont les facteurs qui influencent le coefficient de corrélation? (et auxquels on doit s’intéresser avant d’interpréter une corrélation) (4)
1) Linéarité vs curvilinéarité
2) Hétéroscédasticité (assez courant) ex: il y a une corrélation entre valeurs faibles mais ds les scores élevés, non (ou inversement)
3) Position relative vs absolue
4) La variabilité: homogénéité versus hétérogénéité (Si l’échantillon est trop homogène, on a des corrélations qui se rapprochent de 0 alors meme si il y a un lien, on ne le verra pas.)
Ex. l’agression et le TDAH (souvent des petits échantillons alors le groupe est assez homogène)
- Formules de «corrections pour la restriction de l’étendue»
- Surtout dans le contexte de recherche
Quel est le seuil auquel on dit que 2 juges atteignent un accord?
0,8
Quelles sont les principales sources d’erreur de mesure en lien avec la fiabilité? (4)
1) Type de correction du test (pour régler cela, on met des choix de réponses)
2) Contenu du test
3) Conditions de passation du test
4) Circonstances personnelles
Explique ce qu’est la théorie du score vrai
Principaux concepts:
- Le score vrai (V) : score que la personne obtiendrait si toutes les sources d’erreur étaient éliminées. Peut être perçu comme étant le score moyen obtenu lors d’administrations successive du test.
- Le score observé (O) : score brut. ce qu’on obtient à notre test
- L’erreur de mesure (E) : la différence entre le score vrai et le score observé. Peut être positive ou négative
Les relations entre V, O et E:
O = V + et - E V = O + et - E
Quelles sont les relations entre les variances vraie, observée totale et d’erreur?
voir diapo 64
Avec un graphique, représente un test dont la fidélité est élevée et un test dont la fidélité est plus faible
fait ton graphique! correction à la diapo 65
Quelles sont les différentes méthodes qui permettent de déterminer la fiabilité?
1) Fidélité test-retest
- Lorsqu’on s’intéresse à la stabilité des scores, d’une administration à l’autre. La marge entre les 2 administrations dépend de la nature du test (si très difficile, l’intervalle peut être plus court).
- Le test-retest permet de déterminer si les conditions dans lesquelles on a administré le tests a un impact sur la score.
- Ne s’applique pas aux tests longs.
- Ne tient pas en compte des variations de contenu et de l’effet du premier test.
- Quel est l’effet du premier test sur la reprise?
- Utilise le coefficient de corrélation
2) Fidélité inter-juge
- lorsqu’on est dans une situation qui implique le jugement d’un être humain. Les scores ne doivent pas être obtenues dus à un juge plus conciliant ou plus sévère. La corrélation devrait être forte. C’est le score brut qui est corrigé par 2 juges différents.
- Coefficient interclasse
- Renseigne sur des erreurs aléatoires attribuables aux variations entre les évaluateurs. Ne relève rien des autres sources d’erreurs
*Test-retest et interjuge sont des indices de l’erreur de mesure attribuable aux fluctuations dans la passation ou la correction
3) Méthode des versions parallèles
- Quand on doit passer une même évaluation dans un court intervalle. Pour que la personne ne se rappelle pas des réponses a la première passation. Les items ds chaque version sont complètement différents.
- Limitée par la longueur du test et il est rare d’avoir 2 versions d’un même test)
- On calcule la corrélation entre les 2 passations
- Intervalle court ou long entre les 2 passations…va influer sur les sources d’erreurs en découlant. Pour les tests plus longs, l’intervalle de temps entre les 2 tests est plus long.
4) Cohérence interne
- très populaire.** On s’intéresse seulement à l’alpha de Conbrach, pas aux méthodes suivantes:
- Fiabilité déterminée par bissection
- Fidélité pair-impair
- Correction de Spearman-Brown
- Kuder-Richardson (pour les échelles dichotomiques. Ex: oui-non)
Qu’est-ce que l’alpha de Cronbach?
- L’alpha de Cronbach nous aide à dire si on a choisi le bon item ou non pour représenter un construit ou un sous-construit. L’alpha indique dans quelle mesure les items mesurent le ou les mêmes construits.
- Coefficient de fiabilité très fréquent, surtout pour les tests de personnalité.
- Est déterminé par la moyenne des corrélations entre les items et le nombre d’item
- L’alpha de Cronbach présume que tous les items sont standardisés (convertis de manière à ce que chacun ait une moyenne égale à 0)
- N’est pas utile dans les tests de vitesse ou de performance (réussite/échec)
- Formules : voir manuel p. 90
Variables-clés et conclusions:
- Nombre d’items (joue bcp pour faire l’interprétation. La fidélité s’accroit avec le nombre d’items.)
- Niveau de «difficulté» (l’alpha ne s’applique pas quand il y a des différents niveaux de difficulté (?))
- Corrélations entre les items. L’augmentation de la corrélation moyenne inter-item correspond à celle de la fidélité
- En présence d’un nombre réduit d’items, la fidélité est faible lorsque la corrélation inter-items est faible
Définis ce qu’est la cohérence interne
indice de l’erreur de mesure attribuable à l’échantillonnage du contenu
Qu’est-ce que l’erreur type de mesure? (ETM)
C’est une formule de base pour comparer un score individuel à des scores d’un groupe. L’Etm, c’est l’écart-type d’un nombre théorique infini de scores vrai d’une personne. Ce sera probablement le seul calcul qui me sera demandé à l’ordi lors de l’examen
Lorsque la fidélité du test est parfaite (1), l’Emt = 0 (donc absence de emt). Si Fidélité = 0, l’emt = écart-type du test.
Peut être converti en intervalle de confiance. On peut recourir à l’etm pour créer un intervalle de confiance autour du score observé.
L’Etm devrait être exprimée selon l’unité de mesure utilisée pour l’interprétation (score brut ou unité de l’échelle originale ou scores transformés)
explique l’exemple des diapo 74-75-76 avec Marcel et son score observé au PSA.
voir diapo 74-75-76