Fidélité Flashcards
Quel est l’élément qui permet que les objectifs du bilan psychologique soient probable même pour les HPI ou les déficiences ?
Si les résultats sont stables et reproductibles dans le temps.
Stabilité : différence inter sur le test = différence inter sur la source commune de variation.
Quels sont les 2 équations du score observé ? Décrire les composantes
1ère (Spearman): Xo = X t + Xe
Avec Xo : score observé
Xt : part de score vrai (non observable, moyenne de tous les items et postulat : constant)
Xe : erreur de mesure
2eme : Xo = Xt + Xes + Xea
Avec Xt : attribut majoritaire à l’origine de l’interprétation (non observable, moyenne de tous les items et postulat : constant)
Xes : erreur systématique = implication d’autres attributs qui maintiennent aussi les différences inter
Xea : erreur aléatoire
Dans la 2eme équation, que se passe-t-il si Xea est faible ? S’il est fort ou modéré ?
Faible : Xo = Xt (+Xes) : les differences inter score observées = différences inter score vrai
Fort/ modéré : Xo =/ Xt (+Xes) : les différences inter score observées ne sont pas égales aux différences inter du score vrai, les différences inter sont inconsistantes
Définir la fidélité d’un test d’après la théorie classique des tests (TCT ou CTT).
La fidélité reflète pour une population donnée à quel point les différences inter sur le score correspondent au différences inter du score vrai par opposition à l’erreur de mesure Ea.
Quelles sont les 3 méthodes possibles quand on veut quantifier l’erreur de mesure ?
- Méthode des tests parallèles
- Méthode des tests - retests (T-R)
- Méthode du partage
Quelle taille de l’échantillon doit-on prendre pour un bon tests ?
Pas de consensus : le plus possible, ou + de 400 d’après Charter.
Quelle valeurs du coefficient accepte t-on pour considérer une bonne fidélité pour une décision possible avec un seul score ? Avec 1-2 tests de même fidélité ? Pour la recherche de base ?
Pour les méthodes en général ? Et pour la méthode de test-retest ?
- si rxx > .90 (ou .95)
- si .80 < rxx < .89
- si .70 < rxx < .79
- rxx > .90
- rxx > .85
Que fait-on dans la méthode des tests parallèles ? Nbr test(s), groupe(s) et passation(s) ? Quelles sont les limites de cette méthode ?
- 2 tests, 1 groupe, 1-2 passations
On vérifie les postulats :
- Ẋo1 ≃ Ẋo2 (donc μ1≃μ2)
- Ẋt1 ≃ Ẋt2
- St1 ≃ St2 (écart types et var similaires)
- Coefficient d’équivalence : r(forme1 - forme2) : doit être élevé
–> Postulat égalité rarement respecté a cause de l’influence de la forme 1 sur la perf de la forme 2
Que fait-on dans la méthode du test - retest (T-R) ? Nbr test(s), groupe(s) et passation(s) ? Quelles sont les postulats et limites de cette méthode ?
- 1 test, 1 groupe, 2 passations avec intervalle
On regarder la corrélation entre les 2 passations avec :
- Coef de constance qd le délais est court : utilité clinique ?
- Coef de stabilité si le délais est plus long, doit être supérieur à .85 pour que l’ordre des individus reste similaire sinon il faut ajouter des tests
- Postulat de stabilité du score vrai si pas d’effet d’apprentissage
- Limite psk le postulat du lavage de cerveau n’est pas respecté, donc pas vraiment de renseignement sur la stabilité des scores vrais; problème on ne sait pas si on fait une estimation des traits ou de l’état du sujet, effet retest variable en fonction du domaine, de l’âge, du niveau cognitif et du délai
Que fait-on dans la méthode du partage ? Nbr test(s), groupe(s) et passation(s) ? Quelles sont les limites de cette méthode ?
- 1 test, 1 passation, 1 groupe
Limite : estimation problématique de la fidélité comme de la consistance interne
Quelles sont les différentes procédures/ indices de la méthode du partage ?
- Méthode de la bissection
- Méthode des covariances : alpha (split-half)
- Coefficient omega
Que fait-on dans la méthode de bissection ? que mesure -t-on ? Quelles est la limite de cette méthode ? Comment est-ce corrigé ?
Quel est le postulat ?
on considère 2 moitiés d’items (n/2 pour faire M1 et M2) comme 2 tests parallèles. Partage :
- 1ère moitié vs 2ème : problème pour les tests cog ou d’intelligence ou les items sont triés par difficulté
- Pair vs impair (M1 : 1, 3, 5, ..)
- Appariement selon contenu et difficulté
Puis calcul de la corrélation entre les 2 moitiés (rM1-M2)
- Prblm : le “partage” réduit la fidélité, c’est pourquoi il y a la formule de correction de Sprearman- Brown (SB) qui estime la fidélité à partir de l’ensemble des items :
Corrélation = r𝗆₁-𝗆₂
Rs-b = 2x(corr)/ (1 + corr)
Postulat : 2 moitiés comme 2 tests parallèles (tout identique) mais rarement respecté
Que fait-on dans la méthode des covariances ? que mesure -t-on plutôt que la fidélité ?
Quel sont les postulats ?
On mesure la consistance interne = somme des covariances par paires d’items continus et on utilise le 𝛼 de cronbach
Postulats :
- Distribution normale (symétrique)
- Unidimentionnalité des items à démontrer (important)
Comment est considéré le 𝛼 de Cronbach ? Pourquoi est-ce un problème ?
Comme un des indicateurs de l’unidimentionnalité mais c’est un problème psk on est censé l’avoir démontré avant et non pas l’utiliser pour cela.
Quelle est l’alternative au coefficient 𝛼 ?
Le coefficient oméga (𝜔) qui est un meilleur indice de fidélité (validité) et permet lui d’avoir des informations sur la contribution du facteur g.
Voir les 4 graphs slide 26/64