Cours 4 Flashcards
Qu’arrivera-t-il s’ils refont le
test dans 2 semaines dans des
circonstances différentes?
ju = toute ok
renaud = fatigué et blessé
on veut mesurer s’il est pret a allé au cegep ou pas
apple watch pour sommeil fidele? valide?
c’est fidèle parce que ca va donner les meme résultat de facon constante mais n’est pas valide (-60% validité)
impossible d’etre super valide mais pas fidèle
vrai
je peux etre fidèle sans etre valide ?
oui
quatre distinction importantes (PAS A L’EXAMEN) DIAPO 10
FIDÉLITÉ DEF
La fidélité ne s’intéresse qu’à la constance et à la reproductibilité de la mesure, sans égard à l’objet que celle-ci est censée mesurer.
Les erreurs aléatoires
Augmente ou réduit les résultats aléatoirement.
Exemple: On mesure l’anxiété sur une échelle de Likert allant de 1 à 5. Le participant hésite entre 2,
3 ou 4 sans trop savoir son niveau d’anxiété et choisis aléatoirement
- la personne hésite entre 2 et 3 ou pt 4, ca c’Est une erreur aléatoire
Affecte la fidélité! (Prochaine fois, peut varier) prochaine fois on test la personne meme manière, résultat sera différent.
Les erreurs systématiques
Augmente ou réduit systématiquement les résultats
attendus en raison de facteurs étrangers au test.
Exemple: On mesure l’intelligence d’une personne anglophone avec un test en Français.
N’affecte PAS la fidélité (prochaine fois sera similaire) si je reteste la meme chose, résultat sera le meme
quand les “erreur type d’Estimation” sur poster ne se superpose pas, sont elles significativement significative?
oui mais si les deux crochet sur le top des clonones dans le graphique se “superpose” la cE’st pas significatif.
si je msure quelque chose de curvilinéaire, la corréaltion est-elle bonne? (droite tracé selon le nuage de point)
non. corrélation sera affaiblit
hétéroscédasticité
quand on voit un graphique que lorsque l’on est proche de 0, plus on est précis mais plus on approche la fin plus le nuage est vaste.
ex: mesrure taux erreur pour deviner nmbr bonbons dans pot.
- si il y a un bonbon, taux erreur bas
- si 57 bonbon, bcp plus erreurs.
homoscédasticité
inverse d’hétérosédasticité
mesure anxiété sur 20
si ca donne 5–10–5–15–5
refait et = 6–11–6–16–6
c’Est pas fidèle mais valide.
si on fait une corrélation, cE’st fidèle.
la droite sera parfaite mais ne croisera pas 0.
hétérogénéité vs homogénéité
si je prends un trop petit groupe qui se ressemble, n’aura pas de corrélation.
Un groupe très hétérogène produit une corrélation gonflée, alors qu’un groupe homogène produit une corrélation réduite
la facon dont on corrige le test va influencer la fidélité.
vrai affect fidélité
un correcteur plus strict donne 2/5 et autre correcteur 4/5
s’il ne corrige pas de la même FACON
résoudre ce probleme, doit avoir grille de correction
ex: si on écrit le 7 dans le mauvais sens, c’Est mal.
ou meme correcteur
conteneu du test
important de s’assurer que l’on calcul TOUTE la matière dans le test sinon test erreur de fidélité
si 3 test différent avec pas mm ratio de question sur matière. meme personne aurait 3 résultats différent. (résoudre: faire une version)
condition administration test
ex: exmaen mais construction en haut, lumière flash, personnes entrent dans classe. vs au SESH
solution: lister le plus de solution possible pour pas affecter fidélité (impossible de toutes les lister)
tout monde fait exam meme pièce et calme
circonstance personnelle
ex: laura se fait intimider 30 minutes avant un test de personnailté.
résoudre: décaller le temps de passation, reviens fds prochaine.
score vrai: V
je sais la vrai valeur, test instrument mesure pour savoir ce qu’il donnera comme résultats
Ce que tu as réellement sur un trait psychologique, mais tu ne peux pas le connaître directement
authenticité de personne
manquer info sur deux autres lettres(1:27:00)
LA FIDÉLITÉ TEST-RETEST
test un groupe et ensuite on les re-test avec le meme instrument.
ajd presque jamais utilisé
problématique:
- N’évalue pas le phénomène d’apprentissage (tiens pas compte)***
faire attention:
ex: testé le sprint pendant 5 minute et 5 minutes apres je test ton jogging sur 4 km et ton bpm. (trop court lapse de temps)
LA FIDÉLITÉ INTERJUGES
Évalue les variations aléatoires attribuables aux personnes (ou machine) qui corrigent le test
(1:36:00)
- Les évaluateurs doivent impérativement travailler séparément afin
de ne pas s’influencer mutuellement (compromet la fidélité)
L’analyse entre plusieurs évaluateurs s’appelle le « coefficient de
corrélation intraclasse » ou CCI
critiques: Ne fonctionne que pour les tests ou le score est donné par
l’administrateur du test.
MÉTHODE DES VERSIONS PARALLÈLES
La fidélité par versions parallèles ou méthode des formes
équivalentes utilise deux versions d’un test, ensuite d’administrer les
deux versions aux mêmes personnes (soit en même temps si elles sont assez courtes, ou avec un intervalle similaire à la méthode testretest).
(1:38:00)
Doivent être équivalentes en nombre d’items, la limite de temps
allouée, aux spécifications du contenu et aux autres facteurs de
même ordre.
Obtenue en calculant la corrélation (habituellement de Pearson)
entre les scores obtenus des deux versions.
critique: situation personnelle peut affecté et dur a calculer
texte a lirE cours 4, 2-3 question exam (INTRO ET CONCLUSION SEULEMENT)
Il n’y a pas beaucoup de différences entre les trois théories dans la mesure de fidélité. Ils se demandent ainsi, pourquoi utiliser
d’autres méthodes que la TCT? TG lorsqu’il existe plusieurs
sources, TRI lorsqu’il faut plus de précisions. Sinon, l’alpha de
Cronbach est l’idéal.
POURQUOI ON UTILISERAIS UNE AUTRE MÉTODE is c’est la plus simple, autrement dit alpha chrome back est meilleur possible.
si alpha chrome back est de .91 il est:
excellent.
.80-.89 = bon
.70-.79 = adéquat
.60-.69 = faible
sous .60 devrais pas etre utilisé
UN TEST NON-FIDÈLE NE PEUT
ÊTRE VALIDE, ALORS QU’UN TEST FIDÈLE PEUT CERTAINEMENT ÊTRE NON-VALIDE!!
vrai
facteurs influant coéficient corrélation
1- La linéarité
prend pas en compte curvilinéaire
2- L’hétéroscédasticité
3- La position relative (non absolue)
4- L’hétérogénéité du groupe
erreur de mesure validité e
diff entre score observer et score vrai
facteur qui influence la mesure
- fatigue
- distraction
- mal lue question
niveau mesuré score observé (O)
résultat brut
est combinaison de score vrai et erreur mesure (o= v + e)
cohérence interne (par bissection)
prendre un test, le diviser en deux, et comparer les deux moitiés.
Ex: Si vous faites la méthode des versions parallèles et que les deux tests sont toujours faits un à la suite de l’autre, c’est comme s’il s’agit d’un seul grand test que nous divisons en deux pour calculer la fidélité.
prob: si divisé en deux tests, le 2e test sera désavantagé. (fatigue)
- solu: pair-impair
prob 2: corrélation entre deux moitié test exprime pas fidélité test entier mais d’un test 2 fois moins long
- solu: correction spearman-brown
cohérence interne (formule-richardson)
suite de bissection
permettent d’obtenir la corrélation moyenne pour toutes
les bissections possibles du test.
fonctionne juste si y’a 2 choix (oui/non)
alpha cronbach
fonctionne juste si test est dichotomique (oui/non 0-1)
L’α indique dans quelle mesure les items du test mesurent le ou les
mêmes construits ou traits! (Mesure de l’homogénéité des items).
TRÈS IMPORTANTE DANS LE CALCUL D’ERREUR DE MESURE
deux conclusions importantes pour alpha cronbach
1- La durée du test est importante (les tests avec plus d’items sont généralement plus fidèles, jusqu’à
ce que la fatigue entre en jeu).
2- La corrélation entre les items est importante (il est important que les items mesurent le même trait bien défini)
faire test plus long possible avant que fatigue embarque
L’INCERTITUDE DE MESURE
Le coefficient de fidélité d’un test est une information importante, mais pas immédiatement claire.
L’erreur type mesure, calculée avec la fidélité, est plus pratique.
On peut recourir à l’erreur type mesure pour créer un intervalle de confiance autour d’un score observé
FIDÉLITÉ DANS LA THÉORIE
DE LA GÉNÉRALISABILITÉ
Se fait généralement de la même façon que pour la TCT
(test-retest, interjuge, versions parallèles), mais puisqu’elle considère plusieurs erreurs de mesure, la formule est modifiée (score univers au lieu de score vrai):
résumé théorie généralisabilité
savoir qu’il y a plusieurs erreurs pris en compte pas juste une
théorie réponse à l’item
prend en compte le thêta pour savoir difficulté de chaque questions, si bon son bon fable sont faible, c’est que c’est fidèle, sinon c’est pas fidèle.