cours 3 fidélité Flashcards
quelle est la formule de la régression statistique?
Y = b(x) + a
(ligne dans nuage de point dans diagramme bivarié)
qu’est-ce que la théorie du score vrai?
on veut savoir le vrai score (T), mais on ne connaît jamais vraiment le vrai score car fluctue en fonction à cause de l’Erreur (E), on peut comparer avec le score observé (O)
5% d’estimation d’erreur, le score observé doit être proche du vrai score
coefficient de corrélation = variance vraie/variance observé, plus c’est proche de 1 plus c’est corrélé
si notre variance observée est très proche de notre variance vraie, qu’est-ce que ça signifie?
il y a très peu d’erreur = fidélité élevée = corrélation élevée
(ne veut pas nécessairement dire que la validité est élevée, car on peut ne pas mesurer la bonne chose et tout de même avoir une forte corrélation)
quelles sont les différentes méthodes pour vérifier la fidélité?
- test-retest
- inter-juges
- forme parallèle
- consistance/cohérence
- kuder-richardson formules
- coefficient Alpha (alpha de cronbach)
qu’est-ce que la méthode du test-retest?
fonctionnement: on retest 2-4 semaines plus tard
conditions personnelles des participants vont affecter la fidélité (physique et mentale)
forces et limites:
difficilement applicable
effet du premier test sur la réponse (surtout si ça fait moins que 2 semaines)
mais 4 semaines trop long car changement dans la personnalité
qu’est-ce que la méthode inter-juges?
fonctionnement:
système d’entrevue
corrélé entre des juges
on veut plus mesurer des comportements que des attitudes ou compétences générales afin de maximiser la corrélation
correction du test:
est-ce que deux correcteurs sont d’accord entre eux pour la réponse = fidélité
chaque correctrice fait une seule question d’examen
entre le début et la fin de la correction il peut y avoir des divergences
qu’est-ce que la méthode de forme parallèle?
fonctionnement:
deux versions du même test et on les corrèle entre eux
très peu répandu, puisqu’il faudrait deux test sur les mêmes concepts avec mêmes items
qu’est-ce que la bissection? (consistance/cohérence interne)
plus utilisé
inclut:
- bissection (méthode moitié moitié)
on corrèle les scores des deux moitiés du test ensemble
on sépare le test en pairs vs impairs pour ne pas qu’il y ait une moitié désavantagée (fidélité pair impair)
puisque la corrélation évalue seulement la fidélité de la moitié du test, on utilise la correction de spearman-brown pour connaître la fidélité du test en entière
qu’est-ce que la méthode du coefficient alpha (cronbach)?
fonctionnement:
chaque item est une version réduite du test
on veut corrélé l’item avec le reste du test pour voir si cohérent
plus on a d’items corrélés plus notre alpha augmente
plus il y a de questions sur un même item = plus alpha est élevé = plus notre cohérence interne est élevée
0.6 est acceptable dans un contexte de recherche
quels sont les différents types d’erreurs?
- erreur type de mesure:
entre deux scores mais du même test
attribuable à un manque de fidélité - erreur type d’estimation:
erreur de prédiction de Y par X
quand ma corrélation n’est pas parfaite, il y a toujours un peu d’erreur dans mon Y
plus pour validité
comment évaluer la fidélité?
rapports d’évaluation:
tenir compte de l’erreur de mesure
notre erreur de mesure est augmentée, on est plus prudent dans nos conclusions, on doit ajouter des adverbes
attention aux profils
on calcul notre client où il se situe dans quelle catégorie dans 95% des cas
fidélité des items et des sous-tests:
chaque item à 10 questions, on estime que chaque réponse dans un item sont corrélés, mais si mets 5 questions par item alors la fidélité est diminuée, si on en met 2 fidélité est encore plus réduite
comment augmenter la fidélité?
poser plus de questions par item (sans trop de redondances) = augmentation de la cohérence et de la fidélité
éviter de créer des questionnaires avec trop de résistance à la variance
ex: deux participants créent de la variance (ont mis même réponse à chaque item), si on les enlèvent ça ne modifie pas vraiment l’alpha de cronbach parce que les questions sont très corrélées entre elles
jusqu’à quel point la fidélité doit être élevée?
dépend du but (ex: décision grave) et des sources (évaluateurs et patients, donc la variation des sources affecte la fidélité) ex: diagnostic de TDAH parents vs enseignants
barèmes:
décision individuelle importante = .95
(ex: questionnaire sur alzeimher)
combiné à d’autres infos = .80
recherche = .60
attention:
- la fidélité est toujours importante
- les tests courts ne sont pas une excuse pour justifier une faible fidélité (.6 est plus compréhensible pour un questionnaire court mais reste quand même faible)
- le seuil de signification n’est pas suffisant
- plus le test est long plus la personne se fatigue et met n’importe quoi
Si une question est corrélé négativement avec les autres items, alors il fait diminuer l’alpha de cronbach, on doit donc la supprimer, mais doit faire attention a ne pas trop en enlever car on ne mesure alors pas tout ce qu’on veut mesurer
quelles sont les 4 distinctions importantes sur la fidélité?
- la fidélité comparée à la validité
- fidélité ne s’intéresse qu’à la constance et la reproductibilité de la mesure, sans égard au contenu mesuré, donc une mesure peut être fidèle sans être valide (mais ne peut pas être valide s’il n’est pas fidèle) - le sens couramment utilisé comparé au sens technique
- fidélité d’un test évoque des dimensions techniques et quantitatives
- synonymes de fidélité techniques = constance et reproductibilité - distinguer le changement réel comparé au changement temporaire
- changement réel du trait mesuré vs fluctuations de résultats attribuables à une modification temporaire des circonstances personnelles ou au fruit du hasard ou aux différences imputables de l’évaluateur - les erreurs systématiques vs erreurs aléatoires
- l’erreur systématique augmente ou réduit les résultats attendus au groupe et survient en raison de facteurs étrangers au test
quels sont les 4 facteurs influant sur les coefficients de corrélation?
- la linéarité
- l’hétéroscédasticité
- la position relative (non absolue)
- l’hétérogénéité du groupe