La fidélité (fiabilité) Flashcards

1
Q

C’est quoi la fidélité d’un test?

A

C’est la constance et la reproductibilité de la mesure. Un test sera fiable s’il permet d’avoir les mêmes résultats dans un intervalle de quatre semaine (minimum) par exemple. C’est quand on mesure toujours la même choses, peu importe les conditions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La fiabilité est-elle la seule condition nécessaire pour déterminer la qualité d’un test?

A

Non. C’est la première info comme va chercher à savoir, mais ce n’est pas suffisant. Il faut ensuite savoir la validité du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Il y a 4 distinctions importantes à faire en ce qui à trait à la fidélité. Nommes-les.

A
  1. La fidélité versus la validité.
  2. Dimensions techniques et quantitatives
  3. Changement réel ou changement temporaire
  4. Erreur aléatoire versus erreur systématique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Il faut bien distinguer la fidélité de la validité. Comment diffèrent-t-elles?

A

La fiabilité est plus technique, opérationnelle et quantitative. Alors que la validité, qui est aussi technique de manière mesurable, est plus subjective. On doit utiliser notre justement parfois, et c’est un lot de preuves qu’on doit accumuler.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’erreur aléatoire versus l’erreur systématique?

A

L’erreur aléatoire provient du hasard. Tandis que l’erreur systématique provient lorsqu’on réduit ou augmente systématiquement les résultats attendu à un test en raison de facteurs étrangers au test. Exemple, on passe un test conçu pour des francophones à des immigrants qui ne maîtrisent pas la langue, donc il y aura une erreur systématiquement è la baisse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux?

Un test peut être parfaitement fidèle.

A

Faux. Un test n’est jamais 100% fidèle. Il y a toujours une marge d’erreur qu’il faut accepter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment augmenter la fiabilité/fidélité d’un test?

A

En réduisant l’erreur de mesure.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Est-ce qu’on peut réduire toutes les erreurs de mesure?

A

Non. La seule qu’on ne peut pas réduire est celle qui à trait au sujet. Plus précisément, au participant. On ne peut rien faire à l’état du participant lors de la passation du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel énoncé est vrai? Un test peut être :

a) valide sans être fidèle
b) fidèle sans être valide

A

b)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Donne la définition de la corrélation.

A

La corrélation estime une possible relation linéaire entre deux variables (X,Y).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont les différents facteurs qui influence la corrélation?

A
  1. La linéarité
  2. Hétéroscédasticité
  3. Position relative vs position absolue
  4. La variabilité : homogénéité versus hétérogénéité
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Ça veut dire quoi linéarité, versus curvilinéarité?

A

On obtient une forte corrélation lorsque nos variables sont linéaires. Une corrélation faible donne une droite curvilinéaire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Décris moi l’hétéroscédasticité.

A

C’est la façon dont nos points se dispersent sur notre droites. Une moins bonne hétéroscédasticité donne peut donner par exemple une corrélation est plus forte au début et plus faible à la fin, où à la fin les points sont très dispersé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

C’est quoi l’homogénéité? Comment ça peut impacter notre corrélation?

A

C’est lorsque qu’il n’y a pas assez de variations et que tous les participants répondent la même chose. Les données sont donc étendue partout et ne forme pas de ligne permettant de voir une corrélation. Un groupe homogène donne ce problème.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

C’est quoi la position relative vs absolue?

A

Les scores obtenus n’ont pas nécessairement d’impact lorsqu’on cherche une corrélation entre deux personne, par exemple. Deux faibles scores semblables peuvent donner presque la même corrélation qu’un faible score et un score moyen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les principales sources d’erreur de mesure en lien avec la fiabilité?

A
  1. Type de correction du test
  2. Contenu du test
  3. Conditions d’administration du test
  4. Circonstances personnelles
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment le type de correction du test peut affecter sa fiabilité?

A

Le correcteur a un jugement qui est une source d’erreur. Il y a aussi une variation évidente entre la façon de corriger un test des correcteurs. Exemple, corriger une question à développement.

18
Q

Comment le contenu du test peut-il affecter la fiabilité du test?

A

Lorsque les items ne mesurent pas ce qu’ils sont censé mesurer.

19
Q

Comment les conditions d’administration du test peuvent-ils affecter sa fiabilité?

A

Si un test est administré en groupe une fois, et seul une autre, etc. Les réponses du participant peuvent varier en fonction de ça.

20
Q

Comment les circonstances personnelles peuvent affecter la fiabilité du test?

A

Si le participant répond au test la journée où sa conjointe l’a quitté, il sera probablement moins concentré et ne répondrait pas de la même façon une autre journée où ses émotions ne seraient pas affectés.

21
Q

Est-ce qu’on peut réduire l’erreur de mesure de toutes ces sources d’erreur?

A

Non. On ne peut pas contrôler l’erreur de mesure des circonstances personnelles du participant.

22
Q

Qu’est-ce que la théorie du score vrai? Quelles sont ses composantes?

A

Une façon d’éliminer statistiquement les sources d’erreur possible dans un score donné. Ses composantes sont le score observé (O), le score vrai (V) et l’erreur de mesure (E).

23
Q

Quelles sont les relations entre le score observé, le score vrai et l’erreur de mesure? Comment on peut définir chacun?

A

Le score observé (O) peut être considéré comme le score brut de la personne. Nous savons par contre qu’il y a des erreurs de mesures. Le score vrai (V) est donc le score qu’elle aurait si on enlevait toutes les sources d’erreurs de mesure possible. On peut le concevoir comme la moyenne de tous les scores observés qu’elle obtiendrait si elle passait le test un nombre de fois illimité. L’erreur de mesure (E) est la différence entre le score vrai et le score observé. Elle peut être positive ou négative.
V = O +/- E
OU
O = V +/- E

24
Q

La théorie du score vrai peut-elle s’exprimer en termes de variances des scores?

A

Oui. C’est la même formule, sauf que c’est remplacé par la variance.

25
Q

Le score vrai et le score observé se retrouve où sur une distribution à courbe normale?

A

Le score vrai représente la moyenne est les scores observés sont tous les points autour de la moyenne, donc la surface de la courbe.

26
Q

Est-il réellement possible d’appliquer la théorie du score vrai?

A

Non. Nous n’avons jamais accès au score vrai, même si c’est plutôt lui qu’on recherche. On a seulement accès au score observé. Nous avons par contre des méthodes qui servent à diminuer la marge d’erreur que peuvent contenir les sources d’erreurs.

27
Q

Plusieurs méthodes servent à déterminer la fidélité d’un test, nommes-les.

A
  1. Fiabilité test-retest
  2. Fiabilité inter-juges
  3. Méthode des versions parallèles
  4. Cohérence interne (homogénéité)
28
Q

Décris moi la méthode de fidélité test-retest.

A

Cette méthode consiste à repasser le test une deuxième fois afin de voir si les résultats seront à peu près les mêmes. On regarde la corrélation entre les scores du premier test et les scores du deuxième test. Si la corrélation est élevé, exemple r = 0,85, on peut considérer qu’il y a une bonne fidélité.

29
Q

Quelles sont les forces et faiblesses de la méthode fiabilité test-retest?

A

Forces : Cette méthode permet d’évaluer l’influence des fluctuations de l’état mentale et physique du participant. Elle peut cibler les conditions d’administration ou la variation des évaluateurs.

Faiblesses : Elle ne tient pas compte des erreurs aléatoires attribuables aux variations de contenu. Cette méthode est difficilement applicable. On ne peut ignorer l’effet du premier test sur la reprise.

30
Q

Comment fonctionne la fiabilité interjuges? Quelles sont ses forces et faiblesses?

A

Elle évalue les variations attribuables aux personnes qui corrigent le test. Elle utilise le coefficient de corrélation intraclasse pour déterminer la corrélation entre les évaluations des correcteurs. Elle est particulièrement importante lorsque la méthode de correction requiert un jugement et implique de faire des inférences.

31
Q

Quelles sont les méthodes qui permettent de donner réduire l’erreur de mesure attribuable aux fluctuations dans la passation ou la correction?

A

La fiabilité test-retest et la fiabilité interjuges.

32
Q

Qu’est-ce que la méthode des versions parallèles?

A

Lorsqu’on fait deux versions du même test pour en vérifier sa fiabilité. Si les deux tests sont passé l’un à la suite de l’autre, cette méthode est attribuable seulement à l’erreur à l’échantillon de contenu. Si l’intervalle est plus long, la méthode évalue la source d’erreur attribuable au contenu et comme pour la fidélité test-rest, aux fluctuations des conditions physiques et mentales du participant et des conditions d’administrations. Cette méthode n’est pas très répandue, parce que très peu de tests sont offerts en plus d’une version.

33
Q

Décris moi la méthode de cohérence interne.

A

La cohérence interne mesure à quel peut les items sont liés, à quel point il mesure la même chose. On calcule la corrélation inter-item en regardant les réponses aux items des participants et en regardant si les scores sont semblables. Si les deux items ont une bonne cohérence, ils devraient obtenir le même score ou presque.

34
Q

Il existe plusieurs façons de d’évaluer la cohérence interne d’un test. Nommes les.

A
  1. Fiabilité déterminée par bissection
  2. Fiabilité pair-impair
  3. Correction de Spearman-Brown
  4. Kuder-Richardson (pour les échelles dichotomiques, ex : oui/non)
  5. Alpha de Cronbach (a)
35
Q

En quoi consiste la fiabilité par bissection?

A

Ça consiste à scinder le test en deux, souvent séparé de manière pair-impair, ce qui joins la définition du coefficient de fidélité pair-impair.

36
Q

Qu’est-ce que la correction de Spearman-Brown?

A

Lorsqu’on fait une bissection de notre test, la corrélation obtenu entre les deux moitié n’équivaut pas à la fidélité du test en entier, il faut donc faire une correction à la corrélation calculée pour connaître la fidélité du test entier.

37
Q

Que permet d’obtenir les formules de Kuder-Richardson?

A

Les formules KR-20 et KR-21 permettent d’obtenir la corrélation moyenne pour toutes les bissections possibles du test. Elles ne s’appliquent qu’à des items auxquels on a répondu sur une échelle dichotomique.

38
Q

Qu’est-ce que l’Alpha de Cronbach?

A

Le a mesure la façon dont chaque item est cohérent avec les autres items et à quel point ces items mesurent le même construit. La formule comprend le K qui est le nombre d’items, et le rij qui est la corrélation inter-item et donc l’alpha est la fidélité considérant les deux. L’alpha évalue évidemment seulement la source d’erreur attribuable au contenu.

39
Q

Erreur type de mesure

A
40
Q

Erreur type de la différence

A
41
Q

Quelles sont les questions particulières à se poser sur la fiabilité? (4)

A
  1. Fiabilité dans les rapports narratifs (l’information n’est pas toujours présente)
  2. Fiabilité des items et des sous-tests (certains interprète des items de leur tests alors qu’ils ne devraient pas, la fiabilité du test n’est pas la même que celle des items et sous tests)
  3. Fiabilité des profs (il faut faire attention quand l’interprétation repose sur un profil de trois scores ou plus)
  4. Fiabilité des tests critériés (s’interprète différemment)