Cours 4 Flashcards

1
Q

Fidélité

A

Constance ou exactitude de la mesure d’un test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Validité

A

Capacité d’un test à mesurer ce qu’il est censé mesurer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Changement réel du trait mesuré VS. changement temporaire

A

différence parce que le trait a changé – différence temporaire dû aux circonstances personnelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Erreurs de mesure systématiques VS. erreurs de mesure non systématiques

A

erreur de la même magnitude toujours présente – erreur imprévisible due au hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Distribution bivariée

A

permet de représenter la relation existant entre deux variables
appel aussi : « diagramme de dispersion » ou « nuage de points ».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Coefficient de corrélation

A

résumé numérique de la relation entre deux variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment la valeur de r peut varier

A

La valeur de « r » peut varier de -1 à +1.
* Un r de -1 = corrélation négative parfaite
* Un r de +1 = corrélation positive parfaite
- Un r de 0 = absence de corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel est le coefficient le plus utilisé ?

A

Le coefficient le plus utilisé est la corrélation de Pearson.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Droite de régression (prédiction) / regression line

A

Quand une corrélation (r) est établie entre deux variables (X et Y), il est possible de prédire, à partir de cette relation, la valeur de Y d’après ce que l’on connaît de X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Y’=bX +a

A

Y’ = valeur Y à prédire
bX = pente de la droite de régression (indique comment change Y, à partir de X)
a = point d’intersection sur l’axe (valeur de Y, quand X a une valeur de 0 )

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Y =r S (X−X)+Y

A

r xy = corrélation entre x et y
s y = écart-type de x
s x = écart-type de y
x = score dans le test x
y = score dans le test y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que permet de faire la droite de régression ?

A

La droite de régression permet de prédire Y, à partir des données de X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erreur type d’estimation

A
  • Les scores Y réels ne tombent pas tous exactement sur la droite d’estimation.
  • Il y a une différence entre les scores Y prédits, et les scores Y réels : il y a une erreur d’estimation.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Formule erreur type estimation

A

SDy = écart-type de la variable y prédite
r xy = corrélation entre les variables
X (variable connue) et Y (variable prédite)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Facteurs influant les coefficients de corrélation (4)

A

linéarité
hétéroscédasticité
position relative
hétérogénéité du groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La linéarité (linearity) :

A

La corrélation de Pearson est seulement utile pour des relations linéaires.

Elle sous-estime les relations non-linéaires (curvilinéaires).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

L’hétéroscédasticité

A

Les Y réels sont présumés d’être distribués normalement autour des scores Y prédits. Il est supposé que le degré de dispersion (de l’erreur de mesure) soit le même pour tous les points.

o Homoscédasticité = dispersion égale.
o Hétéroscédasticité = dispersion inégale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

La position relative - non absolue -

A
  • Une corrélation n’a pas besoin que les 2 variables corrélées aient les mêmes scores (score absolu)
  • Il peut y avoir une corrélation élevée entre 2 variables qui ont des moyennes très différentes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

L’hétérogénéité du groupe

A

La variabilité d’un groupe (dispersion des scores) peut avoir un effet sur le coefficient de corrélation.
o Hétérogénéité (différence) VS. homogénéité (pareil)
o Un groupe très hétérogène produit une corrélation gonflée.
o Un groupe très homogène produit une corrélation réduite

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Type de correction de test

A

Les divergences d’opinions des évaluateurs peuvent entraîner des variations aléatoires dans le résultat du test.

Plus l’évaluation fait appel au jugement (subjectif) de l’évaluateur, plus elle risque d’avoir des erreurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Contenu du test

A

Les variations dans la sélection d’items d’un test peuvent entraîner des erreurs aléatoires dans les résultats.

Un même étudiant (même niveau de connaissances) peut avoir un résultat différent selon la version de l’examen répondu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Conditions d’administration du test

A

L’administration d’un test devrait suivre une procédure standardisée (consignes, limite de temps, espace physique, etc.)

Des variations dans les conditions d’administration peuvent influencer les résultats d’un test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Circonstances personnelles

A

Un changement temporaire dans la condition physique ou mentale de la personne peut avoir une influence aléatoire sur les résultats d’un test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Cadre conceptuel : la théorie du score vrai

A

Plupart des méthodes pour évaluer la fidélité sont fondés sur la théorie classique des tests

25
Q

Score observé

A

score qu’une personne obtient dans le test

26
Q

Score vrai

A

score réel de la personne, score qu’elle obtiendrait s’il était possible de mesurer de façon parfaite (sans erreur)

27
Q

Erreur de mesure

A

différence entre le score observé et le score vrai, somme de toutes les erreurs aléatoires

28
Q

La fidélité (r) pourrait être définie de la façon suivante :

A

(𝜎𝜎𝑇𝑇2 = variance du score vrai)
(𝜎𝜎𝑇𝑇2 = variance du score observé)

29
Q

Le score vrai peut également être conceptualisé comme :

A

Le score moyen obtenu lors d’administrations successives (théoriquement illimitées) du test à différentes heures et conditions différentes.

Si on pouvait faire cela, l’évaluation serait « parfaite » : toute source d’erreur aléatoire serait annulée.
* Mais, en réalité on ne connaît jamais le score vrai (il n’existe pas une mesure parfaite libre d’erreur).
* On connaît seulement le score observé.
* Les diverses méthodes pour évaluer la fidélité visent à estimer l’écart entre le score observé et le score vrai. Autrement dit, ils essaient d’estimer l’erreur de la mesure.

30
Q

Distribution hypothétique des scores observés autour des scores vrais

A

Le score vrai est au milieu.

Les scores observés sont normalement distribués autour du score vrai.

La différence entre un score observé et le score vrai correspond à l’erreur de mesure

31
Q

Fidélité test-retest (test-retest reliability)

A

Administration du même test aux mêmes personnes à 2 occasions.

Le coefficient de fidélité est la corrélation entre les scores obtenus la 1re et la 2e fois.

Période entre les tests : de quelques jours à quelques semaines.

32
Q

Forces :

A
  • Évaluation de la stabilité temporelle du questionnaire
  • Permet d’évaluer l’influence des variations liées aux conditions d’administration du test et aux circonstances personnelles.
33
Q

Faiblesses :

A

Ne tient pas en compte les erreurs aléatoires liées aux variations de contenu (tests de rendement).
o Parfois difficile de faire répondre au test une 2e fois.
o Un probable « effet » du 1er test sur le 2e.

34
Q

Fidélité inter-juges (inter-scorer reliability)

A

Le même test est évalué de façon indépendante pour 2 ou plus évaluateurs.

Le coefficient de fidélité est la corrélation entre les scores du 1er et 2e évaluateur.

S’il y a plus de deux évaluateurs, on peut utiliser le coefficient de corrélation intraclasse.

35
Q

Forces :

A

Permet d’évaluer les variations aléatoires attribuables aux évaluateurs.
o Particulièrement important quand l’évaluation fait appel au jugement (parfois subjectif) des évaluateurs

36
Q

Faiblesses :

A

Les évaluateurs doivent travailler de façon indépendante, afin de pas s’influencer mutuellement.
o Relève seulement les erreurs attribuables aux évaluateurs (et non aux autres sources d’erreur).

37
Q

Fidélité par versions parallèles (alternate form reliability)

A

Administration de 2 versions d’un test au même groupe de personnes.

Les 2 versions doivent être équivalentes ou très semblables (nombre items, limite de temps, etc.)

Le coefficient de fidélité est la corrélation entre les scores obtenus aux 2 versions du test.

38
Q

Forces

A

Permet d’évaluer la source d’erreur de mesure attribuable au contenu du test.
o Peut également évaluer l’influence des variations liées aux conditions d’administration et aux circonstances personnelles.

39
Q

Faiblesses

A

Peu utilisé, bcp de travail. peu de tests sont offerts en plus d’une version
Applicable surtout aux tests de rendement ou d’aptitudes, et quand ils sont destinés à être répondus plus d’une fois.

40
Q

Fidélité de cohérence interne (internal consistency reliability)
3 composantes

A

Coefficient de fidélité par bissection
Formules de Kuder-Richardson
Coefficient d’Alpha de Cronbach

41
Q

Coefficient de fidélité par bissection (split-half realiability) :

A

 Administration d’un seul test → division du test en 2 moitiés → corrélation entre les moitiés.
 Fidélité pair-impair (division du test en items pairs et impairs).
 La corrélation donne la fidélité de seulement la moitié du test, il est donc nécessaire de faire une correction à la corrélation entre les 2 moitiés (correction de Spearman-Brown)

42
Q

Formules de Kuder-Richardson (Kuder-Richardson :

A

 Formule KR-20 → permet d’obtenir la corrélation
moyenne pour toutes les bissections possibles du test.
 Formule KR-21 → permet d’estimer la fidélité lorsqu’on connaît seulement la moyenne et l’écart- type.

Les formules s’appliquent seulement à des items répondus sur une échelle dichotomique.
Elles ne sont pas très utilisées actuellement (démodées).

43
Q

Coefficient d’Alpha de Cronbach (Cronbach’s Alpha)

A

L’Alpha (α) indique dans quelle mesure les items mesurent le même construit du test.
 C’est une mesure de l’homogénéité des items : degré dans lequel les items mesurent la même chose.
 Il a une valeur de 0 à 1 (plus près du 1 → plus de cohérence interne).
 C’est le coefficient de cohérence interne le plus utilisé.

44
Q

Alpha de Cronbach

A

o La fidélité (α) augmente avec le nombre d’items.
o Une augmentation de la corrélation inter-items (r ) correspond à une augmentation de la fidélité (α).

45
Q

Avec un petit nombre d’items :

A
  1. La fidélité (α) est faible quand la corrélation inter- item (r ) est faible.
  2. La fidélité (α) est forte quand la corrélation inter-item (r ) est forte.
46
Q

Avec un grand nombre d’items :

A

La fidélité (α) est bonne, indépendamment de si la corrélation inter-item (rij) est forte ou non.

47
Q

Fidélité cohérence interne de l’alpha de Cronbach

A

 La valeur de l’alpha permet d’évaluer la source d’erreur de mesure attribuable à la sélection/contenu des items.
 Il ne mesure pas d’autres sources d’erreur, comme l’administration du test ou la présence de circonstances personnelles.

48
Q

Erreur type de mesure

A

Écart-type d’un nombre théorique infini de scores obtenus pour mesurer le score vrai d’une personne.
Si la fidélité du test était parfaite, l’erreur type de mesure serait 0 (sans erreur de mesure).

49
Q

Intervalle de confiance

A

Zone autour du score observé, où la présence du score vrai est très probable. Calculée à partir de l’erreur type de mesure.
 P. ex. pour un score brut de 25 (score observé), il pourrait y avoir une intervalle de confiance de 20-30 (très probable que le score vrai se situe entre 20 et 30).
 Lorsqu’on dit qu’il y a une intervalle de confiance de 95%, cela veut dire qu’il y a 95% de probabilité que le score vrai se situe dans l’intervalle.

50
Q

Erreur type de mesure

A

écart-type d’une population hypothétique de scores observés, distribués autour d’un score vrai.
C’est un indice de l’erreur attribuable à un manque de fidélité (différences entre le score observé et le score vrai).

51
Q

Erreur type de la moyenne

A

écart-type d’une population hypothétique
d’échantillonnage de moyennes, distribuées autour de la population moyenne.

 C’est un indice de l’erreur attribuable à un échantillonnage aléatoire (résultats différents su d’autres cas étaient sélectionnés lors de l’échantillonnage)

52
Q

Erreur type d’estimation

A

écart-type des scores Y réels autour des scores Y estimés, lorsque la prédiction repose sur X.

 C’est un indice de l’erreur de l’estimation, au moment de prédire les scores de Y, à partir des scores de X

53
Q

Fidélité dans les rapports narratifs

A

o L’information de la fidélité est présentée dans des termes quantitatifs, au moyen d’un coefficient de fidélité (p.ex. un alpha de Cronbach de 0.80).

o Difficile de « traduire » le coefficient en forme « narrative ».

o Pour bien interpréter les résultats, un rapport devrait inclure la notion d’erreur de mesure (p.ex. inclure des intervalles de confiance pour chaque score)

54
Q

Fidélité des items et des sous-tests

A

o Le fait que l’échelle totale (score total) d’un questionnaire ait une bonne fidélité n’implique pas que les sous-tests ou les items individuels aient aussi une bonne fidélité.

o Il faudrait faire des analyses de fiabilité avec les sous-tests ou dimensions du questionnaire.

55
Q

Fidélité des tests critériés (de rendement)

A
  • Besoin d’employer d’autres méthodes pour évaluer la fidélité
  • Commentaire applicable seulement à des tests de rendement. P.ex. un examen de connaissance de stats, où l’enseignent détermine de façon arbitraire quelle est la note de passage.
56
Q

Théorie classique de tests VS. Théorie de la réponse à l’item (TRI)

A

Tout le contenu abordé à propos de la fidélité a été basé sur la théorie classique de tests.
o La grande majorité des tests existants sont fondés sur la théorie classique de tests.
o La théorie de la réponse à l’item (TRI) aborde la fidélité seulement sous l’angle de la cohérence interne.
o Dans la TRI, la fidélité repose sur le fonctionnement des items : Chaque item est indépendant et peut influencer d’une façon distincte le score total.

57
Q

Théorie de la généralisabilité (generalizability theory)

A

-> essaie évaluer simultanément plusieurs types de fiabilité (et sources d’erreurs)
o Au lieu de faire plusieurs études, faire une seule grande étude où : la personne se prête à des tests à plusieurs occasions, dans toutes sortes de versions de test et avec plusieurs évaluateurs différents.
o Si on fait le précédent, on obtiendrait le score univers (équivalent du score vrai de la théorie classique).
C’est une perspective intéressante…
o Mais, elle ne connaît pas encore beaucoup d’applications pratiques.
o Il est très difficile, sur le plan pratique, de mener ce type d’études…

58
Q

Quel degré de fidélité devrait-on viser?

A

Si l’on doit prendre une décision très importante à la lumière des résultats d’un test, on doit utiliser un test très fidèle.

Si le test n’est qu’une source d’info parmi d’autres, on peut utiliser un taux de fidélité modéré