Les normes de tests Flashcards

1
Q

À quoi sert une norme?

A

Le score brut ne veut rien dire. On doit le comparer à une norme pour pouvoir l’interpréter et en comprendre sa signification.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi un groupe de référence?

A

Le groupe utilisé qui représente la norme. La norme provient du groupe de référence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

C’est quoi un score brut, et, est-il utile?

A

C’est quoi score direct d’une personne. Il n’est pas utilise parce qu’il n’a pas de norme. Pour le comprendre, on doit le transformer : score transformé, ou score normé. C’est la somme des réponses dans un test. On doit parfois inversé le score selon le type de questions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est le type de score transformé (normalisé) le plus important à savoir? Pourquoi?

A

Le score Z, parce qu’une fois qu’on le comprend, on peut comprendre tous les types de normes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les variables peuvent être décrites selon trois niveaux. Lesquels?

A
  1. Un construit
  2. Une mesure
  3. Des données brutes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

VRAI OU FAUX?

Les statistiques descriptives aident à décrire et résumer les données.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les statistiques inférentielles servent à quoi?

A

Elles servent à tirer des conclusions sur ce qui est probablement vrai au sein de la population en fonction des données obtenus (découverte).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Il existe 4 types d’échelle en statistiques. Nommes les et donne un exemple pour chaque.

A
  1. Nominale : qualitative, classe et attribue des numéros. Exemple, être à Québec ou à Montréal, homme ou femme.
  2. Ordinale (échelle, ordre)
  3. À intervalles (égaux, pas de zéro absolu, exemple température)
  4. De rapport (intervalles égaux avec zéro absolu, exemple poids ou question type : combien de café consommé vous par jour? La réponse peut être zéro.)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

On peut organiser les données brutes de trois façons.

A

Par une distribution de fréquences, un histogramme de fréquences et un polygone de fréquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les mesures de tendance centrale? Donne la définition de tendance centrale.

A

La moyenne, la médiane et le mode.

C’est un indice qui détermine le centre autour duquel les données ont tendance à se regrouper.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les mesures de dispersion? Donne une définition de mesure de dispersion, ou en d’autres mots, à quoi elle sert.

A

L’étendue, l’écart-type, la variance et l’interquartile.
Elle permet de quantifier la variabilité autour des valeurs centrale. Elle permet de juger de la représentativité des mesures de tendance centrale. Sans écart-type, la moyenne ne veut pas dire grand chose.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

À quoi sert l’écart type? Peut-on le calculer à partir de la variance?

A

Il sert à voir la moyenne des résultats qui se regroupe autour de la moyenne.
Oui, car l’écart type est la racine carrée de la variance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Donne une définition de l’interquartile.

A

C’est la différence, ou l’écart entre le premier (25e) et le troisième quartile (75e) (transformé en percentile).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Mise en situation :
Le profil socioaffectif (PSA, LaFrenière et coll. 1992) demande aux enseignantes de répondre à 36 questions sur la fréquence de trois types de comportements pour les enfants de 3 à 5 ans sur une échelle de 6 points allant de jamais (1) à toujours (6).

Les résultats pour la compétence sociale (moyenne=4,3, 𝜎 =0,8), l’agressivité-irritabilité (moyenne=2,1, 𝜎 =0,8), l’anxiété-retrait (moyenne =1,9, 𝜎 =0,8) sont considérés comme préoccupants lorsqu’ils se situent à 2 écarts types sous la moyenne pour CS (5e centile) et au-dessus de la moyenne pour AI (95e centile) et AR (95e centile).

Identifier et expliquer les mesures de tendances centrales et de dispersion.

A

Les enfants ont en moyenne 4,3 pour la compétence sociale mais la plupart se situe à +/- 0,8 d’écart type de la moyenne. Donc, entre 3,5 (-0,8) et 5,1 (+0,8), c’est la bonne moyenne, à 1 écart type de la moyenne. On s’inquiète d’un enfant qui se situe à 2 écarts types sous la moyenne pour la compétence sociale. Donc, on ajoute un 0,8x2 = 1,6. On soustrait 1,6 de 4,3 ce qui fait 2,7. Ce score ou un score inférieur est cliniquement inquiétant. Pour le centile, ça nous dit simplement que lorsqu’un score correspond au 5e centile et mois, c’est inquiétant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la formule du score Z, sa moyenne et son écart type?

A

Z = X - M / ÉT
Où X est un score brute ou un point donné
M est la moyenne
ÉT est l’écart type
Dans une distribution des scores Z, M = 0 et ÉT = 1, peu importe la valeur des scores brutes initiaux.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

À quoi sert le score Z?

A

Il sert à déterminer les surfaces sur la courbe normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment on détermine l’échelle sur la distribution du score Z?

A

L’échelle est déterminé par l’ÉT. De plus, presque toutes les données se retrouvent à +/- 3 écart types de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les différentes types de courbes que peuvent prendre forme la distribution du score Z? (6)

A
  1. Normale
  2. Leptocurtique (très pointu)
  3. Platycurtique (pas du tout pointu)
  4. Asymétrie négative (bosse à droite, il y a une asymétrie à gauche)
  5. Asymétrie positive (bosse à gauche, il y a une asymétrie à droite)
  6. Bimodale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

C’est quoi la correction pour divination?

A

Ajuster un score brut, le transformé selon ce qu’on veut mesurer, par exemple sur une échelle de Likert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

C’est quoi les désavantages du score Z? Comment pallier ceux-ci?

A

Il y a présence de score négatifs pour tous les scores situés sur la moyenne. On a pas le choix d’utiliser des décimales parce que l’étendue est faible, ça devient aussi difficile à expliquer à cause de ça. Pour pallier ces inconvénients, on peut multiplier le score Z par 100 et on y additionne un nombre arbitraire par exemple 500. C’est ce que faire le score du SAT.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

C’est quoi le thêta et la théorie de réponse à l’item?

A

La théorie de réponse à l’item attribue que le score brut ne représente pas la somme des réponses à tous les items, à l’inverse de la théorie classique. Le score pour cette théorie est évalué en fonction des réponses de la personne avec les caractéristiques des items. Ce score est appelé thêta. Il ne prend pas juste en compte les réponses, mais les réponses de la personne selon les caractéristiques des items, par exemple selon le niveau de difficulté des items. Pourquoi ça été créé? Parce qu’une personne peut avoir le même score qu’une autre, alors qu’ils ont réussi des items différent qui varient en difficulté donc ne valent pas la même chose et qu’on ne doit pas évaluer le score de la même manière. Ça nous donne aussi la probabilité qu’un score ait été obtenu au hasard.

22
Q

Donnes moi les 4 différentes types de normes.

A
  1. Rangs percentiles
  2. Scores pondérés
  3. Les normes de développement
  4. Les relations entre les types de normes
23
Q

Décrit moi le rang percentile.

A

Le rang percentile indique la proportion des groupes de références qui se situent sous un score donné. Exemple, un score de 48 se situe à un rang percentile de 60, cela signifie que 60% des membres du groupe de référence ont obtenu un score égal ou inférieur à 48. Les percentiles vont de 1 à 99 (99,5) avec une médiane de 50.

24
Q

C’est quoi les forces et faiblesses des rangs percentiles?

A

Forces : Facile à comprendre et facile à calculer
Faiblesses : Souvent confondu avec pourcentage, donc quelqu’un qui ne connaît pas bien les rangs centiles pourrait penser qu’un percentile de 50 est mauvais, alors que c’est pile sur la moyenne. Aussi, l’inégalité des intervalles, soit que le score brut de la personne va affecter où elle se situera dans les percentiles et si elle se retrouvent aux extrémités plutôt qu’au centre, on ne va pas interpréter de la même manière ses points, en fait, le rang centile va interpréter différemment ses points.

25
Q

Donne moi un exemple qui montre que l’inégalité des intervalles des percentiles est un problème.

A

On prend les scores bruts du tests NEO-PI-R et les percentiles respectifs. Sous un continuum, il y a les scores bruts en haut avec chaque percentile en dessous. Du score brut 10 à 15, il y a 5 points entre les deux. C’est la même chose pour les percentiles (7-2). Alors que si on avance dans le pointage, du score brut 17 à 22 c’est encore 5 points, mais pour le percentile, ça devient 46 points. La progression de la personne est la même (5 points), mais le rang centile donne une autre impression.

26
Q

C’est quoi un score pondéré?

A

Le score pondéré représente une famille de normes. Il y en a plusieurs, mais c’est un score qui part du score Z et qui aura une nouvelle M et ÉT respectif. Les scores pondérés proviennent d’une transformation linéaire lorsque la courbe est normale, et non linéaire lorsqu’elle n’est pas normale. Le score est donc aussi appelé score pondéré normalisé.

27
Q

Donne moi les types de scores pondérés. (6)

A
  1. Scores T
  2. SAT et GRE
  3. QI de déviation (et ancien QI d’âge mental)
  4. Stanines
  5. Équivalent de la courbe normale
  6. Scores pondérés à niveaux multiples
28
Q

Comment convertir un score brut en score pondéré?

A

Il faut d’abord trouver la M et l’ÉT, pour trouver le score Z. En ayant le score Z, on peut utiliser la formule : SP = (ÉTp / ÉTb)(X – Mb) + Mp
Où ÉTp = moyenne score pondéré et ÉTb = moyenne score brute

29
Q

Type de scores pondérés : Score T. C’est quoi ses caractéristiques?

A

C’est un score pondéré où M = 50 et ÉT = 10. L’étendue est de 20 (correspondant à -3z) à 80 (+3z).

30
Q

Type de scores pondérés : SAT et GRE. C’est quoi leurs caractéristiques?

A

Les deux font appels à un système de scores pondérés où M = 500 et ÉT = 100.

31
Q

Type de scores pondérés : QI de déviation. C’est quoi ses caractéristiques?

A

Un score pondéré où M = 100 et ÉT = 15 ou 16.
En comparaison avec le QI d’âge mental, où c’est am/ac x 100. On a remarqué que l’ÉT variait selon l’âge, il avait tendance à augmenter avec l’âge.

32
Q

Type de scores pondérés : Stanines. C’est quoi ses caractéristiques?

A

C’est une score pondéré où M = 5 et ÉT = 2 (enivron)
Son échelle est divisée en 9 intervalles égaux, mais la proportion des cas de la distribution eux varient. Les stanines sont dérivés des percentiles. Ils sont une transformation non linéaire des scores bruts (à moins que la distribution initiale soit normale).

33
Q

Quel type de score pondéré est beaucoup utilisé dans le milieu de l’éducation? Il peut avoir plusieurs types.

a) score T
b) stanines
c) SAT
d) QI

A

En partie b), mais c) aussi.

34
Q

Type de scores pondérés : Scores pondérés à niveaux multiples. C’est quoi?

A

Un test à niveaux multiples compte plusieurs volets, donc les scores pondérés sont modifiés en scores gradués.

35
Q

Après avoir vu en détail les différents types de scores pondérés (6), quels sont les avantages et les inconvénients de ces scores?

A

Avantages : Très pratique pour l’interprétation du rendement à un test donc conviennent bien aux calculs statistiques, ils sont flexibles, permettent d’éviter le problème d’inégalité des intervalles des percentiles

Inconvénients : Difficile à expliquer à des gens qui ne connaissent pas ça ou qui ne connaissent pas le score Z. Il faut toujours savoir la M et ÉT. Les équivalents de la courbe normale peut être confondue avec les centiles.

36
Q

Il existe des normes de développement.

Vrai ou faux?

A

Vrai, c’est le 3e type de norme.

37
Q

À quoi servent les normes de développement? Quelles sont les deux normes de développement les plus utilisés?

A

C’est lorsque le trait mesuré se développement systématiquement avec le temps. Les équivalents d’âge mental (tests d’aptitudes intellectuelles) et les équivalents de niveau scolaire (test de connaissances).

38
Q

Est-ce que les normes de développement sont utilisé dans d’autres domaines que l’âge mental et le niveau scolaire? Si oui, lesquels?

A

Oui, ils sont aussi utilisé lorsqu’il est question des théories de stades de développement, ainsi que dans les mesures anthropométriques (taille, poids).

39
Q

Quelles sont les forces et les faiblesses des normes de développement?

A

Forces : Interprétation naturelle et intuitive (on conçoit bien que les enfants franchissent des étapes), fournissent une base pour la mesure de la croissance

Faiblesses : Elles ne s’appliquent qu’aux variables où le mode de développement est clair (ex: ne s’applique pas à l’estime de soi), et ces variables perdent de l’importance lorsque la courbe s’applane. L’écart type n’est pas contrôlé étant donné le développement. Les équivalents de niveau scolaire sont aussi critiqué parce qu’il est possible d’obtenir un même score alors que le niveau scolaire n’est pas le même et le degré de difficulté non plus. Ceci peut s’appliquer à tout type de score normé. La TRI tend à réduire ce problème.

40
Q

Vrai ou faux?

Il existe des tables de normes comprenant le score pour plusieurs types de normes.

A

Vrai.

41
Q

Vrai ou faux?

La communication de la valeur ou de la signification d’un score brut est une étape facile pour un psychométricien.

A

Faux. C’est un défi. Il lui arrive de faire un rapport narratif pour expliquer la signification score brut obtenu.

42
Q

À part par l’entremise des tables de normes, comment un psychométricien peut communiquer ses résultats qui expliquent la signification d’un score brut?

A

Par le rapport narratif.

43
Q

Qu’est-ce qu’un rapport narratif?

A

C’est la description d’un score brut ou normé et interprété selon sa norme. Il pour fonction une traduction verbale de scores normés et une traduction verbale d’informations concernant la validité ou la fiabilité.

44
Q

C’est quoi l’effet Barnum?

A

C’est d’accepter des descriptions très vagues, qui sont probablement vraies pour tous mais ne contiennent aucun renseignement spécifique découlant du test.

45
Q

Comment on évite l’effet Barnum?

A

En faisant de la correction par le vide, soit d’enlever des mots ou même paragraphe et voir si on avait vraiment besoin de ça finalement, pour en garder que le nécessaire.

46
Q

Quels sont les différents groupes de références? Il y a en 7. On se rappelle qu’un groupe de référence sert de comparaison au score brut, selon notre norme. C’est l’ensemble des scores obtenus par les personnes.

A
  1. Normes internationales (entre les pays)
  2. Normes nationales
  3. Groupes de commodité (groupe d’une même région, tranche d’âge, etc. qui a un gros échantillon, exemple 1000)
  4. Normes d’utilisateurs (utilisateur d’un service, exemple centre jeunesse)
  5. Normes locales
  6. Normes institutionnels
  7. Normes de sous-groupes (tiré du groupe de référence global, sexe, ethnie, etc. utilise seulement s’il y a une différence significative entre ces sous-groupes)
47
Q

Qu’est-ce que l’interprétation critériée?

A

Ça consiste à baser notre interprétation sur des critères plutôt que sur des normes. Par exemple, les examens d’école se passent comme ça. Le correcteur ne se base pas sur les normes pour établir une note, mais bien sur les critères de correction. C’est le contraire de l’approche normative.

48
Q

Selon l’approche normative, on utilise une norme pour interpréter notre score brut, qui elle se base sur un groupe de référence. Comment fait-on pour savoir si notre groupe de référence est utile?

A

En vérifiant sa représentativité et sa stabilité, et en fonction des variables qui nous intéresse. La stabilité d’une norme est largement déterminée par la taille de son groupe de référence, c’est-à-dire le nombre d’individus dans le plan d’étalonnage. Il est crucial de connaître les caractéristiques d’un groupe pour en connaître son utilité : âge, sexe, niveau de compétence, niveau d’éducation, groupes ethniques, statut socioéconomique, région géographique, taille de la ville. On peut comparer un groupe cible à un groupe de référence pour voir la représentativité et la stabilité.

49
Q

Quels sont les deux effets qui affectent le groupe de référence?

A

L’effet de la non participation et de la motivation.

50
Q

La norme est-il dépendante au groupe de référence?

A

Lorsqu’on parle de qualité, oui. Une interprétation sera de qualité si le groupe de référence est de qualité. Les critères de qualité tournent autour de la représentativité.

51
Q

Il faut être prudent avec les normes locales.

Vrai ou faux?

A

Vrai, parce que sa représentativité peut facilement être biaisé étant donné l’échantillon qui doit être local.