Cours 7 Flashcards

1
Q

Comment se définit la fidélité (ou fiabilité)?

A

La fidélité, ou fiabilité, d’un test psychométrique est une mesure essentielle de la qualité du test. Elle se habituellement définit comme le degré de précision (cohérence) et de constance temporelle des scores obtenus.

Par exemple, un test doit produire des résultats très similaires lorsque les conditions de passation sont identiques à celles appliquées à l’échantillon normatif.

La fidélité est formellement définie comme le rapport entre la variance vraie et la variance totale du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’on attend des scores d’un test?

A

On attend des scores d’un test qu’ils présentent la plus petite marge d’erreur possible, c’est-à-dire une variance d’erreur minimale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la formule expliquant la variance de la variable observable?

A

X = t + e

X = variable observable
t = variance vraie/réelle
e = variance d’erreur

Malheureusement, ce modèle est considéré « non identifié » (unidentified)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux. Toute condition non pertinente à l’objectif d’un test représente la variance d’erreur.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment les examinateurs peuvent réduire l’erreur de mesure?

A

Si les examinateurs s’efforcent de maintenir des conditions de test uniformes en contrôlant l’environnement du test, les consignes, les limites de temps, le climat interpersonnel avec les sujets, ils réduisent ainsi l’erreur de mesure (c’est-à-dire la variance d’erreur) et rendent les scores obtenus aux tests plus fiables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi les tests doivent être accompagnés d’un rapport sur son degré de fidélité?

A

Malgré tous les efforts, aucun test n’est parfaitement fidèle (100 %). Ainsi, tout test doit être accompagné d’un rapport sur son degré de fidélité (ou indice de fidélité), qui reflète la précision avec laquelle le test mesure un construit donné.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

À quelles conditions le degré de fidélité peut bien représenter le test?

A

Cet indice de fidélité représente bien le test, à condition qu’il soit administré dans les mêmes conditions standardisées et à des personnes similaires à celles composant l’échantillon normatif (échantillon utilisé pour qu’on puisse calculer les normes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui doit être présenté avec le degré de fidélité?

A

Les caractéristiques de cet échantillon (par exemple, l’âge, le sexe, le niveau d’instruction) devraient être clairement présentées, ainsi que les types de fidélité évalués (par exemple, la fidélité test-retest, la cohérence interne, la cohérence inter-juges…).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que la colinéarité?

A

Deux choses qui corrèlent fortement ensemble.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qui peut faire varier la fidélité?

A

Il est important de noter que la fidélité d’un test peut varier en fonction du contexte d’administration. Par exemple, des changements dans les conditions environnementales, les consignes données ou la population cible peuvent influencer la fiabilité des résultats. Par conséquent, connaître le degré de fidélité permet à l’utilisateur de mieux comprendre les limites du test et de l’interpréter correctement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que signifie une faible fidélité et une fidélité élevée?

A

Une faible fidélité peut signifier que les résultats sont affectés par des erreurs de mesure, tandis qu’une fidélité élevée indique que le test produit des résultats cohérents et reproductibles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pour garantir une interprétation valable des résultats, que faut-il considérer?

A

En somme, pour garantir une interprétation valable des résultats, il est essentiel de considérer la fidélité du test dans le contexte spécifique où il est utilisé, en s’assurant que les conditions d’administration et la population cible restent proches de celles de l’échantillon normatif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’exprime un coefficient?

A

Une corrélation, donc il varie entre 0 (aucune corrélation, donc aucune fiabilité) et 1 (corrélation parfaite, donc fiabilité parfaite).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que mesure un coefficient de fidélité?

A

Dans quelle mesure un test donne des résultats cohérents et stables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les valeurs minimales recommandées pour le contexte clinique et de recherche?

A

Contexte clinique : 0,8 ou plus est souvent requis, car les décisions cliniques nécessitent des résultats fiables et précis

Contexte de la recherche : 0,7 ou plus est souvent considéré comme acceptable, ar il peut y avoir un peu plus de tolérance pur une certaine marge d’erreur, surtout dans les études exploratoires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Les tests d’intelligence tendent à avoir des coefficients de fidélité élevés ou modérés?

A

Élevés (souvent entre 0,85 et 0,90) comme les tests de Wechsler.

Cela est essentiel pour s’assurer que les scores mesurent de manière cohérente les aptitudes intellectuelles dans diverses populations et à travers plusieurs administrations du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment les seuils conventionnels des valeurs indiqués dans les coefficient de fidélité varient?

A

Ils peuvent varier en fonction du domaine, du type de test, et des exigences spécifiques à une étude. Certaines études ou champs d’application peuvent tolérer des coefficients de fidélité plus faibles, tandis que d’autres exigent des niveaux plus élevés, surtout lorsque les décisions à fort enjeu (comme en clinique) dépendent de ces mesures.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quels sont les types de fidélité?

A

Fidélité par test-retest;
Fidélité par versions parallèles;
Fidélité par bissection;
Fidélité par homogénéité;
Fidélité par équivalence inter-juges.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

À quoi consiste la fidélité par test-retest?

A

Cette approche consiste à administrer le même test à deux moments distincts aux mêmes sujets.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quel est le coefficient de fidélité calculé dans la fidélité test-retest?

A

La corrélation entre les scores obtenus par les mêmes individus lors des deux administrations du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que reflète la fidélité test-retest?

A

La fidélité test-retest reflète dans quelle mesure les scores peuvent être généralisés à travers différentes occasions de passation. Plus la fidélité test-retest est élevée, moins les scores des sujets sont susceptibles d’être affectés par des sources d’erreurs liées au temps ou aux conditions de passation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelles sont les sources d’erreur dans la fidélité test-retest?

A

Les sources d’erreurs dans la fidélité test-retest incluent les fluctuations aléatoires de la performance d’une session à l’autre. Ces variations peuvent être dues, en partie, à des conditions de test mal contrôlées, mais également à des changements internes chez le sujet entre les deux passations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Dans la fidélité test-retest, que signifie une coefficient de corrélation élevé?

A

Plus le coefficient de corrélation test-retest est élevé, plus l’instrument démontre une bonne fidélité ou stabilité temporelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quels sont les avantages de la fidélité test-retest?

A
  • Évaluation directe de la stabilité temporelle : Un coefficient élevé indique que l’instrument produit des résultats stables et cohérents dans le temps.
  • Appropriée pour les traits stables : La fiabilité test-retest est particulièrement utile pour évaluer des traits ou des caractéristiques stables dans le temps, comme les traits de personnalité, les compétences ou les habiletés intellectuelles. Si les résultats ne changent pas significativement d’une session à l’autre, cela reflète une bonne stabilité de la mesure.
  • Facile à interpréter : Le coefficient de corrélation obtenu est facile à interpréter : une valeur proche de 1 indique une grande stabilité, tandis qu’une valeur proche de 0 indique une grande variabilité entre les sessions.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Quels sont les inconvénients de la fidélité test-retest?

A
  • Effet de mémoire : Les participants peuvent se souvenir des réponses qu’ils ont données lors de la première session, ce qui peut influencer leurs réponses lors de la deuxième session. Ce biais de rappel peut entraîner une surestimation de la fiabilité, car les réponses ne reflètent pas nécessairement la constance du trait mesuré, mais plutôt la mémoire des réponses.
  • Variations internes et externes entre les sessions : Les changements internes chez les participants (fatigue, humeur, motivation) ou les facteurs environnementaux (bruit, conditions de test) peuvent influencer les résultats entre les deux sessions, même si l’instrument est fiable. Ces fluctuations peuvent entraîner une sous-estimation de la fiabilité.
  • Difficulté à définir l’intervalle de temps optimal entre les tests : Déterminer un intervalle de temps approprié entre les deux administrations du test est délicat. Un intervalle trop court peut augmenter l’effet de mémoire, tandis qu’un intervalle trop long peut entraîner des changements réels chez les participants, ce qui rend difficile l’évaluation de la stabilité du test.
  • Temps et coûts supplémentaires : La méthode test-retest nécessite deux administrations du test, ce qui peut être coûteux en termes de temps et de ressources. Elle demande également que les participants soient disponibles deux fois, ce qui peut parfois être un défi logistique.
  • Pas toujours appropriée pour les traits de personnalité (Confiance en soi situationnelle) ou états émotionnels variables (anxiété) : Cette méthode n’est pas adaptée pour les traits ou états changeants dans le temps. Dans ces cas, les variations dans les résultats reflètent des changements réels dans l’état du participant plutôt qu’un manque de fiabilité.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Comment la fidélité par versions parallèles évalue la fiabilité?

A

La fidélité par versions parallèles, ou méthode d’équivalence, évalue la fiabilité d’un test en administrant deux versions différentes mais équivalentes à un même groupe de sujets. Ces versions doivent mesurer le même construit de manière similaire, mais avec des items différents.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Comment le coefficient de fidélité est calculé en fidélité par versions parallèles?

A

Le coefficient de fidélité est calculé en corrélant les scores obtenus lors des deux passations. Une forte corrélation indique que les versions sont cohérentes et mesurent de manière fiable le même concept, malgré les différences d’items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Comment assurer un parallélisme rigoureux lors de la création ou de l’utilisation de versions parallèles?

A
  • Les versions doivent couvrir le même contenu et avoir une structure équivalente, même si le nombre d’items diffère légèrement.
  • Le niveau de difficulté des items doit être statistiquement similaire (p < 0,05).
  • Les consignes, le temps alloué, les exemples et le format de présentation doivent être identiques entre les versions.
  • Il est important de vérifier que les interprétations des scores restent cohérentes et comparables entre les différentes versions, pour garantir l’équité des résultats.
29
Q

Quels sont les avantages de la fidélité par versions parallèles?

A
  • Évaluation de la constance du construit :
    En utilisant deux versions différentes mais équivalentes d’un test, cette méthode permet de vérifier si le construit mesuré est cohérent, même avec des items différents. Cela montre la robustesse de l’instrument à travers diverses formes.
  • Réduction de l’effet de mémoire :
    Contrairement à la méthode test-retest, où les sujets peuvent se souvenir de leurs réponses précédentes, les versions parallèles minimisent cet effet, car les items sont différents dans chaque version. Cela permet de mieux isoler la fiabilité réelle du test.
  • Utilisation dans des contextes variés :
    Les versions parallèles sont particulièrement utiles dans des contextes où le test est administré plusieurs fois, ou dans des études longitudinales. Elles permettent de réévaluer le même construit sans réexposer les sujets aux mêmes items.
  • Mesure de plusieurs facettes d’un même concept :
    Les versions parallèles permettent d’explorer différentes facettes d’un même construit, en variant légèrement la formulation des items. Cela renforce la compréhension globale du construit et peut élargir l’utilité de l’instrument dans des contextes différents tout en conservant la cohérence des résultats.
30
Q

Quels sont les inconvénients de la fidélité par versions parallèles?

A
  • Difficulté de créer des versions «vraiment équivalentes» :
    Il est souvent difficile de créer deux versions qui soient parfaitement parallèles en termes de contenu, de difficulté et de structure. Même de légères différences peuvent introduire des variations dans les scores qui ne sont pas liées au construit mesuré.
  • Coût en temps et en ressources :
    Concevoir plusieurs versions parallèles demande beaucoup de temps et de ressources. Il faut développer, tester, puis valider chaque version pour s’assurer qu’elles mesurent exactement la même chose avec une difficulté comparable.
  • Complexité des analyses statistiques :
    Comparer deux versions parallèles demande des analyses statistiques pour vérifier que les items des deux versions sont bien équivalents en termes de difficulté et de structure. Cela peut être un processus complexe et nécessite souvent l’utilisation de méthodes comme l’analyse factorielle confirmatoire.
  • Biais potentiel si les versions ne sont pas vraiment parallèles :
    Si les versions ne sont pas rigoureusement parallèles, les résultats peuvent être biaisés. Par exemple, une version pourrait être légèrement plus difficile que l’autre, ce qui affecterait la comparabilité des scores et fausserait l’estimation de la fiabilité.
31
Q

À quoi consiste la fidélité par bissection?

A

La fidélité par bissection (split-half), consiste à diviser les items du test en deux moitiés équivalentes et à calculer la corrélation entre les scores obtenus pour chaque moitié. Cette méthode permet de mesurer la cohérence interne du test, c’est-à-dire dans quelle mesure les deux moitiés évaluent la même caractéristique psychologique

32
Q

Quelle formule est-il couramment utilisé afin d’obtenir une estimation plus précise de la fiabilité dans la fidélité par bissection?

A

Afin d’obtenir une estimation plus précise de la fiabilité, il est courant d’utiliser la formule de Spearman-Brown, qui ajuste le coefficient de corrélation pour refléter la fiabilité du test complet.

33
Q

Quels sont les avantages de la fidélité par bissection?

A
  • Facilité d’application :
    La méthode est simple à mettre en œuvre et ne nécessite qu’une seule administration du test, ce qui la rend rapide et efficace.
  • Évaluation de la cohérence interne :
    Elle permet de vérifier si les deux moitiés sont cohérents.
  • Réduction de l’effet de fatigue :
    Puisqu’il s’agit d’une seule administration, les erreurs liées à la fatigue sont minimisées comparées aux méthodes nécessitant plusieurs passations.
  • Utilisation efficace des données :
    Elle permet de maximiser l’utilisation des données disponibles sans nécessiter une collecte de données supplémentaire.
34
Q

Quels sont les inconvénients de la fidélité par bissection?

A
  • Problème de division :
    Il peut être difficile de diviser le test en deux moitiés absolument équivalentes, ce qui peut biaiser les résultats de la corrélation.
  • Fiabilité sous-estimée :
    La méthode peut parfois sous-estimer la fiabilité réelle du test, surtout si la division des items n’est pas optimale ou équitable.
  • Sensibilité à la méthode de division :
    Le coefficient de fiabilité peut varier selon la façon dont le test est divisé, ce qui limite la précision de la mesure si la division n’est pas aléatoire ou bien équilibrée.
35
Q

Qu’est-ce qu’examine la fidélité par homogénéité?

A

La fidélité par homogénéité, ou cohérence interne, examine à quel point les items d’un instrument ou d’une échelle (dimension) sont étroitement liés et mesurent «un construit» (ou variable latente) de façon cohérente.

36
Q

Qu’est-ce qu’un bon niveau de cohérence dans la fidélité par homogénéité signifie?

A

Un bon niveau de cohérence indique que les items reflètent de manière cohérente le concept psychologique étudié.

37
Q

Par quoi est souvent mesuré l’indice de fidélité dans la fidélité par homogénéité?

A

L’indice de fidélité est souvent mesuré par des coefficients comme l’alpha ordinal, Omega ou fidélité composite. Des résultats élevés suggèrent que les items sont internements, tandis qu’un résultat faible indique un manque de cohésion entre les items.

38
Q

Quels sont les avantages de la fidélité par homogénéité?

A
  • Facilité de calcul :
    Les indices sont faciles à calculer à partir des données d’une seule administration.
  • Évaluation directe de la cohésion :
    Permet de vérifier si tous les items sont cohérant.
  • Adapté aux tests unidimensionnels :
    particulièrement utile pour des instruments évaluant une seule dimension.
  • Économie de temps :
    une seule passation est nécessaire, économisant temps et ressources.
39
Q

Quels sont les inconvénients de la fidélité par homogénéité?

A
  • Ne détecte pas l’hétérogénéité :
    Si le test mesure plusieurs dimensions, la cohérence interne peut être trompeuse car elle n’évalue que la cohésion des items sans vérifier la validité multidimensionnelle.
  • Sensibilité à la longueur du test:
    Les tests plus longs ont tendance à produire des résultats plus élevés, ce qui peut donner l’impression d’une cohérence interne élevée même si les items ne sont pas tout à fait cohérents.
  • Influencé par la redondance des items :
    Si les items sont trop similaires ou redondants, cela peut artificiellement augmenter la cohérence interne sans réellement améliorer la qualité du test.
40
Q

Qu’est-ce que la fidélité inter-correcteur (inter-juges) mesure?

A

La fidélité inter-correcteur (inter-juges) mesure le degré d’accord entre deux ou plusieurs évaluateurs qui jugent indépendamment le même ensemble d’items.

41
Q

Dans quels contextes la fidélité par inter-correcteurs est particulièrement utile?

A

Cette méthode est particulièrement utile lorsque les évaluations sont subjectives, comme des symptômes cliniques en psychologie.

42
Q

Avec quoi la fidélité par inter-correcteurs est souvent calculée?

A

Elle est souvent calculée à l’aide de mesures statistiques comme le coefficient de corrélation intra-classe (CCI), le kappa de Cohen, ou d’autres indices d’accord inter-juges comme le CVC (coefficient de validité de contenu). Un accord élevé entre les juges indique que l’évaluation est fiable et cohérente entre les correcteurs.

43
Q

Quels sont les avantages de fidélité par inter-correcteurs?

A
  • Évaluation de la subjectivité :
    Comme celles des performances ou des symptômes cliniques, en s’assurant qu’elles ne varient pas trop d’un évaluateur à l’autre.
  • Identification des biais d’évaluation :
    Permettant «corriger» juges pour garantir des évaluations plus objectives.
  • Application dans plusieurs domaines :
    Comme le travail, l’éducation et la psychologie, où les évaluations qualitatives ou subjectives sont fréquentes.
  • Mesure de la cohérence entre les juges :
    Un accord élevé entre correcteurs montre que les juges utilisent des critères similaires, ce qui améliore la validité des résultats obtenus.
44
Q

Quels sont les inconvénients de la fidélité par inter-correcteurs?

A
  • Dépendance aux compétences des évaluateurs :
    Résultats peuvent être influencés par les compétences des juges. Des évaluateurs moins qualifiés peuvent diminuer la fiabilité inter-juges.
  • Coûts en temps et en ressources :
    Nécessite plusieurs évaluateurs et des analyses statistiques supplémentaires, ce qui peut être coûteux en temps et en ressources.
  • Variabilité dans les critères :
    Même avec un bon accord, les juges peuvent avoir des critères légèrement différents d’interprétation.
  • Complexité des analyses :
    Bonne compréhension des statistiques pour assurer bonne interprétation.
45
Q

Qu’est-ce que des tests de vitesse?

A

Les tests de vitesse sont des évaluations où le temps est un facteur clé. Ils consistent à mesurer la capacité d’un individu à effectuer le plus grand nombre possible d’items ou de tâches dans un laps de temps limité. La fidélité dans ce type de test est souvent évaluée en fonction de la constance des performances sous contrainte de temps.

46
Q

Quelles sont les caractéristiques des tests de vitesse?

A

Les tests de vitesse incluent des items généralement simples, que la plupart des individus peuvent accomplir. Ce qui est mesuré, c’est la rapidité avec laquelle les tâches peuvent être terminées et réussies.

47
Q

Comment la fidélité est évaluée dans les tests de vitesse?

A

La fidélité des tests de vitesse est souvent mesurée par des méthodes telles que la fidélité test-retest ou la méthode de bissection, en s’assurant que les résultats sont cohérents à travers différentes administrations ou parties du test.

48
Q

Qu’est-ce que les tests de puissance?

A

Les tests de puissance se concentrent sur le niveau de difficulté des items. Ils mesurent la capacité d’un individu à résoudre des tâches complexes et/ou difficiles, sans limite de temps stricte, mais avec un accent mis sur la qualité et la précision des réponses.

49
Q

Quelles sont les caractéristiques des tests de puissance?

A

Les items dans les tests de puissance varient en difficulté et visent à évaluer le potentiel ou les capacités intellectuelles maximales d’une personne. Il ne s’agit pas de compléter un grand nombre d’items rapidement, mais plutôt de réussir les tâches les plus complexes.

50
Q

Comment la fidélité est évaluée dans les tests de puissance?

A

La fidélité des tests de puissance est généralement évaluée par des méthodes comme la cohérence interne pour s’assurer que les items du test sont liés et mesurent de façon cohérent le même construit.

51
Q

Quelle est une des qualités importantes des tests de vitesse et des tests de puissance?

A

Les tests de vitesse et les tests de puissance sont conçus pour éviter les scores parfaits, et cela pour plusieurs raisons liées à la discrimination psychométrique, qui est unes des qualités importantes des tests :

52
Q

Qu’est-ce que la discrimination psychométrique?

A

La discrimination est la capacité d’un test à différencier les individus sur la base de leurs compétences ou capacités. Un test qui permet des scores parfaits (c’est-à-dire que tous les participants atteignent le score maximal) n’a plus cette capacité de discrimination, car il ne différencie plus les participants en fonction de leurs aptitudes.

Par exemple, si un test est trop facile et que tout le monde obtient le score maximal, il devient impossible de savoir qui est réellement plus performant, puisque les résultats n’offrent aucune distinction entre les participants. Un test perd ainsi son pouvoir de discrimination.

53
Q

Quel est le problème d’un score parfait?

A

Un score parfait empêche d’évaluer les compétences réelles d’un individu. Il devient impossible de savoir si la personne aurait pu obtenir un meilleur score avec des items plus difficiles ou un test plus long, créant ainsi une limite artificielle à l’évaluation.

54
Q

Qu’est-ce que permet d’empêcher un score parfait dans les tests de vitesse?

A

Dans les tests de vitesse, la performance est limitée par le temps et non la difficulté. Si un participant termine toutes les tâches, cela pourrait indiquer qu’il aurait pu en faire plus avec plus de temps. Empêcher un score parfait permet de mieux estimer la capacité réelle..

55
Q

Qu’est-ce que permet d’éviter un score parfait dans les tests de puissance?

A

Dans les tests de puissance, la difficulté varie. Si tous les participants réussissent 1a tous les items, il devient difficile de différencier les niveaux de compétence. Éviter un score parfait permet aux items de rester discriminants et de mieux évaluer les capacités individuelles.

56
Q

Qu’est-ce que l’erreur standard de mesure (ESM) ou l’erreur type de mesure (ETM)?

A

L’erreur standard de mesure (ESM) ou l’erreur type de mesure (ETM) est une mesure essentielle en psychométrie. Elle quantifie l’ampleur des erreurs aléatoires dans un test et aide à estimer dans quelle mesure un score observé peut diverger du score vrai.

57
Q

Un score observé (ou manifesté) est composé de :

A
  • Score vrai : Représente les capacités réelles de l’individu.
  • Erreur de mesure : Facteurs aléatoires qui influencent le score (fatigue, stress, etc.).
58
Q

Comment se calcule l’erreur type de mesure?

A

L’erreur type de mesure se calcule grâce à l’écart-type des scores et à la fidélité du test.

La formule est : 𝐸𝑇𝑀=𝜎√(1−𝑟)

Où :
𝜎 = écart-type des scores observés;
r = coefficient de fidélité du test (généralement mesuré par des méthodes comme l’Alpha ordinal, Omega ou le méthode test-retest, entre autres).

59
Q

Qu’est-ce que permet l’ETM?

A

L’ETM permet d’évaluer la précision d’un score en tenant compte des erreurs aléatoires toujours présentes dans un test.

60
Q

Comment interpréter les résultats de l’ETM?

A
  • Faible ETM : Moins de 5 % du score total de la personne. Cela indique que l’incertitude liée aux erreurs aléatoires est faible, ce qui signifie que le score observé est proche du score vrai.
  • ETM modérée : Entre 5 % et 10 %. Une ETM modérée montre une certaine incertitude. Le score observé peut s’écarter du score vrai de manière importante ou significative, mais reste dans une marge acceptable.
  • ETM élevée : Supérieure à 10 %. Cela reflète une plus grande imprécision dans les résultats, ce qui signifie que le score observé est probablement très éloigné du score vrai en raison d’une plus forte présence d’erreurs aléatoires.
61
Q

Quel est le lien entre l’ETM et la fidélité?

A

Plus un test est fidèle (coefficient de fidélité élevé), plus l’ETM est faible.
* Fidélité élevée = faible ETM, signifiant que le test est précis.
* Fidélité faible = ETM élevée, ce qui indique plus d’incertitude dans les résultats observés.

62
Q

Quelles sont les applications concrètes de l’ETM?

A
  • Évaluer la précision des scores individuels : Calcul d’un intervalle de confiance autour d’un score.
  • Comparer la précision des tests : Un test avec une faible ETM est plus précis.
  • Prendre des décisions : Dans des contextes cliniques ou professionnels, l’ETM aide à estimer la marge d’erreur d’un score.
63
Q

Décris l’exemple de QI de Marcos pour bien comprendre l’ETM?

A

Imaginons que nous ayons testé 100 fois le QI de Marcos. En raison des divers types d’erreurs aléatoires possibles, les résultats des tests varient (nous n’obtenons pas toujours exactement le même score, évidemment). Après avoir analysé ces 100 résultats, nous pouvons interpréter la moyenne de cette distribution comme une estimation du score vrai du QI de Marcos.

De même que pour tout écart-type, l’ETM (Erreur Type de Mesure) s’interprète à l’aide des pourcentages associés aux divers segments de la distribution normale. Par exemple, environ 68% des individus se situent entre -1 et +1 écart-type. On peut donc conclure qu’environ 68% des scores de Marcos se regrouperont entre -1 et +1 ETM. En termes de probabilité, il y a environ deux chances sur trois (ou 68:32) que les réponses de Marcos se situeront dans cet intervalle (-1 et +1 ETM) autour de son QI réel.

64
Q

Quelles sont les limites de l’ETM?

A

L’ETM ne peut pas capturer tous les types d’erreurs. Elle ne prend en compte que les erreurs aléatoires (comme la fatigue, le stress), mais elle ne mesure pas les erreurs systématiques (erreurs dues à un biais dans le test, par exemple).

65
Q

Quelle est l’utilisation pratique de l’intervalle de confiance avec l’ETM?

A

Un intervalle de confiance autour d’un score observé peut être calculé avec l’ETM. Par exemple, si un individu obtient un score observé de 110 dans un test, et que l’ETM est de 5, un intervalle de confiance à 68 % se situera entre 105 et 115.

66
Q

Quelle est la relation entre ETM et l’objectif du test?

A

Plus l’objectif du test est important (sélection professionnelle, diagnostic clinique), plus il est crucial de minimiser l’ETM. Un test à fort impact doit avoir une faible ETM pour garantir des décisions justes et fiables.

67
Q

Quelles sont les contributions finales de l’ETM?

A
  • Limites de l’ETM
  • L’intervalle de confiance avec l’ETM
  • Relation entre ETM et l’objectif du test
68
Q

Quelle est la conclusion de l’ETM?

A

L’ETM est une mesure clé pour évaluer la précision d’un test, mais elle a ses limites. Bien qu’elle permette de calculer un intervalle de confiance et de comprendre l’incertitude autour d’un score observé, elle n’élimine pas les erreurs systématiques et nécessite des conditions standardisées pour rester fiable. Un faible ETM est essentiel dans les tests à fort enjeu pour garantir des résultats justes.