cours 7 Flashcards

1
Q

La fidélité, ou fiabilité, d’un test psychométrique est

A

une mesure essentielle de la qualité du test. Elle se habituellement définit comme le degré de précision (cohérence) et de constance temporelle des scores obtenus.
Par exemple, un test doit produire des résultats très similaires lorsque les conditions de passation sont identiques à celles appliquées à l’échantillon normatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Essentiellement, toute condition non pertinente à l’objectif d’un test représente la

A

“variance d’erreur”.
Si les examinateurs s’efforcent de maintenir des conditions de test uniformes en contrôlant l’environnement du test, les consignes, les limites de temps, le climat interpersonnel avec les sujets, ils réduisent ainsi l’erreur de mesure (c’est-à-dire la variance d’erreur) et rendent les scores obtenus aux tests plus fiables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

La fidélité est formellement définie comme

A

le rapport entre la variance vraie et la variance totale du test.
On attend des scores d’un test qu’ils présentent la plus petite marge d’erreur possible, c’est-à-dire une variance d’erreur minimale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Fondamentalement 5 types:

A
  • Fidélité par test-retest;
    • Fidélité par versions parallèles;
    • Fidélité par bissection;
    • Fidélité par homogénéité;
    • Fidélité par équivalence inter-juges.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Fidélité par test-retest;

La fidélité test-retest (stabilité temporelle) est une méthode couramment utilisée pour évaluer la fiabilité d’un test. Cette approche consiste à _______________________________________________________________________.

Le coefficient de fidélité calculé (rtr) est la______________________________________________________________________________________

La fidélité test-retest reflète dans quelle mesure les scores peuvent être généralisés à travers différentes occasions de passation. Plus la fidélité test-retest est élevée, moins les scores des sujets sont susceptibles d’être affectés par des sources d’erreurs liées au temps ou aux conditions de passation

A

Fidélité par test-retest;
La fidélité test-retest (stabilité temporelle) est une méthode couramment utilisée pour évaluer la fiabilité d’un test. Cette approche consiste à administrer le même test à deux moments distincts aux mêmes sujets.
Le coefficient de fidélité calculé (rtr) est la corrélation entre les scores obtenus par les mêmes individus lors des deux administrations du test.
La fidélité test-retest reflète dans quelle mesure les scores peuvent être généralisés à travers différentes occasions de passation. Plus la fidélité test-retest est élevée, moins les scores des sujets sont susceptibles d’être affectés par des sources d’erreurs liées au temps ou aux conditions de passation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Fidélité par test-retest;
Les sources d’erreurs dans la fidélité test-retest incluent les _____________________________ de la performance d’une session à l’autre. Ces variations peuvent être dues, en partie, à des______________________________________, mais également à des _______________________________ chez le sujet entre les deux passations. Ainsi, plus le coefficient de corrélation test-retest est élevé, plus l’instrument démontre une bonne fidélité ou stabilité temporelle.

A

Fidélité par test-retest;
Les sources d’erreurs dans la fidélité test-retest incluent les fluctuations aléatoires de la performance d’une session à l’autre. Ces variations peuvent être dues, en partie, à des conditions de test mal contrôlées, mais également à des changements internes chez le sujet entre les deux passations. Ainsi, plus le coefficient de corrélation test-retest est élevé, plus l’instrument démontre une bonne fidélité ou stabilité temporelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Avantages de la méthode test-retest :
Évaluation directe de la stabilité temporelle :

Un coefficient élevé indique que

Appropriée pour les traits stables : La fiabilité test-retest est particulièrement utile pour

Si les résultats ne changent pas significativement d’une session à l’autre, cela reflète une bonne stabilité de la mesure.

Facile à interpréter : Le coefficient de corrélation obtenu est facile à interpréter : une valeur proche de________ indique une grande stabilité, tandis qu’une valeur proche de ____ indique une grande variabilité entre les sessions.

A

Avantages de la méthode test-retest :
Évaluation directe de la stabilité temporelle : Un coefficient élevé indique que l’instrument produit des résultats stables et cohérents dans le temps.
Appropriée pour les traits stables : La fiabilité test-retest est particulièrement utile pour évaluer des traits ou des caractéristiques stables dans le temps, comme les traits de personnalité, les compétences ou les habiletés intellectuelles. Si les résultats ne changent pas significativement d’une session à l’autre, cela reflète une bonne stabilité de la mesure.
Facile à interpréter : Le coefficient de corrélation obtenu est facile à interpréter : une valeur proche de 1 indique une grande stabilité, tandis qu’une valeur proche de 0 indique une grande variabilité entre les sessions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Inconvénients de la fiabilité test-retest:

_____________________: Les participants peuvent se souvenir des réponses qu’ils ont données lors de la première session, ce qui peut influencer leurs réponses lors de la deuxième session. Ce biais de rappel peut entraîner une surestimation de la fiabilité, car les réponses ne reflètent pas nécessairement la constance du trait mesuré, mais plutôt la mémoire des réponses.

_______________________________________ : Les changements internes chez les participants (fatigue, humeur, motivation) ou les facteurs environnementaux (bruit, conditions de test) peuvent influencer les résultats entre les deux sessions, même si l’instrument est fiable. Ces fluctuations peuvent entraîner une sous-estimation de la fiabilité.

A

Inconvénients de la fiabilité test-retest:
Effet de mémoire : Les participants peuvent se souvenir des réponses qu’ils ont données lors de la première session, ce qui peut influencer leurs réponses lors de la deuxième session. Ce biais de rappel peut entraîner une surestimation de la fiabilité, car les réponses ne reflètent pas nécessairement la constance du trait mesuré, mais plutôt la mémoire des réponses.
Variations internes et externes entre les sessions : Les changements internes chez les participants (fatigue, humeur, motivation) ou les facteurs environnementaux (bruit, conditions de test) peuvent influencer les résultats entre les deux sessions, même si l’instrument est fiable. Ces fluctuations peuvent entraîner une sous-estimation de la fiabilité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Inconvénients de la fiabilité test-retest:
_________________________________________ : Déterminer un intervalle de temps approprié entre les deux administrations du test est délicat. Un intervalle trop court peut augmenter l’effet de mémoire, tandis qu’un intervalle trop long peut entraîner des changements réels chez les participants, ce qui rend difficile l’évaluation de la stabilité du test.

_______________________________ : La méthode test-retest nécessite deux administrations du test, ce qui peut être coûteux en termes de temps et de ressources. Elle demande également que les participants soient disponibles deux fois, ce qui peut parfois être un défi logistique

A

Inconvénients de la fiabilité test-retest:
Difficulté à définir l’intervalle de temps optimal entre les tests : Déterminer un intervalle de temps approprié entre les deux administrations du test est délicat. Un intervalle trop court peut augmenter l’effet de mémoire, tandis qu’un intervalle trop long peut entraîner des changements réels chez les participants, ce qui rend difficile l’évaluation de la stabilité du test.
Temps et coûts supplémentaires : La méthode test-retest nécessite deux administrations du test, ce qui peut être coûteux en termes de temps et de ressources. Elle demande également que les participants soient disponibles deux fois, ce qui peut parfois être un défi logistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Inconvénients de la fiabilité test-retest:
_____________________________________________________________________________________________________________________________ : Cette méthode n’est pas adaptée pour les traits ou états changeants dans le temps. Dans ces cas, les variations dans les résultats reflètent des changements réels dans l’état du participant plutôt qu’un manque de fiabilité.

A

Inconvénients de la fiabilité test-retest:
Pas toujours appropriée pour les traits de personnalité (Confiance en soi situationnelle) ou états émotionnels variables (anxiété) : Cette méthode n’est pas adaptée pour les traits ou états changeants dans le temps. Dans ces cas, les variations dans les résultats reflètent des changements réels dans l’état du participant plutôt qu’un manque de fiabilité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  • Fidélité par versions parallèles;

La fidélité par versions parallèles, ou méthode d’équivalence, évalue la fiabilité d’un test en administrant deux versions différentes mais équivalentes à un même groupe de sujets. Ces versions doivent mesurer le même construit de manière similaire, mais avec des items différents. Le coefficient de fidélité est calculé en corrélant les scores obtenus lors des deux passations. Une forte corrélation indique que les versions sont cohérentes et mesurent de manière fiable le même concept, malgré les différences d’items.

A
  • Fidélité par versions parallèles;

La fidélité par versions parallèles, ou méthode d’équivalence, évalue la fiabilité d’un test en administrant deux versions différentes mais équivalentes à un même groupe de sujets. Ces versions doivent mesurer le même construit de manière similaire, mais avec des items différents. Le coefficient de fidélité est calculé en corrélant les scores obtenus lors des deux passations. Une forte corrélation indique que les versions sont cohérentes et mesurent de manière fiable le même concept, malgré les différences d’items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Fidélité par versions parallèles
Lors de la création ou de l’utilisation de versions parallèles, il est essentiel d’assurer un parallélisme «rigoureux» :

Les versions doivent couvrir le ____________________ et avoir une _________________________________, même si le nombre d’items diffère légèrement.

Le niveau de difficulté des items doit être statistiquement similaire (p < 0,05).
________________________________________________________ (4) doivent être identiques entre les versions.
Il est important de vérifier que les interprétations des scores restent cohérentes et comparables entre les différentes versions, pour garantir l’équité des résultats.

A

Fidélité par versions parallèles
Lors de la création ou de l’utilisation de versions parallèles, il est essentiel d’assurer un parallélisme «rigoureux» :
Les versions doivent couvrir le même contenu et avoir une structure équivalente, même si le nombre d’items diffère légèrement.
Le niveau de difficulté des items doit être statistiquement similaire (p < 0,05).
Les consignes, le temps alloué, les exemples et le format de présentation doivent être identiques entre les versions.
Il est important de vérifier que les interprétations des scores restent cohérentes et comparables entre les différentes versions, pour garantir l’équité des résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Fidélité par versions parallèles : Avantages

_____________________________________ :En utilisant deux versions différentes mais équivalentes d’un test, cette méthode permet de vérifier si le construit mesuré est cohérent, même avec des items différents. Cela montre la robustesse de l’instrument à travers diverses formes.

____________________________________________ :Contrairement à la méthode test-retest, où les sujets peuvent se souvenir de leurs réponses précédentes, les versions parallèles minimisent cet effet, car les items sont différents dans chaque version. Cela permet de mieux isoler la fiabilité réelle du test.

A

Fidélité par versions parallèles : Avantages
Évaluation de la constance du construit :
En utilisant deux versions différentes mais équivalentes d’un test, cette méthode permet de vérifier si le construit mesuré est cohérent, même avec des items différents. Cela montre la robustesse de l’instrument à travers diverses formes.
Réduction de l’effet de mémoire :
Contrairement à la méthode test-retest, où les sujets peuvent se souvenir de leurs réponses précédentes, les versions parallèles minimisent cet effet, car les items sont différents dans chaque version. Cela permet de mieux isoler la fiabilité réelle du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Fidélité par versions parallèles : Avantages
_______________________________________ :Les versions parallèles sont particulièrement utiles dans des contextes où le test est administré plusieurs fois, ou dans des études longitudinales. Elles permettent de réévaluer le même construit sans réexposer les sujets aux mêmes items.

__________________________________________________ :Les versions parallèles permettent d’explorer différentes facettes d’un même construit, en variant légèrement la formulation des items. Cela renforce la compréhension globale du construit et peut élargir l’utilité de l’instrument dans des contextes différents tout en conservant la cohérence des résultats.

A

Fidélité par versions parallèles : Avantages
Utilisation dans des contextes variés :
Les versions parallèles sont particulièrement utiles dans des contextes où le test est administré plusieurs fois, ou dans des études longitudinales. Elles permettent de réévaluer le même construit sans réexposer les sujets aux mêmes items.
Mesure de plusieurs facettes d’un même concept :
Les versions parallèles permettent d’explorer différentes facettes d’un même construit, en variant légèrement la formulation des items. Cela renforce la compréhension globale du construit et peut élargir l’utilité de l’instrument dans des contextes différents tout en conservant la cohérence des résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Fidélité par versions parallèles : Inconvénients
___________________________________________________ : Il est souvent difficile de créer deux versions qui soient parfaitement parallèles en termes de contenu, de difficulté et de structure. Même de légères différences peuvent introduire des variations dans les scores qui ne sont pas liées au construit mesuré.

__________________________________ :Concevoir plusieurs versions parallèles demande beaucoup de temps et de ressources. Il faut développer, tester, puis valider chaque version pour s’assurer qu’elles mesurent exactement la même chose avec une difficulté comparable.

A

Fidélité par versions parallèles : Inconvénients
Difficulté de créer des versions «vraiment équivalentes» :
Il est souvent difficile de créer deux versions qui soient parfaitement parallèles en termes de contenu, de difficulté et de structure. Même de légères différences peuvent introduire des variations dans les scores qui ne sont pas liées au construit mesuré.
Coût en temps et en ressources :
Concevoir plusieurs versions parallèles demande beaucoup de temps et de ressources. Il faut développer, tester, puis valider chaque version pour s’assurer qu’elles mesurent exactement la même chose avec une difficulté comparable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Fidélité par versions parallèles : Inconvénients
__________________________________ :Comparer deux versions parallèles demande des analyses statistiques pour vérifier que les items des deux versions sont bien équivalents en termes de difficulté et de structure. Cela peut être un processus complexe et nécessite souvent l’utilisation de méthodes comme l’analyse factorielle confirmatoire.

______________________________________________________ :Si les versions ne sont pas rigoureusement parallèles, les résultats peuvent être biaisés. Par exemple, une version pourrait être légèrement plus difficile que l’autre, ce qui affecterait la comparabilité des scores et fausserait l’estimation de la fiabilité.

A

Fidélité par versions parallèles : Inconvénients
Complexité des analyses statistiques :
Comparer deux versions parallèles demande des analyses statistiques pour vérifier que les items des deux versions sont bien équivalents en termes de difficulté et de structure. Cela peut être un processus complexe et nécessite souvent l’utilisation de méthodes comme l’analyse factorielle confirmatoire.
Biais potentiel si les versions ne sont pas vraiment parallèles :
Si les versions ne sont pas rigoureusement parallèles, les résultats peuvent être biaisés. Par exemple, une version pourrait être légèrement plus difficile que l’autre, ce qui affecterait la comparabilité des scores et fausserait l’estimation de la fiabilité.

17
Q

Fidélité par bissection
La fidélité par bissection (split-half), consiste à ________________ les items du test en deux moitiés équivalentes et à calculer la corrélation entre les scores obtenus pour chaque moitié. Cette méthode permet de mesurer la ____________________________ du test, c’est-à-dire dans quelle mesure les deux moitiés évaluent la même caractéristique psychologique. Afin d’obtenir une estimation plus précise de la fiabilité, il est courant d’utiliser la formule de Spearman-Brown, qui ajuste le coefficient de corrélation pour refléter la fiabilité du test complet.

A

Fidélité par bissection
La fidélité par bissection (split-half), consiste à diviser les items du test en deux moitiés équivalentes et à calculer la corrélation entre les scores obtenus pour chaque moitié. Cette méthode permet de mesurer la cohérence interne du test, c’est-à-dire dans quelle mesure les deux moitiés évaluent la même caractéristique psychologique. Afin d’obtenir une estimation plus précise de la fiabilité, il est courant d’utiliser la formule de Spearman-Brown, qui ajuste le coefficient de corrélation pour refléter la fiabilité du test complet.

18
Q

Fidélité par bissection : Avantages
_____________________________:La méthode est simple à mettre en œuvre et ne nécessite qu’une seule administration du test, ce qui la rend rapide et efficace.
______________________________________ :
Elle permet de vérifier si les deux moitiés sont cohérents.
_______________________________ :
Puisqu’il s’agit d’une seule administration, les erreurs liées à la fatigue sont minimisées comparées aux méthodes nécessitant plusieurs passations.
_____________________________________ :
Elle permet de maximiser l’utilisation des données disponibles sans nécessiter une collecte de données supplémentaire.

A

Fidélité par bissection : Avantages
Facilité d’application :
La méthode est simple à mettre en œuvre et ne nécessite qu’une seule administration du test, ce qui la rend rapide et efficace.
Évaluation de la cohérence interne :
Elle permet de vérifier si les deux moitiés sont cohérents.
Réduction de l’effet de fatigue :
Puisqu’il s’agit d’une seule administration, les erreurs liées à la fatigue sont minimisées comparées aux méthodes nécessitant plusieurs passations.
Utilisation efficace des données :
Elle permet de maximiser l’utilisation des données disponibles sans nécessiter une collecte de données supplémentaire.

19
Q

Fidélité par bissection : Inconvénients
_______________________________:
Il peut être difficile de diviser le test en deux moitiés absolument équivalentes, ce qui peut biaiser les résultats de la corrélation.
_______________________________________ :
La méthode peut parfois sous-estimer la fiabilité réelle du test, surtout si la division des items n’est pas optimale ou équitable.
________________________________________:
Le coefficient de fiabilité peut varier selon la façon dont le test est divisé, ce qui limite la précision de la mesure si la division n’est pas aléatoire ou bien équilibrée.

A

Fidélité par bissection : Inconvénients
Problème de division :
Il peut être difficile de diviser le test en deux moitiés absolument équivalentes, ce qui peut biaiser les résultats de la corrélation.
Fiabilité sous-estimée :
La méthode peut parfois sous-estimer la fiabilité réelle du test, surtout si la division des items n’est pas optimale ou équitable.
Sensibilité à la méthode de division :
Le coefficient de fiabilité peut varier selon la façon dont le test est divisé, ce qui limite la précision de la mesure si la division n’est pas aléatoire ou bien équilibrée.

20
Q

Fidélité par homogénéité

La fidélité par homogénéité, ou cohérence interne, examine à quel point les items d’un instrument ou d’une échelle (dimension) sont étroitement liés et mesurent «un construit» (ou variable latente) de façon cohérente. Un bon niveau de cohérence indique que les items reflètent de manière cohérente le concept psychologique étudié. L’indice de fidélité est souvent mesuré par des coefficients comme l’alpha ordinal, Omega ou fidélité composite. Des résultats élevés suggèrent que les items sont internements, tandis qu’un résultat faible indique un manque de cohésion entre les items.

A

Fidélité par homogénéité
La fidélité par homogénéité, ou cohérence interne, examine à quel point les items d’un instrument ou d’une échelle (dimension) sont étroitement liés et mesurent «un construit» (ou variable latente) de façon cohérente. Un bon niveau de cohérence indique que les items reflètent de manière cohérente le concept psychologique étudié. L’indice de fidélité est souvent mesuré par des coefficients comme l’alpha ordinal, Omega ou fidélité composite. Des résultats élevés suggèrent que les items sont internements, tandis qu’un résultat faible indique un manque de cohésion entre les items.

21
Q

Fidélité par homogénéité : Avantages
________________________:
Les indices sont faciles à calculer à partir des données d’une seule administration.
_________________________ :
Permet de vérifier si tous les items sont cohérant.
___________________________________ :
particulièrement utile pour des instruments évaluant une seule dimension
__________________________ :
une seule passation est nécessaire, économisant temps et ressources.

A

Fidélité par homogénéité : Avantages
Facilité de calcul :
Les indices sont faciles à calculer à partir des données d’une seule administration.
Évaluation directe de la cohésion :
Permet de vérifier si tous les items sont cohérant.
Adapté aux tests unidimensionnels :
particulièrement utile pour des instruments évaluant une seule dimension.
Économie de temps :
une seule passation est nécessaire, économisant temps et ressources.

22
Q

Fidélité par homogénéité : Inconvenients
_________________________ :
Si le test mesure plusieurs dimensions, la cohérence interne peut être trompeuse car elle n’évalue que la cohésion des items sans vérifier la validité multidimensionnelle.
___________________________:
Les tests plus longs ont tendance à produire des résultats plus élevés, ce qui peut donner l’impression d’une cohérence interne élevée même si les items ne sont pas tout à fait cohérents.
____________________________________ :
Si les items sont trop similaires ou redondants, cela peut artificiellement augmenter la cohérence interne sans réellement améliorer la qualité du test.

A

Fidélité par homogénéité : Inconvenients
Ne détecte pas l’hétérogénéité :
Si le test mesure plusieurs dimensions, la cohérence interne peut être trompeuse car elle n’évalue que la cohésion des items sans vérifier la validité multidimensionnelle.
Sensibilité à la longueur du test:
Les tests plus longs ont tendance à produire des résultats plus élevés, ce qui peut donner l’impression d’une cohérence interne élevée même si les items ne sont pas tout à fait cohérents.
Influencé par la redondance des items :
Si les items sont trop similaires ou redondants, cela peut artificiellement augmenter la cohérence interne sans réellement améliorer la qualité du test.

23
Q

Fidélité par inter-correcteurs

La fidélité inter-correcteur (inter-juges) mesure le degré d’accord entre deux ou plusieurs évaluateurs qui jugent indépendamment le même ensemble d’items. Cette méthode est particulièrement utile lorsque les évaluations sont subjectives, comme des symptômes cliniques en psychologie. Elle est souvent calculée à l’aide de mesures statistiques comme le coefficient de corrélation intra-classe (CCI), le kappa de Cohen, ou d’autres indices d’accord inter-juges comme le CVC (coefficient de validité de contenu). Un accord élevé entre les juges indique que l’évaluation est fiable et cohérente entre les correcteurs.

A

Fidélité par inter-correcteurs
La fidélité inter-correcteur (inter-juges) mesure le degré d’accord entre deux ou plusieurs évaluateurs qui jugent indépendamment le même ensemble d’items. Cette méthode est particulièrement utile lorsque les évaluations sont subjectives, comme des symptômes cliniques en psychologie. Elle est souvent calculée à l’aide de mesures statistiques comme le coefficient de corrélation intra-classe (CCI), le kappa de Cohen, ou d’autres indices d’accord inter-juges comme le CVC (coefficient de validité de contenu). Un accord élevé entre les juges indique que l’évaluation est fiable et cohérente entre les correcteurs.

24
Q

Fidélité par inter-correcteurs : Avantages
_________________________________ :
Comme celles des performances ou des symptômes cliniques, en s’assurant qu’elles ne varient pas trop d’un évaluateur à l’autre.
________________________________ :
Permettant «corriger» juges pour garantir des évaluations plus objectives.
_____________________________________:
Comme le travail, l’éducation et la psychologie, où les évaluations qualitatives ou subjectives sont fréquentes.
_________________________________________ :
Un accord élevé entre correcteurs montre que les juges utilisent des critères similaires, ce qui améliore la validité des résultats obtenus.

A

Fidélité par inter-correcteurs : Avantages
Évaluation de la subjectivité :
Comme celles des performances ou des symptômes cliniques, en s’assurant qu’elles ne varient pas trop d’un évaluateur à l’autre.
Identification des biais d’évaluation :
Permettant «corriger» juges pour garantir des évaluations plus objectives.
Application dans plusieurs domaines :
Comme le travail, l’éducation et la psychologie, où les évaluations qualitatives ou subjectives sont fréquentes.
Mesure de la cohérence entre les juges :
Un accord élevé entre correcteurs montre que les juges utilisent des critères similaires, ce qui améliore la validité des résultats obtenus.

25
Q

Les tests de vitesse sont des évaluations où le temps est un facteur clé. Ils consistent à mesurer la capacité d’un individu à effectuer le plus grand nombre possible d’items ou de tâches dans un laps de temps limité. La fidélité dans ce type de test est souvent évaluée en fonction de la ______________________________________________________
Caractéristiques : _______________________________________________________________________________________________________________________________________________________________-

Évaluation de la fidélité : _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

A

Les tests de vitesse sont des évaluations où le temps est un facteur clé. Ils consistent à mesurer la capacité d’un individu à effectuer le plus grand nombre possible d’items ou de tâches dans un laps de temps limité. La fidélité dans ce type de test est souvent évaluée en fonction de la constance des performances sous contrainte de temps.
Caractéristiques : Les tests de vitesse incluent des items généralement simples, que la plupart des individus peuvent accomplir. Ce qui est mesuré, c’est la rapidité avec laquelle les tâches peuvent être terminées.
Évaluation de la fidélité : La fidélité des tests de vitesse est souvent mesurée par des méthodes telles que la fidélité test-retest ou la méthode de bissection, en s’assurant que les résultats sont cohérents à travers différentes administrations ou parties du test.

26
Q

Fidélité par inter-correcteurs : Inconvénients

________________________________________ :
Résultats peuvent être influencés par les compétences des juges. Des évaluateurs moins qualifiés peuvent diminuer la fiabilité inter-juges.
___________________________________ :
Nécessite plusieurs évaluateurs et des analyses statistiques supplémentaires, ce qui peut être coûteux en temps et en ressources.
__________________________________:
Même avec un bon accord, les juges peuvent avoir des critères légèrement différents d’interprétation.
_______________________________ :
Bonne compréhension des statistiques pour assurer bonne interprétation.

A

Fidélité par inter-correcteurs : Inconvénients
Dépendance aux compétences des évaluateurs :
Résultats peuvent être influencés par les compétences des juges. Des évaluateurs moins qualifiés peuvent diminuer la fiabilité inter-juges.
Coûts en temps et en ressources :
Nécessite plusieurs évaluateurs et des analyses statistiques supplémentaires, ce qui peut être coûteux en temps et en ressources.
Variabilité dans les critères :
Même avec un bon accord, les juges peuvent avoir des critères légèrement différents d’interprétation.
Complexité des analyses :
Bonne compréhension des statistiques pour assurer bonne interprétation.

27
Q

Les tests de puissance se concentrent sur le niveau de difficulté des items. Ils mesurent la capacité d’un individu à résoudre des tâches complexes et/ou difficiles, sans limite de temps stricte, mais avec un accent mis sur la____________________________________________________.

Caractéristiques : ______________________________________________________________________________________________________________________________________________________________________________________________________________________
Évaluation de la fidélité : _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

A

Les tests de puissance se concentrent sur le niveau de difficulté des items. Ils mesurent la capacité d’un individu à résoudre des tâches complexes et/ou difficiles, sans limite de temps stricte, mais avec un accent mis sur la qualité et la précision des réponses.
Caractéristiques : Les items dans les tests de puissance varient en difficulté et visent à évaluer le potentiel ou les capacités intellectuelles maximales d’une personne. Il ne s’agit pas de compléter un grand nombre d’items rapidement, mais plutôt de réussir les tâches les plus complexes.
Évaluation de la fidélité : La fidélité des tests de puissance est généralement évaluée par des méthodes comme la cohérence interne pour s’assurer que les items du test sont liés et mesurent de façon cohérent le même construit.

28
Q

Les tests de vitesse et les tests de puissance sont conçus pour éviter les scores parfaits, et cela pour plusieurs raisons liées à la discrimination psychométrique, qui est unes des qualités importantes des tests :

Discrimination psychométrique:_________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Par exemple, si un test est trop facile et que tout le monde obtient le score maximal, il devient impossible de savoir qui est réellement plus performant, puisque les résultats n’offrent aucune distinction entre les participants. Un test perd ainsi son pouvoir de discrimination.

A

Les tests de vitesse et les tests de puissance sont conçus pour éviter les scores parfaits, et cela pour plusieurs raisons liées à la discrimination psychométrique, qui est unes des qualités importantes des tests :
Discrimination psychométrique :
La discrimination est la capacité d’un test à différencier les individus sur la base de leurs compétences ou capacités. Un test qui permet des scores parfaits (c’est-à-dire que tous les participants atteignent le score maximal) n’a plus cette capacité de discrimination, car il ne différencie plus les participants en fonction de leurs aptitudes.
Par exemple, si un test est trop facile et que tout le monde obtient le score maximal, il devient impossible de savoir qui est réellement plus performant, puisque les résultats n’offrent aucune distinction entre les participants. Un test perd ainsi son pouvoir de discrimination.

29
Q

Problème d’un score parfait :

Tests de vitesse :

Tests de puissance :

A

Problème d’un score parfait :
Un score parfait empêche d’évaluer les compétences réelles d’un individu. Il devient impossible de savoir si la personne aurait pu obtenir un meilleur score avec des items plus difficiles ou un test plus long, créant ainsi une limite artificielle à l’évaluation.
Tests de vitesse :
Dans les tests de vitesse, la performance est limitée par le temps et non la difficulté. Si un participant termine toutes les tâches, cela pourrait indiquer qu’il aurait pu en faire plus avec plus de temps. Empêcher un score parfait permet de mieux estimer la capacité réelle..
Tests de puissance :
Dans les tests de puissance, la difficulté varie. Si tous les participants réussissent 1a tous les items, il devient difficile de différencier les niveaux de compétence. Éviter un score parfait permet aux items de rester discriminants et de mieux évaluer les capacités individuelles.

30
Q

L’erreur standard de mesure (ESM) ou l’erreur type de mesure (ETM) est une mesure essentielle en psychométrie. Elle quantifie ______________________________________ dans un test et aide à estimer dans quelle mesure un score _______________ peut diverger du score _________.
Un score observé (ou manifesté) est composé de :
____________ : Représente les capacités réelles de l’individu.
__________________: Facteurs aléatoires qui influencent le score (fatigue, stress, etc.).

A

L’erreur standard de mesure (ESM) ou l’erreur type de mesure (ETM) est une mesure essentielle en psychométrie. Elle quantifie l’ampleur des erreurs aléatoires dans un test et aide à estimer dans quelle mesure un score observé peut diverger du score vrai.
Un score observé (ou manifesté) est composé de :
Score vrai : Représente les capacités réelles de l’individu.
Erreur de mesure : Facteurs aléatoires qui influencent le score (fatigue, stress, etc.).

31
Q

Interprétation de l’ETM:
L’ETM permet d’évaluer la précision d’un score en tenant compte des erreurs aléatoires présentes dans un test. Voici comment interpréter les résultats :
Faible ETM : Moins de 5 % du score total de la personne. Cela indique que ______________________________________________________________________________________________.
ETM modérée : Entre 5 % et 10 %. Une ETM modérée montre une _________________________________________________________________________, mais reste dans une marge acceptable.

ETM élevée : Supérieure à 10 %. Cela reflète une_____________________________________, ce qui signifie que le score observé est probablement__________________________________ en raison d’une plus forte présence d’erreurs aléatoires.

Voir diapo absolument

A

Interprétation de l’ETM:
L’ETM permet d’évaluer la précision d’un score en tenant compte des erreurs aléatoires présentes dans un test. Voici comment interpréter les résultats :
Faible ETM : Moins de 5 % du score total de la personne. Cela indique que l’incertitude liée aux erreurs aléatoires est faible, ce qui signifie que le score observé est proche du score vrai.
ETM modérée : Entre 5 % et 10 %. Une ETM modérée montre une certaine incertitude. Le score observé peut s’écarter du score vrai de manière importante ou significative, mais reste dans une marge acceptable.
ETM élevée : Supérieure à 10 %. Cela reflète une plus grande imprécision dans les résultats, ce qui signifie que le score observé est probablement très éloigné du score vrai en raison d’une plus forte présence d’erreurs aléatoires.

32
Q

Lien entre l’ETM et la fidélité :
Plus un test est fidèle (coefficient de fidélité élevé), plus l’ETM est ______________.
Fidélité élevée = faible ETM, signifiant que le test est __________.
Fidélité faible = ETM élevée, ce qui indique plus __________________ dans les résultats observés.

L’ETM a des applications concrètes :
Évaluer la précision des scores individuels : Calcul d’un intervalle de confiance autour d’un score.
Comparer la précision des tests : Un test avec une faible ETM est plus ______.
Prendre des décisions : Dans des contextes cliniques ou professionnels, l’ETM aide à estimer la _____________________ d’un score.

A

Lien entre l’ETM et la fidélité :
Plus un test est fidèle (coefficient de fidélité élevé), plus l’ETM est faible.
Fidélité élevée = faible ETM, signifiant que le test est précis.
Fidélité faible = ETM élevée, ce qui indique plus d’incertitude dans les résultats observés.
L’ETM a des applications concrètes :
Évaluer la précision des scores individuels : Calcul d’un intervalle de confiance autour d’un score.
Comparer la précision des tests : Un test avec une faible ETM est plus précis.
Prendre des décisions : Dans des contextes cliniques ou professionnels, l’ETM aide à estimer la marge d’erreur d’un score.

33
Q

Pour bien comprendre l’ETM:
Imaginons que nous ayons testé 100 fois le QI de Marcos. En raison des divers types d’erreurs aléatoires possibles, les résultats des tests varient (nous n’obtenons pas toujours exactement le même score, évidemment). Après avoir analysé ces 100 résultats, nous pouvons interpréter la moyenne de cette distribution comme une estimation du score vrai du QI de Marcos.
De même que pour tout écart-type, l’ETM (Erreur Type de Mesure) s’interprète à l’aide des pourcentages associés aux divers segments de la distribution normale. Par exemple, environ 68% des individus se situent entre -1 et +1 écart-type. On peut donc conclure qu’environ 68% des scores de Marcos se regrouperont entre -1 et +1 ETM. En termes de probabilité, il y a environ deux chances sur trois (ou 68:32) que les réponses de Marcos se situeront dans cet intervalle (-1 et +1 ETM) autour de son QI réel.

A

Pour bien comprendre l’ETM:
Imaginons que nous ayons testé 100 fois le QI de Marcos. En raison des divers types d’erreurs aléatoires possibles, les résultats des tests varient (nous n’obtenons pas toujours exactement le même score, évidemment). Après avoir analysé ces 100 résultats, nous pouvons interpréter la moyenne de cette distribution comme une estimation du score vrai du QI de Marcos.
De même que pour tout écart-type, l’ETM (Erreur Type de Mesure) s’interprète à l’aide des pourcentages associés aux divers segments de la distribution normale. Par exemple, environ 68% des individus se situent entre -1 et +1 écart-type. On peut donc conclure qu’environ 68% des scores de Marcos se regrouperont entre -1 et +1 ETM. En termes de probabilité, il y a environ deux chances sur trois (ou 68:32) que les réponses de Marcos se situeront dans cet intervalle (-1 et +1 ETM) autour de son QI réel.

34
Q

Conclusions de l’ETM:
L’ETM est une mesure clé pour évaluer la précision d’un test, mais elle a ses limites. Bien qu’elle permette de calculer un intervalle de confiance et de comprendre l’incertitude autour d’un score observé, elle n’élimine pas les erreurs systématiques et nécessite des conditions standardisées pour rester fiable. Un faible ETM est essentiel dans les tests à fort enjeu pour garantir des résultats justes

Voir diapo manque d’info ici.

A