Cours #7: Biais des tests Flashcards
Est-ce que tous les tests sont biaisés?
Non
Qu’est-ce que le biais?
c’est une erreur systématique, pas aléatoire.
Est-ce que la différence de moyenne est un biais?
Non! Jamais!
Pourquoi les différences entre les moyenne ne sont ps systématiquement des biais?
Puisque certaines différences sont attendues sur le plan théorique et conceptuel.
Est-ce que certaines différences entre les moyennes sont attendues et normales selon certains concepts?
Oui!
Quelle est la caractéristique qu’un instrument d’évaluation est biaisé?
si les différences sont basées sur des caractéristiques autres que ce que l’instrument évalue.
Est-ce que la fidélité des scores peut être compromise à cause des différentes sources d’erreurs de mesure?
Oui
Quels sont les éléments tributaires du degré de validité des scores?
Les interprétations et les inférences permises.
Par quoi peut être affectée la validité?
1) biais de réponse aux items individuels.
2) biais de scores à une échelle.
Qu’est-ce qui est une réponse cruciale pour les concepteurs et les utilisateurs en ce qui concerne la validité?
La présence de biais.
Est-ce que les personnes qui répondent son biaisées?
Oui en partie, souvent sans en être conscient!
Que signifie heuristique?
Stratégies cognitives utilisées pour simplifier et accélérer une décision en situation d’incertitude (Kahneman, 2011)
Le mot heuristique peut être remplacé par quelle expression?
Raccourcis mentaux.
À quoi s’applique les stratégies heuristiques?
S’appliquent à l’évaluation/estimation des comportements
Dans quels contextes les stratégies heuristiques sont utiles?
Quand on ne connait pas bien la personne à évaluer.
À quoi peuvent mener les stratégies heuristiques?
À des erreurs de jugement et à stéréotyper les personnes.
Quels sont les 4 exemples connus d’heuristiques?
- Heuristique de la représentativité
- Heuristique de la disponibilité
- Heuristiques de primauté / de récence
- Heuristique de l’affect.
Que signifie heuristique de la représentativité?
Évaluation d’une caractéristique spécifique en fonction de son degré de concordance à un prototype (e.g., évaluer l’attention d’un enfant en fonction de notre prototype du TDAH)
Que signifie heuristique de la disponibilité?
Évaluation qui est influencée par les choses qui viennent plus facilement (ou fréquemment) en tête à l’évaluateur.trice (e.g., comportements d’agressivité des enfants)
Ces choses qui viennent en tête plus facilement sont considérées plus fréquentes et plus représentatives de la réalité
Que signifie heuristique de primauté/ récence?
Évaluation qui est influencée par la première vs la dernière impression de l’individu.
Que signifie heuristique de l’affect?
Évaluation teintée par l’état émotionnel et affectif actuel (e.g., mauvaise humeur mène à estimer la présence de davantage de problèmes de comportement)
Qu’est-ce que le biais de réponse?
Il s’agit d’un biais qui est en lien avec les réponses des répondants. Les biais de réponses peuvent être causés par plusieurs facteurs.
Qu’est-ce qui influence directement la validité des scores obtenus à un test?
Les biais de réponse.
Qu’est-ce que peut compromettre une validité diminuée?
la qualité des inférences et des décisions cliniques.
Est-ce que tous les répondants sont biaisés?
Oui, un biais de 0% n’existe pas!
Quels sont les huit grands types de biais de réponse?
- Extrémité: Choisi des réponses dans les catégories extrêmes.
- indécision: Choisi souvent les réponses dans la catégorie centrale.
- Acquiescement: Tendance à endosser les items ‘‘vrai’’ ou ‘‘oui’’, sans égard du contenu.
- Objection: Tendance à rejeter les items ‘‘faux’’ ou ‘‘non’’, sans égard du contenu.
5.Désirabilité sociale: tendance à répondre de façon socialement désirable, pour plaire. Ex: exagérer ses qualités. - gestion défavorable des impressions: tendance à répondre de façon socialement désirable, pour exagérer ses limites ou problèmes.
- Réponses aléatoires: répond aux items aléatoirement en portant peu attention au contenu.
- Deviner: tendance à vouloir deviner les réponses aux items. (test de performance)
Comment minimiser les biais de réponse?
- Gestion de la situation d’évaluation (nous): Anonymat, minimiser frustration, donner des avertissements.
- Gestion du contenu des tests: items simples et neutres avec des choix de réponses clairs.
- Utiliser des tests ou échelles de validité spécialisées.
Est-ce que l’intervenant peut limiter les biais?
Oui, en gérant la situation d’évaluation.
Qu’est-ce que signifient des scores très élevés ou extrêmes?
un problème potentiel (et non un problème systématique).
En quoi consiste l’échelle d’indétermination?
Elle vise détecter les items qui ont été répondus plus d’une fois et le saut des items à de nombreuses reprises ce qui peut causer problème dans l’analyse des scores.
Quelles sont les deux échelles de validité de désirabilité sociale?
- Échelle de désirabilité sociale de Marlowe-Crowne: je mens jamais!
- Inventaire balancé de style de réponse socialement désirable. deux échelles:
a) Auto-déception: réponses honnêtes, mais exagérées positivement.
b) réponses malhonnêtes, sert à 1) plaire aux autres, 2) obtenir des avantages.
En quoin consiste l’ Échelle de gestion dévavorable des impressions ?
Tendance à répondre positivement à des items négatifs improbables
En quoi consiste l’Échelle de style de réponse extrême?
Calculer le nombre de fois anormalement élevé le 1e ou le 7e choix des items.
En quoi consiste l’échelle d’indécision?
Calculer le nombre de fois anormalement élevé la catégorie centrale, soit le 4e choix
En quoi consiste l’incohérence variable des réponses (VRIN)?
Somme du nombre de paires d’items qui ont été répondues de façon incohérente.
On donne 1 pt pour chaque paire incohérente et calcule une somme
Quels sont les deux types de l’incohérence variable des réponses (VRIN)?
Similaire: «Je ne pense pas avant d’agir» – «J’agis sans réfléchir aux conséquences»
Différent: «Je ne pense pas avant d’agir» – «J’y pense bien avant de prendre des décisions»
À quoi sert l’incohérence variable des réponses (VRIN)?
Sert à détecter les réponses aléatoires (intentionnelle ou non) ou la confusion dans un questionnaire.
En quoi consiste l’Incohérence vraie des réponses (TRIN)
On utilise seulement des paires d’items qui sont conceptuellement différentes.
On calcule une somme des paires d’items répondues vrai de façon incohérente, moins la somme des paires d’items répondus faux de façon incohérente.
À quoi sert l’Incohérence vraie des réponses (TRIN)
Sert à détecter les réponses incohérentes qui révèlent l’acquiescement (score très élevé) ou l’objection (score très faible, possiblement négatif).
Qu’est-ce que le biais des items?
Les différences systématiques dans la probabilité de répondre d’une façon donnée pour chaque item individuellement, une fois que le niveau du trait est contrôlé.
On compare la probabilité d’endosser les items d’une échelle pour des individus de différents groupes qui ont le même score/niveau sur le trait
Comment est aussi appelé le biais des items?
fonctionnement différentiel des items
Lorsque la courbe de l’item ne suit pas la courbe d’origine, est-il biaisé?
Oui, car s’il n’était pas biaisé, il aurait suivi la même courbe!
Vrai ou faux: on ne détecte pas les biais avec les différences de moyennes?
Vrai!
Qu’est-ce que le biais structurel dans un instrument unidimensionnel?
- Il peut s’agir de différences significatives des saturations factorielles entre deux groupes.
Qu’est-ce que le biais structurel dans un instrument multidimensionnel?
(a) différences des saturations et (b) la structure factorielle n’est pas la même dans différents groupes.
Qu’est-ce qui arrive avec la signification, si les scores sont contaminés?
Elle n’est plus la même et elle est biaisée.
À quoi s’applique le biais critériel?
S’applique autant à la validité de critère concomitante (critère indépendant et groupes contrastés) qu’à la validité prédictive.
En quoi consiste le biais de fidélité?
Les estimés de la fidélité sont significativement différents dans différents groupes.
Peut être potentiellement important pour l’interprétation
S’il y a un biais, le niveau de confiance qu’on peut avoir envers les scores d’une échelle varie d’un groupe à l’autre
Les différences de groupe observées au niveau des moyennes peuvent alors être en partie expliquées par de l’erreur
Quel est le danger du testing?
La sur-généralisation. On interprète et on recommande pour un individu en particulier.
Qu’est-ce qu’il peut y avoir dans la représentation de deux distributions de scores?
Un chevauchement des deux distributions, soit une superposition.
En tant que psychoed, quel piège faut-il éviter?
La sur-généralisation, il ne faut pas catégoriser.
Exemple: les hommes sont tous gentils, les femmes sont tous méchantes.