Examen final Flashcards
Les problèmes émotifs et comportementaux peuvent varier d’un contexte à l’autre, parfois de façon importante autant chez les enfants que chez les adolescents et les adultes. Vrai ou faux ?
Vrai.
Les différents évaluateurs varient dans leurs capacités de bien observer les émotions et comportements, autant de façon _________ que__________.
Intra-contexte
Inter-contexte
À quoi ont recours les évaluateurs pour mieux comprendre la complexité des différentes présentations cliniques ?
L’évaluation multi-informateurs
L’évaluation clinique des clients adolescents ou adultes est en général très largement basée sur les autoévaluations, qu’elle se fasse par entrevues ou questionnaires. Est-ce suffisant ?
Non. Les autoévaluations sont souvent essentielles, mais non suffisantes
En fait, la pertinence des évaluations par des informateurs (autres que le client) – autant durant l’enfance, l’adolescence que l’âge adulte – est appuyée par de nombreuses études.
Il n’est donc pas étonnant qu’un modèle exhaustif d’évaluation recommande l’utilisation de plusieurs méthodes d’évaluation et plusieurs informateurs
Des méta-analyses suggèrent que les évaluations des informateurs procurent une ________________ significative au-delà des autoévaluations pour prédire différents critères tels que l’engagement et la performance au travail, différents problèmes d’adaptation et les troubles de personnalité.
Validité incrémentielle (prédictive)
Quelle est l’étape la plus facile pour l’interprétation des scores provenant de sources multiples ? La plus difficile ?
Plus facile = calculer les scores standardisés et les qualifier en fonction d’une norme est l’étape facile
Plus complexe = l’intégration de toutes les informations (différentes dimensions, contextes, informateurs) afin de répondre au motif de référence, porter un jugement clinique et proposer des pistes d’intervention
L’accord inter-juges est généralement fort avec les échelles d’évaluation comportementale. Vrai ou faux ?
Faux.
Quels sont les deux schémas (méthodes ou algorithmes) pour établir un statut ou diagnostic ?
- Schéma complexe : On donne un poids différent aux différents informateurs
P. ex., Donner plus de poids aux enseignants pour problèmes d’attention, aux parents pour problèmes extériorisés et plus de poids aux jeunes eux-mêmes pour problèmes intériorisés.
Peut être très subjectif et entrainer l’erreur. - Schéma simple : L’information des différents informateurs a le même poids (p. ex., la règle de «l’un ou l’autre»)
Un résultat est considéré significatif (on assigne un statut ou un diagnostic) si le critère est obtenu par n’importe quel informateur.
Attention à attribuer un diagnostic pour des comportements dus au contexte.
Quel schéma est en général préféré pour attribuer un diagnostic ? Pourquoi ? Quel est l’aspect négatif avec les schémas complexes ?
À l’heure actuelle, en dépit du fait que les études rigoureuses soient peu nombreuses, les schémas simples sont généralement préférés pour établir un statut ou un diagnostic parce que les schémas complexes procurent une «valeur ajoutée» assez limitée.
Si le clinicien n’a pas une excellente connaissance de la documentation scientifique, les schémas complexes sont toujours influencés par la théorie implicite et l’expérience clinique. peut être bon … mais peut être très négatif. Important d’aller vérifier dans la littérature quel observateur est le meilleur si on utilise un schéma complexe.
Pourquoi utilisent-ont les schémas simple malgré leur possibilité de faux positifs ?
On assume que les faux positifs (i.e., un diagnostic donné par un informateur alors qu’il n’y a pas de trouble en réalité) sont moins dommageables que les faux négatifs (i.e., un résultat d’absence de diagnostic alors qu’il y a un trouble en réalité)
Attention : les faux positifs signifient offrir des interventions non-nécessaires (étiquetage), mais les faux négatifs peuvent vouloir dire ne pas offrir une intervention à un individu qui en a besoin. Il faut cependant donner des services selon les besoins des personnes, sinon cela augmente son niveau de récidive. Ex. si trop grand niveau de service, plus de récidive pour les comportements violents.
Pourquoi l’accord inter-juge est-il faible pour les mesures comportementales ? (3)
- Différences réelles = les études suggèrent qu’il y a effectivement variabilité situationnelle des comportements, des émotions, des traits de personnalité, etc.
- Dépend du niveau d’analyse = l’accord est généralement plus élevé pour les traits généraux (cpts. extériorisés) que pour les comportements spécifiques (p. ex., opposition à l’école)
- Utilisation de méthodes d’évaluation semblables VS différentes = même avec des méthodes semblables, les items sont parfois différents (version parent vs enseignant du ASEBA)
Quels sont les facteurs clés qui peuvent faire varier l’accord inter-juge ? (3)
- Contexte d’observation
- Le type de problèmes évalués.
Habituellement, un meilleur accord pour les problèmes de comportements observables (extériorisés) que pour problèmes plus épisodiques (intériorisés) ou difficiles à observer (p. ex., pensées suicidaires)
Les adultes rapportent davantage de problèmes extériorisés que les enfants, alors que les enfants rapportent davantage de problèmes intériorisés. S’applique également à d’autres construits comme la personnalité. - L’âge des individus évalués
Niveau d’accord entre évaluations des informateurs diminuent avec l’augmentation de l’âge des jeunes évalués. Au contraire, la fidélité des autoévaluations des jeunes augmente avec l’augmentation en âge (meilleur introspection).
Signifie donc que l’accord inter-juges plus élevé en bas âge est possiblement en partie «contaminé» par la fidélité plus faible, du moins lorsque le jeune est impliqué
L’évaluation des traits de personnalité avec une moins forte ____________ (p. ex., liés aux pensées, aux affects) est plus valide par auto-évaluations, alors que l’évaluation des traits avec une forte ____________ (p. ex., Amabilité, Intellect) sera souvent considéré plus valide à l’aide d’informateurs
«observabilité»
«désirabilité sociale»
Dans le modèle pour interpréter les convergences / divergences entre informateurs, l’évaluateur doit se poser successivement les quatre questions suivantes =
- Variations réelles du comportement en raison des différents contextes ?
Est-ce qu’il est possible et explicable sur le plan conceptuel / théorique que le contexte cause des comportements différents ? (p. ex., pression env. pour attention à l’école)
Devraient être confirmées à l’aide d’autres méthodes d’évaluation
Ex. Des comportements extériorisés apparaissent plus au camp de jour en présence d’autre enfant (et donc de frustration) qu’à la maison ou il est enfant unique. - Variation de la sévérité clinique
Plus il y a convergence entre informateurs, plus cela représente la sévérité du problème - Spécificités de l’informateurs
- Erreurs de mesure
Erreurs liées à l’instrument de mesure, mais aussi erreurs liées aux conditions d’administration (p. ex., environnement physique inadéquat, fatigue du client due à une entrevue trop longue, des consignes non respectées, des caractéristiques de l’évaluateur, etc.)
Quels sont les spécificité de l’informateur qui peuvent faire varier l’interprétation des convergences/divergences entre informateurs ? (6)
- perception de la problématique
- motivations
- théories implicites
- biais socio-culturels
- styles de réponses
- psychopathologie
Comment déterminent-ont l’erreur de mesure ?
Une façon de le déterminer est d’examiner le chevauchement des IC entre les scores de différents informateurs
Le public a parfois l’impression que tous les instruments d’évaluation sont biaisés (p. ex., selon le sexe ou genre, selon le groupe ethnique)
C’est parfois le cas et c’est le devoir de_________ des tests d’en être informé
L’utilisateur.
Qu’est-ce qu’un biais ?
Biais = erreur systématique (n’est pas aléatoire)
Les différences de moyenne entre des groupes constituent-elles nécessairement un biais ?
Non.
P. ex., À l’adolescence, peu de différences de moyenne entre groupes ethniques pour problèmes de comportement, mais différences selon le sexe
P. ex., Différences sexuelles dans les traits de personnalité à l’âge adulte, pas à l’adolescence
Un instrument d’évaluation est biaisé si ______.
Les différences entre les membres de différents groupes sont identifiées sur la base de caractéristiques autres que celles que l’instrument prétend évaluer.
Il y a présence de biais pour un instrument si le contenu, la procédure ou l’utilisation ________________ les membres d’un groupe plutôt qu’un autre et si cette différenciation est __________ à l’objectif de l’instrument
Favorise ou défavorise systématiquement
Non pertinente
Comme nous l’avons vu, la fidélité des scores d’un instrument d’évaluation peut être compromise par différentes sources d’erreur de mesure. Nous avons aussi vu que les inférences et les interprétations permises avec des scores procurés par un instrument d’évaluation sont tributaires du degré de validité de ces scores. La présence de biais est une question cruciale, autant pour les concepteurs que les utilisateurs de tests.
La validité peut être affectée directement par deux choses. Quelles sont-elles ?
(a) biais de réponse aux items individuels
(b) biais des scores à une échelle
Les individus qui sont évalués et qui doivent répondre aux questions, que ce soit à propos d’eux-mêmes ou en tant qu’informateur pour un tiers, risquent toujours d’être en partie biaisés. Vrai ou faux ? Donnez un exemple.
Vrai.
Par exemple, lors d’une entrevue d’embauche où une personne doit répondre à un questionnaire de personnalité, est-ce qu’elle voudrait paraitre à son mieux ? Ou même mieux qu’à son mieux ?
Concernant les biais de réponse, même à un niveau de base, il est maintenant reconnu que le système cognitif de l’humain est «victime» de plusieurs ________ ou ________.
Heuristiques ou biais cognitifs
Que veut dire heuristique ?
Stratégies cognitives utilisées pour simplifier et accélérer une décision en situation d’incertitude … ou l’estimation d’un comportement
Parfois appelées «raccourcis mentaux»
Très utiles quand on ne connait pas assez bien une personne à évaluer
Peut aussi mener à des erreurs de jugement et à «stéréotyper» la personne
Quels sont les différents types d’heuristiques ? (4)
1) Heuristique de la représentativité
Catégorisation d’une caractéristique en fonction de son degré de concordance à un prototype provenant de cette même catégorie (p. ex., évaluer l’attention d’un enfant en fonction de notre prototype du TDAH)
2) Heuristique de la disponibilité
Évaluation qui est influencée par ce qui vient plus facilement (ou fréquemment) en tête de l’évaluateur (p. ex., agressivité des enfants)
Ce qui vient en tête plus facilement est considéré plus fréquent et plus représentatif de la réalité
3) Heuristiques de primauté / de récence
Évaluation qui est influencée par la première vs la dernière impression de l’individu
4) Heuristique de l’affect
Évaluation teintée par l’état émotionnel et affectif actuel (p. ex., mauvaise humeur mène à voir plus de problèmes de comportement)
Pourquoi les biais peuvent-ils être graves ?
Puisqu’ils influencent directement la validité des scores obtenus à un test
La validité «diminuée» peut en retour compromettre la qualité des décisions interprétatives et cliniques qui sont prises à propos d’un individu (ou d’un groupe) évalué.
Quels sont les huit grands types de biais de réponse ?
- Extrémité
- Indécision
- Acquiescement
- Objection
- Désirabilité sociale
- Gestion défavorable des impressions (malingering)
- Réponse aléatoire ou négligente
- Deviner (guessing)
Qu’est-ce que le biais de réponse extrémité ?
Tendance à répondre très souvent par les catégories extrêmes, peu importe le niveau de l’individu sur le construit, pour les items à choix de réponse multiples.
Qu’est-ce que le biais de réponse indécision ?
Tendance à répondre très souvent par la catégorie centrale, peu importe le niveau de l’individu sur le construit, pour les items à choix de réponses multiples.
Qu’est-ce que le biais de réponse acquiescement ?
Tendance à endosser des items, sans égard à leur contenu. Répondre oui ou vrai dans tous les items dichotomiques, répondre toujours du coté positif (aussi appelé gestion favorable des impressions).
Qu’est-ce que le biais de réponse objection ?
Tendance à rejeter des items, sans égard à leur contenu. Répondre non ou faux dans les items dichotomiques. Répondre du coté négatif pour les items avec plus de deux choix de réponse.
Qu’est-ce que le biais de réponse désirabilité sociale ?
Tendance à répondre de façon socialement désirable ou exagérément positive à des items positifs improbable, de façon à exagérer ses qualités. Aussi appelé échelle de mensonge.
Qu’est-ce que le biais de réponse gestion défavorable des impressions (malingering) ?
Tendance à répondre de façon socialement indésirable ou exagérément négative de façon à exagérer ses limites ou problèmes d’adaptation.
Qu’est-ce que le biais de réponse réponse aléatoire ou négligente ?
Répondre aux items de façon aléatoire ou avec très peu d’attention au contenu des items.
Qu’est-ce que le biais de réponse deviner (guessing) ?
Tendance à tenter de deviner la bonne réponse aux items. Pertinent seulement pour les tests de performance.
Que faire pour prévenir ou minimiser les biais de réponse ? (3)
- Gestion de la situation d’évaluation
Anonymat, minimiser la frustration, donner des avertissements
2. Gestion du contenu des tests Items simples (niveau de langage), items avec contenu neutre (non-suggestifs), choix de réponse conceptuellement clairs
- Tests ou échelles de validité spécialisées
Sur quel principe sont basées les échelles de validité ?
Toutes ces échelles sont basées sur le principe que des scores très élevés ou extrêmes suggèrent un problème potentiel (ce qui n’est pas toujours le cas).
Donnez un exemple d’une échelle de validité pour le biais d’indécision.
Échelle d’indétermination du MMPI-2
Le questionnaire complet compte plus de 567 questions
On fait la somme des items non répondus, ou des items avec plusieurs réponses sur même item
Ne peut être utilisé par les psychoéducateur.
Donnez deux exemples d’échelles de validité pour le biais de désirabilité sociale ?
- Échelle de désirabilité sociale de Marlowe-Crowne (Crowne & Marlow, 1960)
P. ex., «je ne mens jamais»; «j’aime tous les gens que je connais». - Inventaire balancé de style de réponse socialement désirable (Pauhlus, 1984)
Deux échelles =
- Auto-déception : réponses généralement honnêtes, mais exagérément positives
- Gestion des impressions : réponses malhonnêtes, le biais positif sert à (a) plaire aux autres ou (b) obtenir des avantages
Donnez un exemple d’une échelle de validité pour le biais de gestion défavorable des impressions.
Échelle de gestion défavorable des impressions du MMPI-2 (Ben-Porath & Tellegen, 2008)
- Tendance à répondre positivement à des items négatifs improbables (p. ex., «je ne suis bon.ne à rien»; «je n’ai aucun talent»)
- Effet difficile à départager avec cas cliniques sévères (p. ex., dépression majeure)
Donnez un exemple d’une échelle de validité utilisée pour mesurer le biais aléatoire ou négligent.
Incohérence variable des réponses (VRIN)
- Somme du nombre de paires d’items qui ont été répondues de façon incohérente
Similaire: «Je ne pense pas avant d’agir» – «J’agis sans réfléchir aux conséquences»
Différent: «Je ne pense pas avant d’agir» – «J’y pense bien avant de prendre des décisions»
On donne 1 pt pour chaque paire incohérente et calcule une somme.
Sert à détecter les réponses aléatoires (intentionnelle ou non) ou la confusion dans un questionnaire. A ses limites si la personne est ambivalente.
Nommez un exemple d’échelle de validité qui mesure le biais de l’acquiescement ou l’objection.
Incohérence vraie des réponses (TRIN)
Dans celle-ci, on utilise seulement des paires d’items qui sont conceptuellement différentes
On calcule une somme des paires d’items répondues vrai de façon incohérente, moins la somme des paires d’items répondus faux de façon incohérente
Quels sont les quatre biais des items et tests ?
1) Biais des items
2) Biais structurel
3) Biais critériel (ou critérié)
4) Biais de fidélité
Qu’est-ce que le biais des items ?
Il ne s’agit pas des différences de scores sur le trait, mais des différences systématiques dans la probabilité de répondre d’une façon donnée pour chaque item individuellement, une fois que le niveau du trait est contrôlé
Aussi appelé «fonctionnement différentiel
Niveau de trait contrôlé = on compare des individus qui ont le même score/niveau sur le trait. Même principe que les variables de contrôle dans les études prédictives (p. ex., lorsqu’on «contrôle pour le SSÉ», on calcule l’effet d’un prédicteur pour les individus qui ont le même SSÉ). Contrôlé : régression linéaire. On enlève la variance du score qu’on obtient de l’anxiété pour trouver les autres facteurs qui expliquent le score.
Exemple :
Les hommes vont répondent plus souvent oui que non (systématique). Ce n’est pas nécessairement plus problématique, il faut juste en tenir compte dans les normes.
Les saturations (alpha de Cronbach) pourraient être différentes entre les femmes et les hommes (certains items sont moins reliés).
Au niveau multidimensionnel, la structure factoielle pourrait changer entre ces catégories. Anxiété est lié au mensonge chez les femmes mais pas chez les hommes (exemple).
Qu’est-ce que le biais structurel des items et tests ?
- Pour un instrument unidimensionnel, il peut s’agir de différences significatives des saturations factorielles entre deux groupes
Pas banal puisque ceci signifie que le trait n’est pas mesuré de la même façon dans différents groupes
- Pour un instrument multidimensionnel, (a) différences des saturations et (b) la structure factorielle n’est pas la même dans différents groupes
P. ex., analyse factorielle révèle 3 facteurs pour les hommes, mais seulement deux pour les femmes
Erreur systématique = va amener une certaines baisse de fidélité dans certain groupe mais pas d’en d’autres. La fidélité est toujours lié à une population et une utilisation donnée.
Qu’est-ce que le biais critériel (ou critérié) ?
S’applique autant à la validité de critère concomitante (critère indépendant et groupes contrastés) qu’à la validité prédictive
P. ex., Un trait tempéramental qui prédit l’adaptation ultérieure pour un groupe d’enfants, mais pas pour un autre
Attention: l’observation de différences entre des groupes pour les relations prédictives peut être attendue parce que ceci est justifié théoriquement … il ne s’agit alors pas d’un biais
Qu’est-ce que le biais de fidélité dans les items et tests ?
Les estimés de la fidélité sont significativement différents dans différents groupes
Peut être potentiellement important pour l’interprétation
s’il y a un biais, le niveau de confiance qu’on peut avoir envers les scores d’une échelle varie d’un groupe à l’autre
Les différences de groupe observées au niveau des moyennes peuvent alors être en partie expliquées par de l’erreur.
Bien que faire du «testing» en comparant des groupes selon le sexe, l’origine ethnique ou culturelle, le groupes clinique, etc., est informatif pour plusieurs chercheurs, souvent, on fait de la ____________.
La variation entre les individus d’un même groupe peut être énorme.
En tant que psychoéducateur, il ne faut jamais perdre du vue que l’objectif d’une évaluation psychoéducative est d’interpréter les scores et de faire des recommandations ____________.
«sur-généralisation»
Pour UN individu particulier
Quelle catégorie de tests utiles en psychoéducation est souvent oubliée ?
Mesures de construits environnementaux
Ex. climat de groupe.
Les psychoéducateurs peuvent-ils passer des tests d’intelligence ?
Non
De façon générale, les organisations professionnelles s’attendent à ce que les auteurs d’un tests aient construit leur instrument en respectant les critères répertoriés dans les _____________.
«Standards du testing en éducation et en psychologie»
La construction et la validation d’un test est en général un processus court. Vrai ou faux ?
Faux.
- Nécessite des révisions avant d’être pleinement satisfaisant
- Peut s’échelonner sur plusieurs années, voire quelques décennies
Les étapes pour construire les tests sont systématisées à tous les tests. Vrai ou faux ?
Faux. Il n’y a pas une seule façon de faire. Les étapes peuvent varier selon plusieurs circonstances.
Ces étapes peuvent varier, certaines étant essentielles pour certains types de tests, alors que d’autres sont superflues ou même impossibles pour d’autres types de tests
Certaines propriétés psychométriques sont critiques pour certains types de tests
P. ex., évaluer la capacité de classification (sensibilité, spécificité) est essentielle pour les mesures de dépistage des problèmes d’adaptation ou psychopathologies.
Ex. Certains tests qui veulent prédire la violence en milieu psychiatrique ont une très mauvaise validité factorielle (ne fait pas des construits). On ne ferait donc pas ces analyses sur ces tests. Cependant, la validité prédictive est critique (doit être évaluée).
Quelles sont les étapes de construction d’un test ? (9)
- Définir le construit de façon exhaustive; établir les domaines et sous-domaines; établir le réseau nomologique
- Déterminer le type de test pertinent
- Déterminer le type d’items pertinent et développer un bassin d’items
- Déterminer la ou les utilisations prévues
- Déterminer la longueur du test nécessaire et la pertinence de formes parallèles
- Faire une étude pilote auprès des individus ciblés (évaluer certaines propriétés psychométriques de base et la vraisemblance)
- Faire une validation empirique détaillée (propriétés psychométriques)
- Effectuer la standardisation ou l’étalonnage, i.e., établir des normes)
- Produire la documentation technique; i.e, un manuel de l’utilisateur.rice
Quelles sont les deux méthodes de construction des tests ?
- Déductive (ou rationnelle)
«conclure en partant de propositions prises pour prémisses». Part d’un cadre théorique (théorie scientifique ou théorie clinique qui cherche à répondre à un besoin pratique) - Inductive (ou empirique)
«conclure en remontant des faits à la loi»
Quelles sont les avantages de la méthode déductive rationnelle pour la construction des tests ? (2)
Avantage: Contexte théorique clair, cohérence logique (i.e., réseau nomologique a priori)
Quelles sont les désavantages de la méthode déductive rationnelle pour la construction des tests ? (3)
- Subjectivité et théorie implicite
- On ne sait pas si ça fonctionne dans la réalité sans faire des études empiriques (la structure factorielle, validité de critère, etc.)
- On ne sait pas si les répondants interpréteront les items inspirés de la théorie (et en conséquence, les construits) de la même manière que le concepteur du test le croyait
P. ex., une échelle d’évaluation du mécanisme de défense de l’humour est en fait reliée à l’Extraversion
Sur quelle démarche est basée la méthode inductive ? Quelles sont les deux méthodes qui y sont associées ?
Basée sur une démarche empirique (ou factuelle, ou pragmatique)
- Analyse d’items / Analyse factorielle : items statistiquement liés au construits sont sélectionnés (peut aussi inclure cohérence interne, validité de critère, etc.)
- Sélection critériée : p. ex., seuls les items qui différencient des groupes sont sélectionnés (échelle Antisocialité du MMPI-2)
Toutefois, ce n’est jamais complètement empirique
pour générer des items, il y a toujours une théorie sous-jacente, même si elle est implicite. On peut aussi se baser sur des tests existants (ajouter ou enlever des items)
Quels sont les avantages de la méthode inductive de construction de tests ? (3)
Plus grande objectivité et plus représentatif de la réalité, vérifie notre compréhension d’un construit, appuyée par des données.
Quels sont les désavantages de la méthode inductive ? (2)
- On arrive pas nécessairement à ce qu’on voulait, les données dictent le résultat final (p. ex., structure factorielle, etc.)
P. ex., items d’anxiété/dépression sont combinés dans un seul facteur (dénaturation des concepts) - Les statistiques peuvent parfois dénaturer les concepts en raison de biais d’échantillonnage (ex. échantillon non-représentatif)
P. ex., les statistiques suggèrent d’éliminer un aspect clinique important, alors que les résultats discordants sont surtout le fruit d’un mauvais échantillonnage. Ex. structure de 4 items alors qu’on pensait qu’il y en avait 3.
Quelles sont les deux distinctions les plus fondamentales dans les choix ou échelles de réponse ?
La distinction la plus fondamentale est le type de réponse qui est demandé à la personne évaluée : (a) items à réponses construites et (b) items à réponses sélectionnées
Quelles sont les différentes catégories de choix ou échelles de réponse ?
- Items à réponses construites
- Items à réponses sélectionnées
- Échelle de fréquence (ex. jamais, rarement, assez souvent, toujours)
- Échelle de variété (aucun, 1 ou 2 de ces comportements, 3 à 5 de ces comportements, 6 comportements ou plus)
- Échelle d’intensité/gravité (pas du tout problématique, un peu problématique, etc.)
- Échelle de Likert (tout à fait en désaccord, un peu en désaccord, neutre, un peu d’accord, tout à fait d’accord).
Qu’est-ce qu’un item à réponse construite ?
Aussi appelés «questions à développement» ou «à réponse ouverte» ou «à réponse libre»
Une prémisse est présentée à la personne évaluée, mais pas de contrainte sur un choix de réponse fixe. Pas de score T associé à ce genre de réponse, mais plutôt de l’analyse de contenu.
Il y a néanmoins certaines règles, ce qui fait qu’il existe des (a) questions ouvertes à réponse longue et (b) des questions ouvertes à réponse succincte
Un exemple de réponse longue serait :
«Décrivez-moi votre relation habituelle avec votre enfant? »
Un exemple de réponse succincte serait :
«En utilisant au maximum 4 ou 5 mots, complétez la phrase suivante : “Ma relation habituelle avec mon enfant est” : __________»
Les questions à réponses construites sont essentielles en entrevue.
Qu’est-ce qu’un items à réponses sélectionnées ?
Aussi appelés «questions objectives», ou «à choix multiples», ou «vrai ou faux»
Une prémisse est présentée à la personne évaluée et elle est placée devant la contrainte cognitive d’un choix de réponse fixe
Il s’agit du type d’items le plus utilisé dans les instruments d’évaluation en sciences humaines et sociales
Plus objectifs, plus facile de dériver un score numérique, plus fiables, plus brefs, etc.
Lorsqu’un personne doit répondre à une question à réponse sélectionnée, elle doit effectuer quatre tâches cognitives. Quelles sont-elles ?
- Compréhension : comprendre le contenu pertinent
- Récupération : récupérer l’information pertinente en mémoire qui est nécessaire pour répondre
- Jugement : porter un jugement sur la base de l’information récupérée
- Répondre : rapporter ce jugement, sur la base du choix de réponse disponible
Des biais peuvent être introduits à chacune des tâches cognitives associées au fait de répondre à une question, et avec le cumul, la réponse finale peut évidemment être fortement biaisée.
Il est donc toujours recommandé que les items aient certaines caractéristiques souhaitables. Quelles sont-elles ? (4)
Niveau de langage simple, bref, choix de réponses simples, évite contenu multiple, etc.
Les études montrent que les questions sur des sujets sensibles peuvent causer des problèmes particuliers. Donnez des exemples (3)
Augmentent la non-réponse, la dissimulation et la distorsion
La question de la traduction est cruciale au Québec, où on utilise souvent des traductions maisons. Que veut-on dire par ce terme ? (2)
Traduction :
(1) sans aucune étude vérifiant leurs propriétés psychométriques et/ou (2) sans recueillir des normes québécoises
Pour ce qui est de la traduction des tests, souvent une traduction simple est insuffisante. Que doit-on faire ?
Souvent une traduction simple est insuffisante, une adaptation est nécessaire
Important:
La compréhension du contenu, le sens / signification des items est plus important que la traduction exacte
Principe d’un instrument standardisé suggère qu’il s’agit d’une étape qui doit être prise au sérieux
Quelles sont les six étapes de l’adaptation transculturelle ?
- Traduire et adapter les items (2 personnes min.)
Méthode de choix : Traduction à rebours à l’aveugle («back translation») - Experts indépendants révisent la traduction
- Adapter les items selon leurs commentaires
- Étude pilote auprès des individus ciblés
- Validation empirique (évaluation détaillée des propriétés psychométriques)
- Standardisation (établir des normes)
Qu’est-ce que la traduction à rebours à l’aveugle ?
Deux personnes traduisent l’outils dans la langue visée, puis d’autres personnes indépendante retraduisent dans la langue originale. On présente la version retraduite aux auteurs de l’outils original.
Comme c’est du travail bénévole (pour ne pas biaisé la réponse), ça peut être très long.
Quelles sont les cinq façons d’établir l’équivalence transculturelle ?
- Équivalence sémantique
Items veulent dire la même chose dans les deux langages/cultures ? - Équivalence de contenu
Est-ce que chaque item est pertinent dans les deux langages/cultures pour mesurer le construit ? - Équivalence de construit
Est-ce que les saturations factorielles sont similaires? Est-ce que la structure factorielle est la même? (ins. multidimensionnels) Est-ce que val. C/D est similaire? - Équivalence critériée
Difficile : p. ex., un problème ici n’en est pas un ailleurs - Équivalence de la fidélité
Les instruments de la famille des échelles d’évaluation («rating scales») sont certainement les plus employés, autant en recherche qu’en pratique. Quels sont leurs avantages ? (5)
- Très simples d’utilisation: pas besoin de formation complexe
- Brefs: la plupart prennent quelques minutes
- Peu coûteux: certains sont gratuits
- Permettent de recueillir beaucoup d’information sur plusieurs dimensions de l’adaptation à l’aide de plusieurs informateurs
- Procurent des scores qui sont aussi valides et fiables que l’information recueillie en entrevue ou par de l’observation systématique
Contrairement à l’entrevue semi-structurée ou non structurée, les questions et les choix de réponse sont les mêmes pour tous, donc force les informateurs à cadrer leur «définition» et estimation des comportements, des émotions, etc.
Qu’est-ce que la standardisation ?
Uniformité des stimuli (consignes, questions et choix de réponse) pour toutes les personnes qui remplissent l’échelle
À quoi servent les échelles d’évaluation standardisées ? (5)
- estimer rapidement les déficits et les forces potentiels des individus évalués en comparaison aux autres individus du même âge et du même sexe/genre (ou autres regroupements)
- faciliter l’évaluation des progrès ou des effets d’une intervention
- faciliter la comparaison des comportements dans différents contextes naturels (à l’école, à la maison) ou d’intervention (au centre de réadaptation, en CPE, etc.)
- faciliter la comparaison de l’information provenant de différents informateurs (p. ex., parents, enseignants, amis, conjoints, psychoéducateurs, etc.)
- procurer une façon de communiquer de l’information standardisée entre les intervenants d’une même organisation ou entre les organisations qui travaillent auprès des individus en difficulté
Quels sont les choses à vérifier pour déterminer si les évaluations sont valides avec les échelles d’évaluation standardisées ? (8)
- Antécédents de l’informateur
Nature de la relation avec l’évalué? Connait bien l’évalué? - Rapport (alliance) établi avec l’informateur
Perception des professionnels de l’intervention? Qualité du rapport avec la personne qui fait l’évaluation? Niveau de collaboration? - Motif d’évaluation
Perception de l’évaluation à faire?
Importance préalable attribuée aux problèmes de l’évalué?
Perception qu’a l’informateur de sa responsabilité à l’égard des problèmes de l’évalué? (se sent «responsable» des problèmes?) - Faux pasde l’évaluateur : Erreurs commises par l’évaluateur lors de la compilation ou de la transformation des scores
- Compréhension des consignes : informateur est de bonne foi, mais n’a pas bien compris ce qu’on attend de lui (ce n’est pas parce que nous avons compris que la personne comprend bien).
- Intention de l’informateur (objectif autre que celui d’évaluer objectivement les caractéristiques de l’évalué)
- Styles de réponse de l’informateur (tendance à répondre non reliée au construit ciblé.
- Interaction entre l’informateur et le trait évalué
La théorie centrale dans le Guide d’évaluation de l’OPPQ (2014) en est une familiale. Pour quelles raisons les informations provenant des parents est cruciale pour obtenir une validité écologique ? (3)
- D’abord, les enfants (préscolaire et une partie du primaire), ne peuvent pas s’autoévaluer
- Ensuite, il est raisonnable de postuler que les parents sont ceux qui connaissent le mieux l’enfant
l’ont observé sur une longue période de temps, très fréquemment, dans divers contextes (beaucoup plus que les enseignants, par exemple)
- Les études prédictives suggèrent que l’information provenant des parents est particulièrement importante dans le processus de dépistage et d’évaluation des problèmes d’adaptation émotifs et comportementaux - Troisièmement, le point de vue des parents est nécessaire pour dresser le profil d’adaptation de l’enfant, mais aussi souvent pour élaborer un PI
- la majorité des théories de psychopathologie développementale postulent un rôle de la famille ou des parents
- les interventions les plus efficaces comportent toutes une composante «famille» ou parentale
L’information provenant des parents est cruciale, mais elle ne constitue qu’une source d’information parmi d’autres (non-suffisante). Quelle autre source occupe une place centrale pour l’évaluation des enfants ?
Les enseignants.
Pourquoi l’information provenant des enseignants est-elle également importante pour l’évaluation ? (3)
- École est un milieu que l’enfant et l’adolescent.e doit obligatoirement fréquenter, au moins de 5-6 à 16 ans au Québec
- Jeunes passent plusieurs heures par jour à l’école, la majorité de l’année, elle peut donc avoir un impact important sur l’adaptation et le développement de l’enfant (Janosz et al., 1998)
- L’école impose plusieurs contraintes à l’enfant qui ne sont souvent pas présentes dans d’autres contextes comme à la maison
P. ex., respect des règles de classe, contrôle des impulsions, attention soutenue, réussite scolaire, etc.
Les enseignants sont souvent considérés la meilleure source d’information pour une problématique spécifique. Quelle est-elle ?
- Problèmes d’attention et d’hyperactivité
- les enseignants peuvent observer les enfants dans des situations contraignantes qui demandent un haut niveau d’attention soutenue, le contrôle de l’activité motrice ainsi que des systèmes de résolution de problème
Les enseignants sont considérés une moins bonne source d’information pour d’autres problèmes spécifiques. Quelles sont-elles ? (2)
- Comportements antisociaux
P. ex., violence envers les pairs ou animaux, consommation de drogues, vandalisme, etc. La violence instrumentale est peut-être moins visible par les enseignants. Ils peuvent plus voir la violence réactive. - Problèmes intériorisés
P. ex., ils/elles tendent à remarquer moins facilement les conduites de retrait, l’humeur dépressive ou certains symptômes anxieux parce que les comportements EXT monopolisent plus leur attention, mais aussi possiblement compte tenu du ratio enseignant-élève trop élevé
L’information provenant des enseignants peut aussi être plus ou moins importante selon l’âge de l’enfant. Expliquez.
Les enfants du primaire sont généralement suivis par le même enseignant dans plusieurs matières, la majorité de la journée et à l’année
Au contraire, au secondaire les adolescents voient un enseignant une fois dans la journée ou même la semaine pour une matière spécifique
L’information provenant des enseignants devient donc moins utile au fur et à mesure que l’enfant avance dans son cheminement scolaire et qu’il voit les enseignants de façon ponctuelle
La pertinence de l’information dépend aussi du type d’enseignant. Expliquez.
L’évaluation de l’enseignant régulier est parfois considérée plus utile que celle de ceux de classe spéciale, qui n’ont pas la même perception et expérience, ni le même niveau de tolérance
L’évaluation des enseignants spécialisés (i.e., éducation physique, arts plastiques, etc.) peut être utile pour comprendre l’adaptation de l’enfant dans différents contextes spécifiques dans l’école
Permet de mieux évaluer les variations intra-contexte.
Il faut toujours considérer le «cadre de référence» de l’enseignant. Expliquez. (3)
- Différents types de formation (moins vrai aujourd’hui)
- Certains ont beaucoup d’expérience, travaillent depuis plusieurs années
procure un schéma cognitif de base, une «norme implicite» plus vaste pour comparer l’enfant évalué avec les autres enfants du même âge - Certains ont davantage d’expérience avec les élèves en difficulté
ceci peut, dans certains cas, procurer un schéma cognitif «biaisé» qui influence leur évaluation
Les profs comparent les élèves selon leur modèle de référence (ex. un enseignant en classe spéciale a une vision différente de la normalité que celle d’un prof régulier).
Dans l’ensemble, les instruments les plus intéressants et pratiques sont les _________________________.
Systèmes d’évaluation intégratifs multi-informateurs, comme l’ASEBA
Qu’est-ce que l’ASEBA (Achenbach System of Empirically Based Assessment)?
- Disponible en français (Thomson-Nelson)
- Un des instruments les plus employés dans le monde, autant en recherche qu’en clinique
- Fait partie d’un système d’évaluation intégratif (parents, enseignant.e.s, autoévaluation, système d’observation, entrevue semi-structurée)
Différentes versions: Préscolaire (1½-5 ans), âge scolaire (6-11 ans), adolescence (12-18 ans), et âge adulte et vieillesse (jusqu’à 60-90+ ans) - Basé sur approche empirique (analyses factorielles d’une grande liste d’items mesurant les émotions et comportements des enfants)
- 101-113 items, selon les versions
Quelles sont les qualités psychométriques de l’ASEBA ?
- Bonnes normes générales de la population et par sexe, mais pas de normes cliniques
- Procurent scores-T et centiles, pas d’ESM
- Propriétés psychométriques très bien établies, mais certains problèmes avec la structure factorielle (pas la même structure pour les filles que les gars et
certaines études montrent qu’elle est difficile à répliquer dans certains pays (Canada = OK).
Quelles sont les différentes échelles de l’ASEBA ? (2)
- Échelles dérivées empiriquement (factorielles)
- Problèmes Extériorisés: Agressivité, Conduites antisociales et Problèmes d’attention
- Problèmes Intériorisés: Anxiété/Dépression, Somatisation, Problèmes sociaux/Retrait, Problèmes cognitifs - Échelles basées sur les diagnostics du DSM («DSM-based scales»)
Problèmes d’attention/hyperactivité, Problèmes d’opposition/défiance, Problèmes de conduite, Problèmes affectifs, Problèmes d’anxiété, Problèmes somatiques
Qu’est-ce que le BASC-3 (Behavior Assessment System for Children) ? (6)
- Instrument récent, disponible en français (Pearson)
- Fait partie d’un système d’évaluation intégratif (parents, enseignants, autoévaluation, système d’observation)
- Plusieurs ajouts importants en passant de la version 2 à la version 3 = 32% d’items révisés ou nouveaux (Quest. historique développemental structuré Quest. de relations avec les parents)
- Différentes versions: Préscolaire (2-5 ans), enfance (6-11 ans) et adolescence (12-18 ans)
- Basé sur une approche mixte (rationnelle et empirique)
- 126-138 items, selon les versions
Quelles sont les qualités psychométriques du BASC-3 ?
- Scores-T, centiles et ESM
- Propriétés psychométriques sont dans l’ensemble assez satisfaisantes
- Normes générales de la population (générales et par sexe) et normes cliniques (ex. pour enfants TDAH)
Quelles sont les différentes échelles du BASC-3 ? (5)
- Cliniques: Échelles de comportements inadaptés ou maladaptatifs
- Adaptatives: Échelles de comportement adaptatifs ou de forces
- Composites (3): Échelles générales combinant différentes échelles cliniques (16) : extériorisés, intériorisés, capacités adaptatives.
- Indices probabilistes: Échelles composées d’items sélectionnés comme étant les meilleurs pour distinguer des groupes cliniques (ex. TDAH, trouble émotionnel-comportemental, autisme, inadaptation fonctionnelle, clinique général).
- Validité
Qu’est-ce que le Conners Rating Scale-3 (CRS-3) ?
- Très utilisée en recherche et en clinique, surtout pour l’évaluation du TDAH
- Disponible en français (Multi-Health Systems)
- Pour les jeunes de 3 à 17 ans
- Basé sur une approche mixte (rationnelle [DSM] et empirique [analyse factorielle])
- Versions originale longue (99 items) et courte (45 items)
Quelles sont les qualités psychométriques du CRS-3 ?
Normes québécoises par sexe disponibles, pas de normes cliniques
Procurent scores-T et centiles, pas d’ESM
Bonnes propriétés psychométriques dans plusieurs langues