Lecture-Chap 1 Flashcards

1
Q

La construction d’un test en psychologie ou en éducation est un processus de longue haleine. Cinq étapes principales peuvent être distinguées dans ce processus. Quelles sont ces 5 étapes ?

A
  1. LA DÉTERMINATION DES UTILISATIONS PRÉVUES DU TEST
  2. LA DÉFINITION DE CE QUE L’ON SOUHAITE MESURER
  3. LA CRÉATION DES ITEMS
  4. L’ÉVALUATION DES ITEMS
  5. LA DÉTERMINATION DES PROPRIÉTÉS MÉTRIQUES DU TEST DÉFINITIF
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Expliquez en quoi consiste la 1ère étape de la construction d’un test en psychologie (1. LA DÉTERMINATION DES UTILISATIONS PRÉVUES DU TEST)

A
  • fonctions que le test devra remplir, à quoi va-t-il servir ?
  • les usages prévisibles d’un test déterminent profondément ses caractéristiques (fonctions déterminent la nature du test à construire et, par conséquent, la méthodologie à utiliser pour élaborer un tel outil)

*Il est illusoire de vouloir créer un test « généraliste »
qui ambitionne de répondre à tous les besoins des praticiens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la différence entre un test normatif et un test critérié ? Une distinction essentielle à la construction d’un test psychologique (étape 1)

A

En particulier, une distinction nette doit être tracée entre les tests normés et les tests critériés. Les tests normés visent à discriminer les sujets appartenant à la population pour laquelle est construit le test. Ces tests peuvent, par exemple, nous procurer des informations sur le degré d’anxiété d’un sujet par rapport au niveau de l’anxiété dans l’ensemble de la population. Il en va de même pour le niveau de compétence en mathématique ou pour tout autre caractéristique que l’on souhaite mesurer. Par contre, les tests critériés ont pour fonction d’évaluer si un
sujet possède ou non certaines caractéristiques prises comme référence. Le choix de construire un test normé ou un test critérié conditionne la méthodologie utilisée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la différence entre un test certificatif et un test diagnostique? Une distinction essentielle à la construction d’un test psychologique (étape 1)

A

Un test certificatif doit couvrir l’ensemble d’un programme
scolaire. Un tel test est habituellement centré sur les performances. Il doit en effet permettre de vérifier si l’élève est capable de réaliser les tâches que l’on attend de lui en fin d’apprentissage. Par contre, un test diagnostique est généralement beaucoup plus
ciblé. Son but est de comprendre le sens d’une performance. Par exemple, il ne s’agit plus, comme avec un test certificatif, de simplement vérifier si un élève peut additionner correctement deux nombres décimaux, mais de comprendre pourquoi certains élèves présentent des difficultés pour réaliser de telles additions. L’information que l’on désire recueillir ne se limite plus à la performance, mais concerne les capacités cognitives sous-jacentes à ces performances.

Ainsi, les propriétés d’un test diagnostique sont nécessairement très différentes de celles d’un test certificatif. Ces deux types d’outils doivent, par conséquent, être conçus de manière spécifique en s’appuyant sur une méthodologie adaptée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquez en quoi consiste la 2ème étape de la construction d’un test en psychologie (LA DÉFINITION DE CE QUE L’ON SOUHAITE MESURER)

A

-définir avec précision les caractéristiques psychologiques ou éducatives que le test devra mesurer. Sur base de cette définition, des items pourront alors être construit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).

DOP

A

La définition des objectifs pédagogiques et la construction d’un tableau de spécifications : préciser les performances que les élèves devront démontrer à un moment donné de leur apprentissage . Le tableau de spécifications est un de ces outils permettant de déterminer les divers types de comportements attendus relativement à un contenu disciplinaire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).

ACE

A

L’analyse de contenu d ‘entretiens : Lorsque le praticien n’a pas d’ idées précises à propos des caractéristiques permettant de discriminer les individus qui seront évalués par le test, il est intéressant de commencer par interroger des personnes appartenant à la population visée par ce test. L’interview, libre ou semi-structurée, permet de recueillir un grand nombre d’informations qui seront sélectionnées et classées au moyen d’une analyse de contenu (ex : propositions qui servent à construire un questionnaire par la suite)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).

ODC

A

L’observation directe des comportements : Dans certains cas, plutôt que d’interroger les personnes, il est préférable de les observer dans leur milieu de vie ou de travail. Cette méthode a été utilisée par Binet pour construire le tout
premier test d’intelligence de l’histoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).

MIC

A

La méthode des incidents critiques : L’origine de cette méthode est attribuée à Flanagan ( 1954). Elle est particulièrement utile pour construire des outils d’évaluation des performances professionnelles. Elle consiste à demander à des responsables de décrire des situations de travail où les employés sous leurs ordres ont agi de manière particulièrement efficace ou, au contraire, inefficace. Partant de cette description, certains comportements « critiques » peuvent être mis en évidence et servir à construire des échelles d’évaluation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).

RMT

A

La référence à un modèle théorique : À la différence des autres méthodes, celle-ci ne part pas de l’expérience, mais d’un modèle de la réalité construit au cours de recherches antérieures. Depuis le début des années 1980, les développements de la psychologie cognitive ont conduit à la création de nombreux modèles théoriques utilisables par les constructeurs de tests. Des tests destinés au diagnostic des troubles de la lecture ont, par exemple, été créés sur base de modèles décrivant les processus impliqués dans l’activité de lecture (p.ex. de
Partz, 1994 ; Mousty & al., 1 994). D’autres outils ont également été construits en référence à des modèles théoriques pour évaluer des caracté1istiques aussi
diverses que le calcul, la motivation, la mémoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Souvent, les praticiens ne suivent aucune méthodologie pour construire les items. Ayant en tête ce qu’ils souhaitent mesurer, ils se fient à leur intuition pour produire les questions. Pourtant, il est indispensable d’avoir un projet et un plan précis avant de se lancer dans la production d’items. Quelles sont les 3 questions qu’il est essentiel de se poser ? En quoi aideront aideront-ils à la 3ème étape de la construction d’un test psychologique (LA CRÉATION DES ITEMS)

A
  1. Quel format d’items choisir ? Pourquoi ? Le choix d’un format ne doit pas être arbitraire. Il découle d’un ensemble de contraintes concernant les objectifs du test et les conditions matérielles de création, de passation et de cotation de celui-ci. En conséquence, il n’y a pas de bon format d’item dans l’absolu. Un format est bon s’il est adéquat au but et à la situation d’évaluation.
  2. Quel doit être le niveau de difficulté des items ? Le choix du niveau de difficulté des items dépend de l’objectif du test. Ce niveau variera selon que le
    test est normé ou critérié, certificatif ou formatif. En d’autres termes, c’est la nature des informations que l’on désire recueillir qui doit déterminer le niveau de difficulté des items à produire.
  3. Combien faut-il créer d’items ? (Dépend de 3 facteurs : durée, niveau fidélité, élimination d’items)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Souvent, les praticiens ne suivent aucune méthodologie pour construire les items. Ayant en tête ce qu’ils souhaitent mesurer, ils se fient à leur intuition pour produire les questions. Pourtant, il est indispensable d’avoir un projet et un plan précis avant de se lancer dans la production d’items. 3 questions sont essentielles à se poser. La 3ème étant : combien d’items faut-il créer, dépend elle-même de 3 facteurs, lesquels ?

A

Le nombre d’items à créer dépend de plusieurs facteurs :
3. 1 Durée du test. Selon que l’on souhaite un test
court, pouvant être passé en 10 minutes, ou un test diagnostique se déroulant sur plusieurs séances d’examen, le nombre d’items à créer variera considérablement.
3.2 Niveau désiré de fidélité du test.
Un test long sera généralement plus fidèle qu’un test court Par ailleurs, si le test comporte plusieurs sous-scores, il sera nécessaire d’assurer la fidélité de ceux-ci en prévoyant suffisamment d’items dans chacune des sous-échelles du test.
3.3 Élimination de certains items après leur évaluation par des experts et leur mise à l’essai. Si l’on veut que la version finale du test contienne assez d’items, il faudra donc en créer plus que le strict nécessaire. Si, par exemple, le test final doit contenir 20 items, on en créera 30 et l’on retiendra les 20 meilleurs de ceux-ci. Habituellement, un surplus de 30 à 50 % d’items est nécessaire pour éviter de ne pas avoir un nombre suffisant d’items après la mise à l’essai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquez en quoi consiste la 4ème étape de la construction d’un test en psychologie (L’ÉVALUATION DES ITEMS). Quelles sont les démarches complémentaires pour réaliser cette tâche ?

A

Pour garantir les propriétés métriques des items,
une évaluation minutieuse de ceux-ci doit également être réalisée. Deux démarches complémentaires sont habituellement suivies pour réaliser celte tâche.
1. Une évaluation. des items par des juges. Ceux-ci sont chargés d’apprécier la conformité des items aux exigences définies lors de la seconde étape du processus de construction du test.
2. La réalisation d’une mise à l’essai des items suivie d’une analyse qualitative et quantitative des résultats. La mise à l’essai complète l’appréciation des items par des juges. Cette dernière évaluation reste en effet subjective malgré la rigueur méthodologique avec laquelle elle peut être réalisée. La mise à l’essai permet de recueillir des données empiriques, directement de la population
à laquelle est destiné le test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux ?
La mise à l’essai, dans la 4ème étape de construction d’un test psychologique (évaluation des items) consiste à faire passer tous les items à un échantillon de la population.

A

Vrai. Cet échantillon ne doit pas nécessairement être représentatif ni de très grande taille. Sa taille dépend en
fait de l’hétérogénéité de la population visée par le test et de la grandeur de la population de référence. Par exemple, si un questionnaire de stress est destiné à évaluer uniquement des pilotes d’avion, une ntise à l’essai sur un échantillon de 50 pilotes permettra généralement une évaluation satisfaisante des items, car la population des pilotes d’avion est plus homogène et de plus petite taille que la population en général.
Un échantillon trop homogène risque en effet de
masquer certains items problématiques.
Les résultats d’une mise à l’essai sont analysés d’un point de vue tant qualitatif que quantitatif. En particulier, les commentaires des sujets à propos des items peuvent se révéler précieux pour comprendre des résultats aberrants et pour remédier à certains problèmes de formulation des questions. De même, les problèmes de manipulation du matériel, d’enregistrement des réponses, de temps de passation, de cotation des réponses peuvent être repérés à cette occasion. Ces problèmes, en apparence
mineurs, doivent retenir toute l’attention du constructeur car ils peuvent diminuer considérablement la validité des résultats d’un test.

En plus de ces vérifications qualitatives, la mise à l’essai permet de réaliser différentes analyses statistiques des résultats. Ces analyses portent, entre autres, sur la difficulté des items, leur discrimination, leur fonctionnement différentiel. Sur base de ces analyses et des observations qualitatives, les meilleurs items seront finalement sélectionnés et serviront à construire la version définitive du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Expliquez en quoi consiste la 5ème étape de la construction d’un test en psychologie (détermination des propriétés métriques du test définitif). Quelles sont les informations essentielles à préciser/divulguer à cette étape ?

A
  1. Les propriétés qui doivent retenir l’attention du constructeur varient en fonction de la nature du test. S’il s’agit d’un test normé, il sera nécessaire d’établir des normes et de présenter celles-ci selon une échelle aisément compréhensible par les praticiens. S’il s’agit d’un test critérié, il faudra préciser des scores de référence utiles. Par ailleurs, si les résultats du test doivent
    être mis en relation avec ceux d’autres tests, il y aura lieu de mettre en équivalence les échelles de mesure concernées.
  2. Une investigation approfondie de la validité et de la fidélité des résultats de la version finale du test devra toujours être réalisée. Il faut souligner que l’évaluation de la validité des résultats à un test n’est pas du seul ressort du constructeur. Elle est partagée par l’utilisateur du test. En fait, la validité n’est jamais une qualité acquise une fois pour toutes.
  3. Le constructeur devra également apporter des informations à propos de la fidélité des résultats. Il peut choisir parmi une variété d’indicateurs tels que le coefficient de fidélité et les autres mesures liées à celui-ci et nécessaires aux praticiens, telles que l’erreur de mesure de scores, les intervalles de confiance, l’erreur de mesure des différences entre scores, etc.
  4. La rédaction d’une documentation destinée aux utilisateurs est nécessaire. Cette documentation doit présenter les données métriques citées ci-dessus (normes, coefficient de fidélité … ) ainsi que les bases théoriques du test, les fonctions pour lesquelles
    il a été créé et les qualifications requises pour pouvoir l’utiliser et en interpréter correctement les résultats (responsabilité éthique)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dans l’enseignement, les tests sont appelés à jouer plusieurs rôles. L’instrument de mesure sera construit différemment selon la fonction à laquelle on le destine. Nommez les deux grands ensembles de situations où les tests jouent un rôle important en situation scolaire. Donnez des exemples.

A
  1. L’évaluation sommative : on cherche à construire un instrument de mesure qui permette d’évaluer un échantillon de toute la matière enseignée. Un bon bilan nécessite un échantillonnage du contenu qui soit exhaustif et représentatif. Pour ce faire, une
    mesure fondée sur les objectifs d’apprentissage est nécessaire. Ex :
    - dresser un bilan des acquis de l’élève ;
    - prendre une décision sur la promotion de l’élève;
    -sélectionner les élèves selon certaines caractéristiques particulières afin de former des groupes ;
  2. l’évaluation formative: on cherche à construire un outil qui permette une prise d’information focalisée et compréhensive. En fait, l’intérêt n’est pas de couvrir toute
    la matière, mais un aspect bien particulier de celle-ci. Alors que plusieurs objectifs peuvent être couverts dans un bilan, l’évaluation formative peut ne porter que sur un
    seul objectif. L’évaluation formative a pour fonction de fournir à l’enseignant et à l’élève une information pertinente sur le déroulement des apprentissages (mesure critériée)
    -identifier les aspects de la résolution d’un problème source de difficultés ;
    -préparer une révision de la matière à partir des points pour lesquels certains élèves éprouvent des difficultés ;
    -faire prendre conscience aux élèves de certains points majeurs de la matière.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Dans l’évaluation sommative, lors de la rédaction d’un objectif, les deux caractéristiques essentielles sont :

A
  • un verbe d’action et un seul ; doit décrire un comportement observable directement ou indirectement
  • un contenu (complément d’objet) et un seul.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dans l’évaluation sommative, lors de la rédaction d’un objectif, on lui ajoutera généralement les composantes (3) suivantes pour accroître sa spécificité :

A
  • le contexte dans lequel sera réalisée la performance attendue ; conditions et ce qui sera à sa disposition
  • le critère d’acceptation de la performance ; niveau de qualité de la performance attendue
  • le seuil d’acceptation de la performance ; critère quantitatif pour considérer l’objectif comme atteint (habituellement entre 80 et 100 %)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vrai ou faux ?

On ne s’attend pas à retrouver ces caractéristiques accessoires parmi les objectifs généraux.

A

Vrai, par contre, elles sont essentielles à des objectifs dits spécifiques. Ex : À l’aide d’un atlas, trouver la longitude et
la latitude exacte des capitales des pays d’Europe,
avec une précision de plus ou moins un degré,
neuf fois sur 10.

Les composantes accessoires des objectifs sont parfois précisées dans les programmes d’études en fonction des niveaux d’enseignement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

En quoi consiste le modèle de Deno et Jenkins ? Quels en sont ces 4 niveaux ?

A

Deno et Jenkins (1969) ont élaboré un modèle qui tient compte de la spécificité nécessaire des objectifs à différents niveaux d’intervention. Il s’agit d’un modèle hiérarchique où chaque niveau supérieur contient les objectifs des niveaux inférieurs.

A. Objectifs globaux
B. Objectifs généraux
C. Objectifs spécifiques
D. Tâche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Expliquez les 4 niveaux du modèle de Deno et Jenkins (spécificité des objectifs selon le niveau d’intervention).

A

Le niveau A est celui des objectifs globaux. Il sert à préciser les choix politiques, institutionnels, les grandes lignes du projet éducatif et de la mission de l’enseignement.

Le niveau B cherche à préciser les objectifs globaux en situant le degré d’approfondissement des capacités (au niveau cognitif) ou le degré d’intériorisation (au niveau affectif) des attentes de l’objectif : c’est le niveau des objectifs généraux

Au niveau C, les intentions se précisent à un point tel qu’on peut y indiquer les conditions précises d’évaluation : catégorie de comportements attendus, contenus précis, conditions de réalisation de la performance et conditions d’acceptation de la performance. C’est le niveau des
objectifs dits spécifiques.

Au niveau D, on retrouve les tâches d ‘examen de même
que les situations entraînant l’observation de performances complexes. C’est le niveau le plus spécifique des quatre niveaux du modèle. Ce n’est pas à proprement parler un objectif (mais la tâche est la meilleure manière de connaître comment se traduisent les objectifs pédagogiques dans les faits).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

C’est au niveau B du modèle de Deno et Jenkins qu’interviennent les taxonomies d’objectifs généraux. On
distingue trois grandes catégories taxonomiques :

A

l. objectifs cognitifs : rôles
- au niveau des programmes d’études ;
- au niveau de l’évaluation des apprentissages
2. objectifs affectifs
3. objectifs psychomoteurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Lorsque l’on souhaite préciser l’enchaînement de plusieurs objectifs dans un programme d’études, on peut distinguer les objectifs terminaux des objectifs intermédiaires. Expliquez-les.

A

L’objectif terminal décrit la finalité ultime d’un apprentissage, son point d’arrivée. L’objectif intermédiaire énumère les étapes nécessaires qui doivent jalonner le cheminement de l’élève du point de départ au point d’arrivée. Sans la maîtrise de ces jalons, la maîtrise de l’objectif terminal est compromise. Par contre, lorsque
l’objectif terminal est atteint, on peut conclure que les objectifs intermédiaires ont été maîtrisés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Vrai ou faux ?
Les objectifs terminaux conviennent particulièrement à l’évaluation sommative.

Qu’en est-il de l’évaluation formative ?

A

Ils permettent de couvrir une grande variété de contenus.

De plus, il est normal qu’un bilan porte sur les apprentissages complétés plutôt que sur ceux qui sont en
voie de réalisation. Enfin, lorsqu’il s’agit d’établir un bilan, il est généralement trop tard pour se demander à quel moment de l’apprentissage l’étudiant a éprouvé des
difficultés. Par contre, cette dernière information peut être utile dans le cas d’une évaluation formative ou encore de ce qu’il est convenu d’appeler une évaluation « microsommative »

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Le bilan, qu’il corresponde à une exigence administrative ou pas, se doit d’être représentatif. L’échantillonnage est l’un des outils à la disposition de l’enseignant pour
construire son instrument de mesure. L’échantillonnage des questions peut prendre plusieurs formes (4). Lesquelles ?

A
  1. Échantillonnage aléatoire simple. Chaque question a une chance égale d’être choisie.
  2. Échantillonnage stratifié. Le test entier comporte des questions appartenant à un objectif dans une proportion qui correspond à l’importance de cet objectif dans la matière à couvrir.
  3. Échantillonnage par grappes. L’échantillonnage, dans ce cas, ne se fait pas par question, mais par objectif, car le nombre d’objectifs à couvrir est extrêmement grand.
  4. Échantillonnage hiérarchique. L’échantillonnage se fait en deux étapes :
    (a) d’abord les objectifs et ensuite
    (b) les questions à l’ intérieur des objectifs.

Il est important de noter que seules les deux premières techniques d’échantillonnage permettent, avec un nombre suffisamment grand d’items, d’échantillonner toute la matière. Avec les deux derniers types d’échantillonnage, certaines parties de la matière seront nécessairement omises. Cet inconvénient n’est pas majeur lorsqu’il
s’agit d’un examen qui fait suite à une série d’examens partiels. Cette méthode d’échantillonnage est caractéristique des examens de fin d’année. Par contre, les bilans plus fréquents (fin d’étape) ne peuvent omettre complètement un objectif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Le tableau de spécifications est un moyen utilisé depuis longtemps pour s’assurer que l’échantillonnage des questions d’examen est véritablement représentatif de
la situation qui a prévalu en salle de classe ou encore des exigences décrites clans le programme d’études. Décrivez ce tableau. À quel type d’échantillonnage correspond-t’il ?

A

Il prend généralement la forme d’un tableau de contingence à double entrée, la première étant constituée du contenu, la seconde du niveau taxonomique (ex: connaissance, compréhension ou format d’items, ex : vrai/faux) des objectifs mesurés. Un grand soin est pris pour que la proportion des items d’examen corresponde étroitement à l’importance relative du contenu et du niveau taxonomique du programme d’études. Le tableau de spécifications correspond à un échantillonnage stratifié.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Comment peut-on définir la mesure critériée ?

A

La mesure critériée regroupe un ensemble de procédures permettant une prise d’ information détaillée à propos de l’apprentissage d’un sujet. Ces procédures ont en commun de mieux définir et de mieux contrôler les critères quantitatifs et qualitatifs
de la performance, tels que :
• les aspects de la présentation d’une tâche ;
• les conditions de réalisation d’une tâche ;
• les niveaux d’exigence pour la réalisation d’une tâche.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Quelles sont les 3 techniques qui permettent de construire des instruments de mesure critériée ?

A
  • l’objectif enrichi ;
  • l’analyse des concepts ;
  • la théorie des facettes.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Expliquez l’objectif enrichi, une des 3 techniques qui permettent de construire des instruments de mesure critériée. Popham (J 980) a défini l’objectif enrichi en distinguant trois parties principales. Lesquelles ?

A

A pour but de pallier les limites de l’objectif spécifique en en fournissant une description enrichie. L’objectif enrichi permet de réduire les possibilités d’interprétation en définissant l’objectif avec plus de rigueur. L’objectif enrichi nous permet donc de nous prononcer avec une plus grande assurance sur le degré de maîtrise et de non-maîtrise d’un objectif (chances de variation d’un échantillon à l’autre = réduites au min)

  1. l’énoncé de l’objectif ;
  2. un exemple d’item incluant :
    • une directive ;
    • un exemple.
  3. un complément d’information sur :
    • l’examen (ce que l’élève aura à faire lors du test, la nature du stimulus) ;
    • les choix de réponses ;
    • les critères de correction.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Expliquez l’analyse des concepts, une des 3 techniques qui permettent de construire des instruments de mesure critériée. Quelles sont ses 4 parties ?

A

Capable de faire la différence entre les caractéristiques essentielles et les caractéristiques accessoires du concept étudié. L’analyse de concepts contribue à spécifier un domaine d’items servant à tester l’apprentissage de l’élève. (vérifier s’il y a généralisation des apprentissages avec un objectif particulier)

L’analyse des concepts comporte quatre parties :

  1. la définition des caractéristiques essentielles ;
  2. la définition des caractéristiques accessoires ;
  3. une série d’exemples et de contre-exemples tirés de l’enseignement ;
  4. une série d’exemples et de contre-exemples pour l’évaluation (similaires à ceux de l’enseignement).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Vrai ou faux ?
L’analyse des concepts, une des 3 techniques qui permettent de construire des instruments de mesure critériées, permet aussi d’envisager certaines erreurs conceptuelles qui peuvent être fort utiles lorsqu’il s’agit de rédiger des leurres pour des questions à choix multiples.

A

Vrai, Ainsi, l’analyse des leurres permet d’identifier de manière plus précise le type de difficulté de l’élève. Cette caractéristique particulière de l’analyse des concepts lui confère un avantage certain sur I’ objectif enrichi pour l’évaluation diagnostique ou l’évaluation formative

32
Q

Expliquez la théorie des facettes, une des 3 techniques qui permettent de construire des instruments de mesure critériée.

A

Analogue au choix d’un plan d’observation lors d’une recherche expérimentale. Le praticien choisit les facettes d’intérêt en fonction de ses objectifs et détermine pour
chaque facette un certain nombre de conditions ou valeurs que la facette peut prendre. Le croisement de plusieurs facettes donne lieu à un grand nombre de possibilités d’items dont les résultats permettront de déterminer la maîtrise ou la non-maîtrise d’une capacité selon les situations. Plusieurs profils de performance pourront ainsi être mis au point. Ce modèle de spécification de domaine est très pratique lorsque l’on souhaite établir un profil des performances d’un sujet dans différentes situations. II est alors possible d’identifier le ou les éléments de la ou des facettes qui posent des difficultés au sujet. La spécification de domaine au moyen de facettes et l’étude des profils de performance permettent d’obtenir une mesure fort pertinente dans le contexte d’une évaluation diagnostique ou formative. La théorie des facettes sert également dans le cas d’études de généralisabilité à déterminer à quel point les résultats à un test sont stables à l’intérieur d’un univers de généralisation prédéfini

33
Q

Les questions ouvertes et fermées comportent 3 sous-catégories chacune. Expliquez-les.

A

Questions fermées
• Questions à choix multiples : comprennent deux parties : une amorce (ou prémisse), qui présente le problème, suivie de plusieurs alternatives (choix, options … ) qui sont autant de solutions possibles au problème posé. Outre la solution correcte, les alternatives comprennent des solutions incorrectes, appelées leurres. Le nombre d’alternatives peut varier, mais il est souvent limité à quatre choix.
• Questions d’appariement : forme dérivée des questions à
choix multiples. Au lieu de construire quatre questions à choix multiples (ou plus encore), il peut être plus économique de ne retenir que les amorces de ces questions et les solutions correctes à celles-ci et de demander aux sujets de mettre correctement en relation les quatre amorces, appelées prémisses (colonne A de l’exemple), et les quatre réponses (colonne B).
• Questions « vrai-faux » : évaluer la véracité

Questions ouvertes
• Questions à réponse brève : questions objectives, demandent aux sujets de fournir un mot, une phrase ou un nombre qui peut être évalué comme correct ou incorrect, sans qu’intervienne la subjectivité du correcteur (fidélité?)
• Questions à réponse narrative (ou à développement) problèmes liés à la subjectivité des correcteurs car grande liberté de réponse. Bien adaptées pour évaluer la capacité d’un sujet à organiser, à intégrer et à exprimer ses idées.
• Questions demandant une performance : font intervenir le langage à un degré nettement moindre. Elles demandent en effet aux personnes évaluées de
réaliser une action où le langage peut être totalement absent (jouer un morceau de musique, construire un puzzle, dessiner des formes géométriques, etc.). Par nature, ces questions sont « ouvertes » puisque (‘évalué doit produire la réponse. Elles font souvent intervenir un matériel plus ou moins standardisé afin de permettre des comparaisons et d’avoir un certain contrôle sur les critères d’évaluation des productions. Les questions de performance sont particulièrement intéressantes pour évaluer certaines compétences cognitives et certaines compétences professionnelles.

34
Q

Vrai ou faux ?

Les questions ouvertes sont meilleures que les questions fermées

A

Faux, il n’y a pas lieu de décider dans l’absolu de choisir entre des questions ouvertes ou des questions fermées. Aucun format n’est le meilleur « en général ». Le problème doit être posé en d’autres termes. La véritable question est en effet : « quand faut-il utiliser tel ou tel format d’item ? » C’est en fonction des objectifs du test et de ses conditions d’application qu’un format peut être considéré comme le plus adéquat.

35
Q

Le choix final entre des questions ouvertes ou fermées correspondra au meilleur équilibre entre les différentes
contraintes. Celles-ci peuvent être rangées en quatre catégories. Lesquelles ?

A

A. Les capacités cognitives à mesurer
B. Les conditions matérielles de l’évaluation (temps, espace, matériel)
C. Les fonctions assignées au test
D. Les risques liés à la suggestion de réponses

36
Q

Vrai ou faux ?
Les questions fermées ont la réputation de ne permettre de tester que les niveaux les plus bas de la taxonomie des objectifs cognitifs

A

Vrai. En particulier, de nombreux praticiens croient que les questions fermées n’évaluent que les connaissances et non les capacités cognitives. Ils confondent en fait l’usage qui est généralement fait de ce type de questions et les possibilités effectives offertes par celles-ci. En réalité, tous les niveaux de capacité cognitive peuvent être évalués avec des questions fermées. De ce point de vue, les questions à choix multiples et les questions d’appariement offrent un potentiel rarement exploité

37
Q

Vrai ou faux ?

Le temps de préparation des questions fermées est généralement beaucoup plus long que celui des questions ouvertes

A

Vrai car la présentation de plusieurs possibilités de réponses demande un travail de conception particulièrement délicat.

38
Q

Expliquez la phrase suivante : L’usage qui sera fait des résultats au test pèse aussi lourdement sur le choix du format des questions.

A

Les tests dont les résultats sont utilisés pour la certification ou la sélection doivent, le plus souvent, prendre en compte d’importantes contraintes de temps de passation et de correction. De plus, ces tests doivent avoir une fidélité particulièrement élevée. En effet, ils débouchent généralement sur une décision, sans que d’autres prises d’information soient possibles. La mesure doit donc être très précise. Pour la même raison, le contenu de ces tests doit couvrir une étendue suffisante du domaine de compétence visé. Ces différentes contraintes font que des questions fermées sont généralement choisies pour ce type de test. De même, leur fidélité est bien contrôlée du fait de la standardisation des modalités de passation et du peu d’interprétation devant intervenir dans la correction.

39
Q

Vrai ou faux ?

L’usage de questions ouvertes est souvent préféré dans les tests diagnostiques ou formatifs.

A

Vrai, car elles ont la réputation de permettre un recueil d’information plus riche et plus approfondi à propos des compétences des sujets. Cette réputation doit toutefois être nuancée. Les questions fermées, en particulier les items à choix multiples, peuvent elles aussi fournir des informations diagnostiques très intéressantes.

40
Q

Un des problèmes essentiels des questions fermées est de suggérer des réponses. Cette suggestion peut avoir des conséquences indésirables qui doivent bien être évaluées par le constructeur d’un test. Laquelle est la plus importante ? Comment en réduire l’impact ?

A

La plus importante est le risque de répondre au
hasard (guessing). S’il s’agit d’une question « vrai-faux », le sujet a une chance sur deux de répondre correctement de cette manière. S’il s’agit d’une réponse à choix
multiples, la probabilité variera suivant le nombre d’alternatives proposées. Pour cette raison, les questions à choix multiples sont souvent préférées aux questions « vrai/faux ». L’impact du hasard est alors réduit.

-Une façon de réduire l’impact du hasard est de
pénaliser les erreurs (correction négative)
-Une autre manière d’éviter le risque de réussite par chance est de recourir à des questions ouvertes à réponse brève

41
Q

Vrai ou faux ? Les sujets ont souvent une meilleure perception de la validité d’une question ouverte que
d’une question fermée, même si les deux évaluent la même capacité.

A

Vrai

42
Q

Vrai ou faux ?
On observe fréquemment que les sujets les plus faibles obtiennent des résultats inférieurs à ceux qu’ils auraient pu obtenir en choisissant leurs réponses au hasard.

A

Vrai, la stratégie du choix aléatoire n’est pas appliquée systématiquement par les sujets faibles. Au contraire, ceux-ci tentent malgré tout de répondre en s’appuyant sur certains indices de surface et tombent ainsi dans les pièges tendus par le constructeur du test

43
Q

Vrai ou faux ?
L’élève dont les connaissances sont en construction est en effet plus susceptible de retenir une réponse fausse qu’un élève dont les connaissances sont déjà bien structurées

A

Vrai, la présentation des réponses risque également de surévaluer certains sujets, particulièrement si les questions portent sur des connaissances. En effet, un sujet dont l’apprentissage est inachevé et encore mal structuré peut être incapable de produire une réponse correcte alors qu’il peut reconnaître celle-ci parmi des leurres. Ce risque de surévaluation peut cependant être réduit en fonction de la qualité des leurres.

44
Q

Quelles sont les 3 composantes d’une question à choix multiples ?

A
  1. Une amorce, qui pose le problème, suivie de
  2. plusieurs alternatives comprenant la solution correcte et des leurres, finalement
  3. les consignes ; celles-ci décrivent la
    tâche demandée, la modalité de réponse et les règles de cotation.
45
Q

La rédaction des questions à choix multiples de bonne qualité est une tâche complexe qui demande une excellente connaissance du domaine visé et des techniques de construction d’items. Pour rédiger une bonne question à choix multiples, quelques règles de base devraient être respectées. Nommez ces règles (3) et expliquez-les.

A
  1. Avoir une conception précise des connaissances et des capacités cognitives qui doivent être évaluées par les questions. De nombreuses questions sont mal rédigées simplement parce que leurs auteurs éprouvent de la difficulté à définir précisément ce qu’ils veulent mesurer. Ils ont alors tendance à rédiger des items demandant un simple rappel de connaissances. Ce sont en effet les questions à choix multiples les plus faciles à construire.
  2. Clarifier au maximum la question en séparant nettement les informations à utiliser (p.ex., un texte documentaire ou les données d’un problème mathématique) et la question posée. Par ailleurs, plutôt que de répéter certaines informations dans les alternatives, il vaut mieux les regrouper dans l’amorce.
  3. Le choix des distracteurs est un problème crucial. Ceux-ci doivent être suffisamment vraisemblables sans quoi les sujets risquent de trouver les réponses correctes par simple élimination des alternatives invraisemblables. Une manière de procéder consiste à repérer les erreurs habituelles des élèves dans le domaine concerné (ou éléments de la même catégorie que la réponse correcte).
46
Q

Vrai ou faux ?
Dans la rédaction des alternatives, il y a lieu d’éviter les termes vagues (p.ex. « parfois », « certain », « un peu », etc.) et les formulations négatives.

A

Vrai, Ils sont une source d’ambiguïté et de complexité sans rapport avec ce qu’il faut mesurer et ils risquent d’affaiblir la validité de la question. Par exemple, d’un individu à l’autre, le terme « parfois » est associé à une fréquence cl’ événements très variable. La réponse choisie peut, par conséquent, différer en fonction de l’ interprétation donnée à ce terme.

47
Q

Vrai ou faux ?
Quelques alternatives non classiques sont parfois utilisées dans les questions à choix multiples : « aucune des propositions », « toutes les propositions », « les
propositions A et C » et ainsi de suite. Elles doivent être employées avec précaution.

A

Vrai, certains praticiens (Sylvie Callile) les utilisent à mauvais escient lorsqu’ils ne trouvent pas d’autres alternatives. Les sujets repèrent vite un tel procédé et tendent à éliminer d’office cette alternative. Toutefois, bien utilisées, elles permettent de recueillir des informations intéressantes sur la qualité des apprentissages

48
Q

Lors de la rédaction d’une question à choix multiples, certaines erreurs de construction peuvent être présentes. Lesquelles (3) sont les plus fréquentes ?

A
  1. L’indication de la réponse correcte par une caractéristique grammaticale. Le pluriel et le genre des articles sont des indices fréquents.
  2. La différence de longueur et de complexité des alternatives constitue un indice facile à repérer par les sujets clairvoyants. La solution est de construire des
    distracteurs dont la forme est plus proche de la réponse correcte.
  3. La répétition d’un même terme (ou partie de celui-ci) dans l’amorce et la réponse correcte est également un indice. Certains sujets répondent alors sur base des seules associations verbales. Une solution à ce problème est parfois difficile à trouver avec un format fermé. Par contre, une réponse ouverte brève permet aisément d’éliminer l’indice verbal.
49
Q

Vrai ou faux ?

Avec des questions « vrai-faux », il est plus difficile d’évaluer des capacités cognitives de haut niveau.

A

Vrai. Trop de praticiens se contentent de créer des questions qui ne demandent que le rappel de connaissances stéréotypées. Dans les pires cas, ces connaissances ne concernent que des détails triviaux.
De telles questions offrent une image morcelée et anecdotique du savoir. Pourtant, bien construites, ces questions permettent d’apprécier si un élève a réellement compris les connaissances essentielles qui lui ont été enseignées

50
Q

Vrai ou faux ?

Une des difficultés de la construction de questions « vrai-faux » est que le jugement les concernant doit être tranché.

A

Vrai, la proposition est soit vraie, soit fausse. Sa
véracité ne peut être l’objet de variation ou de discussion. Ce problème est important car il sous-tend l’équité et la légitimité de la mesure qui sera faite à l’aide de ces questions. Il est en effet inacceptable de mesurer un degré de compétence à partir de jugements qui ne sont en réalité que des opinions. De même, il est fondé de contester les résultats d’un test composé de questions dont les réponses correctes ne sont pas défendables

51
Q

Pourquoi, dans la formulation des questions « vrai-faux », il faut généralement éviter des déterminants comme « tous », « toujours », « aucun » ou « jamais » ?

A

Car lorsque ces déterminants sont utilisés, la réponse correcte à la question est habituellement « faux ». En effet, il est rare qu’une affirmation ne souffre aucune exception. Il est vraisemblable que, dans un cas au moins, l’affirmation soit fausse

52
Q

Pourquoi, est-il préférable de toujours formuler les questions de manière affirmative.

A

Les négations sont souvent une source de confusion dans les questions « vrai/faux », surtout lorsque le choix est entre « oui » et « non ». Si, par exemple, la proposition est « il ne faut pas dépasser la vitesse de 60 km/heure en ville », le sujet peut entourer la réponse « non » parce qu’il pense que « non, il ne faut effectivement pas dépasser la vitesse de 60 km/heure en ville ». L’alternative « vrai-faux » réduit un tel risque de confusion, sans pour autant Je faire disparaître.

53
Q

Pourquoi, dans l’ensemble d’un test, est-il préférable d’avoir un peu plus de propositions fausses que de propositions vraies ? Par le fait même, expliquez le concept de la tendance à l’acquiescement.

A

Car les propositions fausses permettent de mieux discriminer les sujets faibles des sujets forts que les propositions vraies. En effet, en cas de doute, les sujets sont plus enclins à accepter les propositions présentées qu’à les refuser. Cette inclination est appelée la tendance à l’acquiescement. Par conséquent, au lieu d’inclure dans le test un même nombre de propositions vraies et fausses, comme le recommandent certains auteurs, il vaut
mieux respecter un rapport de deux propositions fausses pour une proposition vraie afin d’obtenir un score total au test qui soit plus discriminatif

54
Q

Quel est l’avantage des questions d’appariement ? Quel en est le désavantage ?

A

Ce format a l’avantage de permettre l’évaluation de nombreuses connaissances en une seule question. Outre ce caractère économique, les questions d’appariement ont également l’avantage de ne pas nécessiter la création de distracteurs. Par contre, la cotation est un peu plus complexe. En effet, elle ne se fait pas au niveau de l’ensemble de la question, mais pour chaque appariement. Par conséquent, si une question demande de réaliser quatre appariements, il faudra attribuer quatre scores
aux réponses à cette question.

55
Q

Une bonne question d’appariement doit être homogène (se référant à un seul concept ou à une seule classe.) Expliquez pourquoi.

A

Si le contenu est trop hétérogène, les sujets risquent de trouver des indices leur permettant de répondre correctement tout en ayant très peu de connaissance du domaine évalué.

56
Q

Quel est le problème avec une question qui propose autant de réponses qu’il y a de prémisses ?

A

Une telle correspondance est déconseillée. En effet, il suffit que le sujet connaisse trois réponses correctes pour trouver automatiquement la quatrième. Pour éviter ce problème, il est recommandé de construire des questions asymétriques : soit par excès de prémisses, soit par excès de réponses. Il est également possible d’utiliser une même réponse pour plusieurs prémisses.

57
Q

Vrai ou faux ?

Les réponses ouvertes sont souvent choisies pour des raisons de validité

A

Vrai

58
Q

Les questions à réponse brève sont assez proches des questions fermées. Expliquez pourquoi

A

Elles ne sont dites ouvertes que parce que la réponse n’est pas donnée et que le répondant doit donc la produire. Mais leur cotation peut être aussi objective que celle des questions fermées lorsqu’une seule réponse correcte est possible, comme c’est le cas des questions à réponse courte (subjectivité du correcteur = nulle)

59
Q

Pour construire une question ouverte, il n’est pas
toujours simple de créer des questions dont la réponse est unique et tient en un seul mot ou en un seul nombre. Pour ce faire, quelle stratégie peut-être utilisée ?

A

Pour parvenir à un tel résultat, il est préférable de commencer par penser à la réponse puis d’élaborer une question qui doit déboucher sur cette réponse. Pour éviter toute variabilité au moment de la correction, il est également important de préciser dans la question certaines caractéristiques qui doivent être présentes dans la réponse. Ainsi, lorsque la réponse attendue est numérique, il faudra annoncer dans la question la précision du résultat attendu (nombre de décimales de
précision) et l’éventuelle unité de mesure (centimètre, litre … ) à mentionner dans la réponse.

60
Q

Plusieurs erreurs de construction, dans la rédaction des questions ouvertes, doivent également être évitées. Lesquelles ?

A

Il ne faut pas donner des indices à propos de la réponse correcte dans la formulation de la question. En particulier, les espaces prévus pour noter les réponses doivent être de même longueur pour toutes les questions d’un même test. Il est fréquent que les sujets infèrent la réponse exacte en se basant sur l’espace laissé pour répondre.

61
Q

Vrai ou faux ?
Les questions à réponse narrative apparaissent, quant à elles, comme les prototypes des réponses ouvertes. Elles sont bien adaptées pour évaluer des compétences de haut niveau comme la résolution de problèmes complexes, l’intégration des connaissances, l’esprit critique et la créativité.

A

Vrai

62
Q

Quelques règles devraient être respectées pour la création de questions à réponse narrative si l’on veut éviter certains déboires au moment de la cotation. Lesquelles ?

A
  1. En particulier, il est nécessaire de donner aux
    répondants des informations précises et complètes à propos de ce qui est attendu d’eux. De nombreux problèmes surgissent au moment de la correction de réponses narratives simplement parce que les sujets ont interprété différemment la question posée. C’est pourquoi, lorsque les conditions le permettent, il est préférable de transmettre au candidat à l’avance les critères de correction et la grille d’évaluation descriptive qui servira à le noter.
  2. Les termes utilisés dans la rédaction des questions devraient toujours faire référence aux capacités cognitives que l’on souhaite évaluer : « expliquer … », « comparer . . . », « interpréter . . . », « critiquer . . . », « évaluer . .. ». Si l’on désire limiter les réponses à une certaine longueur ou obliger les sujets à respecter une certaine structure, il est possible de proposer des questions à réponse contrainte. Dans ce cas, la question contient un certain nombre de directives concernant la forme de la question. Par contre, les questions à réponse développée laissent toute liberté aux répondants quant à la longueur et à la structuration de leur réponse. Une telle latitude permet plus de créativité et une approche plus large du problème posé, mais elle est source de complexité au moment de la correction surtout si le constructeur de tests n’a fait aucun effort de transparence au niveau des critères d’évaluation.
63
Q

Quels types d’items/de techniques est-il préférable pour évaluer des traits de personnalité ? Donnez un exemple

A

Dans le cas de la personnalité, des questions
ouvertes demandant une performance sont souvent utilisées. Les techniques projectives en sont l’illustration la plus connue. Ces techniques consistent en un ou plusieurs stimuli (images, figurines, propositions … ) à partir desquels le participant est invité à produire des associations verbales, un récit, un dessin ou une construction. Ces productions sont considérées comme des manifestations de la structure profonde de la personnalité d’un individu. L’information recueillie de la sorte est souvent riche, mais difficile à coter.

Ex : Rorschach. Ces systèmes demandent une bonne formation des correcteurs et leur application rigoureuse prend beaucoup de temps. Ils garantissent toutefois une fidélité et une validité satisfaisantes des résultats, pour autant que les praticiens les respectent, ce qui n’est pas toujours le cas

64
Q

Vrai ou faux ?
Les questionnaires en auto-passation et les échelles de cotation (questionnaires remplis par un observateur et non par le sujet lui-même) sont nettement plus standardisés que les tests demandant une performance.

A

Vrai, la validité et la fidélité de leurs résultats sont, par conséquent, mieux assurées.

65
Q

Trois formats d’items sont habituellement utilisés dans les questionnaires. Lesquels ? Expliquez-les.

A
  • les items dichotomiques
  • les items catégoriels bipolaires
  • les items à choix forcé
66
Q

Expliquez en quoi consiste un item dichotomique.

A

Un item dichotomique est constitué d’une proposition par rapport à laquelle le sujet doit exprimer son accord ou son désaccord. Le choix peut être entre « d’accord-pas
d’accord », « oui-non », « vrai-faux » ou toutes autres paires de catégories opposées.

67
Q

La construction d’items dichotomiques est, en apparence, assez simple. Ce format soulève pourtant plusieurs problèmes dont certains sont difficiles à résoudre. Lesquels (4)? Expliquez-les.

A
  1. La formulation des propositions. Par exemple, si une des propositions est formulée de manière négative ( « je n ‘ai aucun projet » ), cette formulation complexifie la tâche du répondant. Doit-il répondre « NON, je n ‘ai aucun projet » ou « OUI, je n ‘ai aucun projet » ? . L’utilisation des modalités de réponse « vrai-faux » ou « d’accord-pas d’accord » peut réduire ce problème.
  2. Caractère tranché du choix demandé au sujet. Si
    la formulation de l’item est trop vague, il peut hésiter à choisir une des alternatives. Par exemple, si la proposition est « je suis une personne relativement inquiète », l’interprétation du terme « relativement » peut varier et entraîner un choix qui dépende de cette interprétation. Par conséquent, de tels termes doivent être évités afin que les choix proposés soient identifiés de manière claire et identique par tous les sujets.
  3. La désirabilité sociale. De nombreux sujets ont en effet tendance à masquer leur véritable choix et à sélectionner, au contraire, le choix opposé par ce que ce dernier est plus valorisé socialement. Cette tendance peut découler d’un refus des sujets de se voir tels qu’ils sont et/ou d’une crainte du regard que le psychologue peut porter sur eux.
  4. le calcul du score global. Généralement, les réponses aux items sont cotées 1 ou O. La valeur 1 indique la présence de la caractéristique mesurée et la valeur 0 son absence. Le plus souvent, le résultat total est calculé en additionnant les scores aux différents items. Par conséquent, chaque item a un poids identique dans le
    score total. Cette façon de faire a l’avantage de la simplicité. Sa pertinence est toutefois discutable. Tous les items n’indiquent pas un même degré du trait mesuré. Une solution à ce problème consiste à pondérer les résultats des items et d’accorder ainsi un poids plus grand aux items en fonction de l’ intensité du trait qu’ils permettent de révéler.
68
Q

Expliquez ce qu’est une échelle de Likert (les items catégoriels bipolaires).

A

Face à certaines propositions, il est possible de donner des réponses plus nuancées que « d’accord » ou « pas d’accord ». Des catégories intermédiaires peuvent être définies entre ces deux pôles. L’ensemble des choix constitue des catégories ordonnées. Celles-ci forment ce que l’on appelle une échelle de Likert. Le nombre de catégories peut varier mais se limite généralement à cinq, comme l’a d’ailleurs suggéré Likert (1932). Ces catégories sont : « en total désaccord », « pas d’accord », « neutre »,
« d’accord », « en total accord ». D’autres termes équivalents peuvent être utilisés. Chaque catégorie se voit attribuer respectivement le score 0, 1, 2, 3 et 4.

69
Q

Les items catégories bipolaires sont sensibles à l’influence du phénomène de la désirabilité sociale, tout comme les items dichotomiques. Cependant, un problème est spécifique aux items bipolaire. Lequel ? Quelle stratégie peut-on mettre en place afin de remédier à ce problème ?

A

Mais ils soulèvent aussi des problèmes spécifiques comme la tendance à donner une réponse centrale. Pour contrecarrer cette tendance, on peut choisir de limiter le nombre de catégories à quatre. Par ailleurs, les
items catégoriels bipolaires sont plus complexes à construire que les items dichotomiques.

70
Q

Le format des items à choix forcé a été créé pour tenter de résoudre un des problèmes posés par les autres formats de réponse. Quel est-il ?

A

L’influence de la désirabilité sociale sur le choix de la réponse. Le principe du choix forcé consiste à présenter simultanément au sujet plusieurs items (des phrases,
des qualificatifs … ) et à lui demander de choisir parmi ceux-ci celui qui lui correspond le mieux et/ou celui qui lui correspond le moins. Les items entre lesquels le sujet doit
choisir possèdent un même degré de désirabilité sociale. On postule que si le sujet doit choisir l’item qui lui correspond le moins entre deux items peu désirables socialement, son choix sera généralement sincère. On formule le même postulat lorsque le sujet doit choisir l’ item qui lui correspond le mieux entre deux items également désirables socialement. La technique du choix forcé permet un rééquilibrage des scores car elle
oblige le sujet à faire des choix qu’il aurait esquivés si les items avaient été présentés dans un format classique. On évite ainsi une dépression des scores liés aux items peu
désirables socialement et une inflation des scores liés aux items désirables socialement.

71
Q

Il existe plusieurs variantes dans la présentation des items à choix forcé. La présentation la plus simple consiste à proposer des paires d’ items qui chacun mesure
un des pôles d’une échelle bipolaire et à demander au sujet de choisir l’item qui lui correspond le mieux (ou le moins). Mais cette façon de faire n’est pas la présentation la plus courante des items à choix forcé. Dîtes laquelle et expliquez.

A

La plus courante est sous la forme d’ensembles de quatre items appelés des tétrades. (différentes façons :)
1. Une première technique consiste à réunir dans une même tétrade deux indicateurs valides d’un trait et deux indicateurs non valides de ce même trait. Un des deux indicateurs valides est désirable socialement alors que l’autre ne l’est pas. Il en va de même pour les deux indicateurs non valides. Les sujets sont invités à choisir dans la tétrade la caractéristique qui leur correspond le mieux et celle qui leur correspond le moins. Pour chaque tétrade, les sujets doivent donc donner deux réponses.

72
Q

La création de tétrades (items à choix forcé) se fait en plusieurs étapes. Dîtes lesquels et expliquez

A
  1. La première étape consiste à observer ou à interviewer des personnes qui possèdent le trait à mesurer à un degré très élevé ou très faible pour produire des indicateurs (qualificatifs, de substantifs ou de courtes phrases qui sont associés à l’absence ou à la présence du trait)
  2. La validité de ces termes est ensuite évaluée par des experts et par Je calcul d’un index de validité. Sur la base de ces évaluations, des paires d’indicateurs sont constituées. Toutes comprennent un indicateur valide et un indicateur non valide de même niveau de désirabilité.
  3. Une fois ces paires réalisées, on peut alors construire des tétrades en groupant chaque fois une paire d’éléments désirables et une paire d’éléments non
    désirables
73
Q

Expliquez la technique de construction des tétrades de Gordon 1951

A

Elle consiste à grouper dans une même tétrade des items mesurant quatre variables différentes. Deux de ces items sont désirables socialement et les deux autres sont peu désirables socialement. Le sujet est invité à choisir l’ item qui lui ressemble le plus et celui qui lui ressemble le moins. La cotation des réponses est pondérée. On attribue deux points à l’ item qui correspond le plus au sujet, zéro point à l’item qui lui correspond le moins
et un point à chacun des deux items qui n’ont pas été choisis. Cette pondération s’explique par le fait que le sujet a implicitement ordonné tous les items. Les items choisis occupent les positions extrêmes alors que ceux qui n’ont pas été choisis occupent une position intermédiaire.

74
Q

Bien qu’assez attractifs en apparence, les items à choix forcé peuvent soulever de sérieux problèmes d’interprétation des scores. C’est particulièrement
le cas lorsque le test est ipsatif. Expliquez.

A

Le terme ipsatif a été proposé par Cattell (1944) pour
désigner les tests dans lesquels la valeur du score à une variable dépend de la valeur des scores aux autres variables. Dans ce cas, la comparaison des scores est purement intra-individuelle. Aucune comparaison interindividuelle n’est possible. Cette situation peut se présenter avec les items à choix forcé lorsque l’on attribue un point à l’item choisi et zéro point aux autres. Dans ce cas, l’élévation du score à une échelle va de pair avec une diminution des scores aux autres échelles. La somme des scores aux différentes échelles reste, par conséquent, toujours constante.

75
Q

Vrai ou faux ?

Tous les items à choix forcé produisent nécessairement des mesures ipsatives.

A

Tous les items à choix forcé ne produisent pas nécessairement des mesures ipsatives. Si, par exemple, les items d’une paire représentent les deux pôles d’une
même variable, le choix du sujet n’influencera le score que de cette seule variable.

Enfin, les items à choix forcés peuvent produire des mesures partiellement ipsatives. C’est le cas de !’Inventaire de Personnalité de Gordon dont un exemple
de tétrade a été donné plus haut. En pondérant les choix comme le propose Gordon, on évite que la somme des scores aux différentes variables soit une constante. On
introduit ainsi une certaine variabilité interindividuelle des scores.

76
Q

Expliquez la citation suivante de Georges Gallup, fondateur du célèbre institut de sondage (1947): Trop d’attention a été accordée à la constitution des échantillons et trop peu à la création des questions

A

Des différences dans la construction des questions conduisent souvent à des résultats qui présentent
de plus grandes variations que celles habituellement observées en fonction des différentes techniques d’échantillonnage ». Cette constatation garde toute son actualité et peut être généralisée aux questions construites pour les tests psychologiques et les tests d’acquis scolaires. Souvent, les praticiens ne suivent aucune méthodologie pour construire les items. Ayant en tête ce qu’ils souhaitent mesurer, ils se fient à leur
intuition pour produire les questions.

77
Q

Vrai ou faux ?

Un test long sera généralement plus fidèle qu’un test court

A

Vrai