Lecture-Chap 1 Flashcards
La construction d’un test en psychologie ou en éducation est un processus de longue haleine. Cinq étapes principales peuvent être distinguées dans ce processus. Quelles sont ces 5 étapes ?
- LA DÉTERMINATION DES UTILISATIONS PRÉVUES DU TEST
- LA DÉFINITION DE CE QUE L’ON SOUHAITE MESURER
- LA CRÉATION DES ITEMS
- L’ÉVALUATION DES ITEMS
- LA DÉTERMINATION DES PROPRIÉTÉS MÉTRIQUES DU TEST DÉFINITIF
Expliquez en quoi consiste la 1ère étape de la construction d’un test en psychologie (1. LA DÉTERMINATION DES UTILISATIONS PRÉVUES DU TEST)
- fonctions que le test devra remplir, à quoi va-t-il servir ?
- les usages prévisibles d’un test déterminent profondément ses caractéristiques (fonctions déterminent la nature du test à construire et, par conséquent, la méthodologie à utiliser pour élaborer un tel outil)
*Il est illusoire de vouloir créer un test « généraliste »
qui ambitionne de répondre à tous les besoins des praticiens.
Quelle est la différence entre un test normatif et un test critérié ? Une distinction essentielle à la construction d’un test psychologique (étape 1)
En particulier, une distinction nette doit être tracée entre les tests normés et les tests critériés. Les tests normés visent à discriminer les sujets appartenant à la population pour laquelle est construit le test. Ces tests peuvent, par exemple, nous procurer des informations sur le degré d’anxiété d’un sujet par rapport au niveau de l’anxiété dans l’ensemble de la population. Il en va de même pour le niveau de compétence en mathématique ou pour tout autre caractéristique que l’on souhaite mesurer. Par contre, les tests critériés ont pour fonction d’évaluer si un
sujet possède ou non certaines caractéristiques prises comme référence. Le choix de construire un test normé ou un test critérié conditionne la méthodologie utilisée.
Quelle est la différence entre un test certificatif et un test diagnostique? Une distinction essentielle à la construction d’un test psychologique (étape 1)
Un test certificatif doit couvrir l’ensemble d’un programme
scolaire. Un tel test est habituellement centré sur les performances. Il doit en effet permettre de vérifier si l’élève est capable de réaliser les tâches que l’on attend de lui en fin d’apprentissage. Par contre, un test diagnostique est généralement beaucoup plus
ciblé. Son but est de comprendre le sens d’une performance. Par exemple, il ne s’agit plus, comme avec un test certificatif, de simplement vérifier si un élève peut additionner correctement deux nombres décimaux, mais de comprendre pourquoi certains élèves présentent des difficultés pour réaliser de telles additions. L’information que l’on désire recueillir ne se limite plus à la performance, mais concerne les capacités cognitives sous-jacentes à ces performances.
Ainsi, les propriétés d’un test diagnostique sont nécessairement très différentes de celles d’un test certificatif. Ces deux types d’outils doivent, par conséquent, être conçus de manière spécifique en s’appuyant sur une méthodologie adaptée.
Expliquez en quoi consiste la 2ème étape de la construction d’un test en psychologie (LA DÉFINITION DE CE QUE L’ON SOUHAITE MESURER)
-définir avec précision les caractéristiques psychologiques ou éducatives que le test devra mesurer. Sur base de cette définition, des items pourront alors être construit
Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).
DOP
La définition des objectifs pédagogiques et la construction d’un tableau de spécifications : préciser les performances que les élèves devront démontrer à un moment donné de leur apprentissage . Le tableau de spécifications est un de ces outils permettant de déterminer les divers types de comportements attendus relativement à un contenu disciplinaire.
Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).
ACE
L’analyse de contenu d ‘entretiens : Lorsque le praticien n’a pas d’ idées précises à propos des caractéristiques permettant de discriminer les individus qui seront évalués par le test, il est intéressant de commencer par interroger des personnes appartenant à la population visée par ce test. L’interview, libre ou semi-structurée, permet de recueillir un grand nombre d’informations qui seront sélectionnées et classées au moyen d’une analyse de contenu (ex : propositions qui servent à construire un questionnaire par la suite)
Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).
ODC
L’observation directe des comportements : Dans certains cas, plutôt que d’interroger les personnes, il est préférable de les observer dans leur milieu de vie ou de travail. Cette méthode a été utilisée par Binet pour construire le tout
premier test d’intelligence de l’histoire.
Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).
MIC
La méthode des incidents critiques : L’origine de cette méthode est attribuée à Flanagan ( 1954). Elle est particulièrement utile pour construire des outils d’évaluation des performances professionnelles. Elle consiste à demander à des responsables de décrire des situations de travail où les employés sous leurs ordres ont agi de manière particulièrement efficace ou, au contraire, inefficace. Partant de cette description, certains comportements « critiques » peuvent être mis en évidence et servir à construire des échelles d’évaluation
Afin de définir ce que l’on veut mesurer et passer d’une intention vague à la définition opérationnelle d’un
concept plusieurs méthodes peuvent être utilisées. Nommes une de ces 5 méthodes et expliquez la (font parties de la 2ème étape de construction d’un test).
RMT
La référence à un modèle théorique : À la différence des autres méthodes, celle-ci ne part pas de l’expérience, mais d’un modèle de la réalité construit au cours de recherches antérieures. Depuis le début des années 1980, les développements de la psychologie cognitive ont conduit à la création de nombreux modèles théoriques utilisables par les constructeurs de tests. Des tests destinés au diagnostic des troubles de la lecture ont, par exemple, été créés sur base de modèles décrivant les processus impliqués dans l’activité de lecture (p.ex. de
Partz, 1994 ; Mousty & al., 1 994). D’autres outils ont également été construits en référence à des modèles théoriques pour évaluer des caracté1istiques aussi
diverses que le calcul, la motivation, la mémoire
Souvent, les praticiens ne suivent aucune méthodologie pour construire les items. Ayant en tête ce qu’ils souhaitent mesurer, ils se fient à leur intuition pour produire les questions. Pourtant, il est indispensable d’avoir un projet et un plan précis avant de se lancer dans la production d’items. Quelles sont les 3 questions qu’il est essentiel de se poser ? En quoi aideront aideront-ils à la 3ème étape de la construction d’un test psychologique (LA CRÉATION DES ITEMS)
- Quel format d’items choisir ? Pourquoi ? Le choix d’un format ne doit pas être arbitraire. Il découle d’un ensemble de contraintes concernant les objectifs du test et les conditions matérielles de création, de passation et de cotation de celui-ci. En conséquence, il n’y a pas de bon format d’item dans l’absolu. Un format est bon s’il est adéquat au but et à la situation d’évaluation.
- Quel doit être le niveau de difficulté des items ? Le choix du niveau de difficulté des items dépend de l’objectif du test. Ce niveau variera selon que le
test est normé ou critérié, certificatif ou formatif. En d’autres termes, c’est la nature des informations que l’on désire recueillir qui doit déterminer le niveau de difficulté des items à produire. - Combien faut-il créer d’items ? (Dépend de 3 facteurs : durée, niveau fidélité, élimination d’items)
Souvent, les praticiens ne suivent aucune méthodologie pour construire les items. Ayant en tête ce qu’ils souhaitent mesurer, ils se fient à leur intuition pour produire les questions. Pourtant, il est indispensable d’avoir un projet et un plan précis avant de se lancer dans la production d’items. 3 questions sont essentielles à se poser. La 3ème étant : combien d’items faut-il créer, dépend elle-même de 3 facteurs, lesquels ?
Le nombre d’items à créer dépend de plusieurs facteurs :
3. 1 Durée du test. Selon que l’on souhaite un test
court, pouvant être passé en 10 minutes, ou un test diagnostique se déroulant sur plusieurs séances d’examen, le nombre d’items à créer variera considérablement.
3.2 Niveau désiré de fidélité du test.
Un test long sera généralement plus fidèle qu’un test court Par ailleurs, si le test comporte plusieurs sous-scores, il sera nécessaire d’assurer la fidélité de ceux-ci en prévoyant suffisamment d’items dans chacune des sous-échelles du test.
3.3 Élimination de certains items après leur évaluation par des experts et leur mise à l’essai. Si l’on veut que la version finale du test contienne assez d’items, il faudra donc en créer plus que le strict nécessaire. Si, par exemple, le test final doit contenir 20 items, on en créera 30 et l’on retiendra les 20 meilleurs de ceux-ci. Habituellement, un surplus de 30 à 50 % d’items est nécessaire pour éviter de ne pas avoir un nombre suffisant d’items après la mise à l’essai.
Expliquez en quoi consiste la 4ème étape de la construction d’un test en psychologie (L’ÉVALUATION DES ITEMS). Quelles sont les démarches complémentaires pour réaliser cette tâche ?
Pour garantir les propriétés métriques des items,
une évaluation minutieuse de ceux-ci doit également être réalisée. Deux démarches complémentaires sont habituellement suivies pour réaliser celte tâche.
1. Une évaluation. des items par des juges. Ceux-ci sont chargés d’apprécier la conformité des items aux exigences définies lors de la seconde étape du processus de construction du test.
2. La réalisation d’une mise à l’essai des items suivie d’une analyse qualitative et quantitative des résultats. La mise à l’essai complète l’appréciation des items par des juges. Cette dernière évaluation reste en effet subjective malgré la rigueur méthodologique avec laquelle elle peut être réalisée. La mise à l’essai permet de recueillir des données empiriques, directement de la population
à laquelle est destiné le test
Vrai ou faux ?
La mise à l’essai, dans la 4ème étape de construction d’un test psychologique (évaluation des items) consiste à faire passer tous les items à un échantillon de la population.
Vrai. Cet échantillon ne doit pas nécessairement être représentatif ni de très grande taille. Sa taille dépend en
fait de l’hétérogénéité de la population visée par le test et de la grandeur de la population de référence. Par exemple, si un questionnaire de stress est destiné à évaluer uniquement des pilotes d’avion, une ntise à l’essai sur un échantillon de 50 pilotes permettra généralement une évaluation satisfaisante des items, car la population des pilotes d’avion est plus homogène et de plus petite taille que la population en général.
Un échantillon trop homogène risque en effet de
masquer certains items problématiques.
Les résultats d’une mise à l’essai sont analysés d’un point de vue tant qualitatif que quantitatif. En particulier, les commentaires des sujets à propos des items peuvent se révéler précieux pour comprendre des résultats aberrants et pour remédier à certains problèmes de formulation des questions. De même, les problèmes de manipulation du matériel, d’enregistrement des réponses, de temps de passation, de cotation des réponses peuvent être repérés à cette occasion. Ces problèmes, en apparence
mineurs, doivent retenir toute l’attention du constructeur car ils peuvent diminuer considérablement la validité des résultats d’un test.
En plus de ces vérifications qualitatives, la mise à l’essai permet de réaliser différentes analyses statistiques des résultats. Ces analyses portent, entre autres, sur la difficulté des items, leur discrimination, leur fonctionnement différentiel. Sur base de ces analyses et des observations qualitatives, les meilleurs items seront finalement sélectionnés et serviront à construire la version définitive du test.
Expliquez en quoi consiste la 5ème étape de la construction d’un test en psychologie (détermination des propriétés métriques du test définitif). Quelles sont les informations essentielles à préciser/divulguer à cette étape ?
- Les propriétés qui doivent retenir l’attention du constructeur varient en fonction de la nature du test. S’il s’agit d’un test normé, il sera nécessaire d’établir des normes et de présenter celles-ci selon une échelle aisément compréhensible par les praticiens. S’il s’agit d’un test critérié, il faudra préciser des scores de référence utiles. Par ailleurs, si les résultats du test doivent
être mis en relation avec ceux d’autres tests, il y aura lieu de mettre en équivalence les échelles de mesure concernées. - Une investigation approfondie de la validité et de la fidélité des résultats de la version finale du test devra toujours être réalisée. Il faut souligner que l’évaluation de la validité des résultats à un test n’est pas du seul ressort du constructeur. Elle est partagée par l’utilisateur du test. En fait, la validité n’est jamais une qualité acquise une fois pour toutes.
- Le constructeur devra également apporter des informations à propos de la fidélité des résultats. Il peut choisir parmi une variété d’indicateurs tels que le coefficient de fidélité et les autres mesures liées à celui-ci et nécessaires aux praticiens, telles que l’erreur de mesure de scores, les intervalles de confiance, l’erreur de mesure des différences entre scores, etc.
- La rédaction d’une documentation destinée aux utilisateurs est nécessaire. Cette documentation doit présenter les données métriques citées ci-dessus (normes, coefficient de fidélité … ) ainsi que les bases théoriques du test, les fonctions pour lesquelles
il a été créé et les qualifications requises pour pouvoir l’utiliser et en interpréter correctement les résultats (responsabilité éthique)
Dans l’enseignement, les tests sont appelés à jouer plusieurs rôles. L’instrument de mesure sera construit différemment selon la fonction à laquelle on le destine. Nommez les deux grands ensembles de situations où les tests jouent un rôle important en situation scolaire. Donnez des exemples.
- L’évaluation sommative : on cherche à construire un instrument de mesure qui permette d’évaluer un échantillon de toute la matière enseignée. Un bon bilan nécessite un échantillonnage du contenu qui soit exhaustif et représentatif. Pour ce faire, une
mesure fondée sur les objectifs d’apprentissage est nécessaire. Ex :
- dresser un bilan des acquis de l’élève ;
- prendre une décision sur la promotion de l’élève;
-sélectionner les élèves selon certaines caractéristiques particulières afin de former des groupes ; - l’évaluation formative: on cherche à construire un outil qui permette une prise d’information focalisée et compréhensive. En fait, l’intérêt n’est pas de couvrir toute
la matière, mais un aspect bien particulier de celle-ci. Alors que plusieurs objectifs peuvent être couverts dans un bilan, l’évaluation formative peut ne porter que sur un
seul objectif. L’évaluation formative a pour fonction de fournir à l’enseignant et à l’élève une information pertinente sur le déroulement des apprentissages (mesure critériée)
-identifier les aspects de la résolution d’un problème source de difficultés ;
-préparer une révision de la matière à partir des points pour lesquels certains élèves éprouvent des difficultés ;
-faire prendre conscience aux élèves de certains points majeurs de la matière.
Dans l’évaluation sommative, lors de la rédaction d’un objectif, les deux caractéristiques essentielles sont :
- un verbe d’action et un seul ; doit décrire un comportement observable directement ou indirectement
- un contenu (complément d’objet) et un seul.
Dans l’évaluation sommative, lors de la rédaction d’un objectif, on lui ajoutera généralement les composantes (3) suivantes pour accroître sa spécificité :
- le contexte dans lequel sera réalisée la performance attendue ; conditions et ce qui sera à sa disposition
- le critère d’acceptation de la performance ; niveau de qualité de la performance attendue
- le seuil d’acceptation de la performance ; critère quantitatif pour considérer l’objectif comme atteint (habituellement entre 80 et 100 %)
Vrai ou faux ?
On ne s’attend pas à retrouver ces caractéristiques accessoires parmi les objectifs généraux.
Vrai, par contre, elles sont essentielles à des objectifs dits spécifiques. Ex : À l’aide d’un atlas, trouver la longitude et
la latitude exacte des capitales des pays d’Europe,
avec une précision de plus ou moins un degré,
neuf fois sur 10.
Les composantes accessoires des objectifs sont parfois précisées dans les programmes d’études en fonction des niveaux d’enseignement
En quoi consiste le modèle de Deno et Jenkins ? Quels en sont ces 4 niveaux ?
Deno et Jenkins (1969) ont élaboré un modèle qui tient compte de la spécificité nécessaire des objectifs à différents niveaux d’intervention. Il s’agit d’un modèle hiérarchique où chaque niveau supérieur contient les objectifs des niveaux inférieurs.
A. Objectifs globaux
B. Objectifs généraux
C. Objectifs spécifiques
D. Tâche
Expliquez les 4 niveaux du modèle de Deno et Jenkins (spécificité des objectifs selon le niveau d’intervention).
Le niveau A est celui des objectifs globaux. Il sert à préciser les choix politiques, institutionnels, les grandes lignes du projet éducatif et de la mission de l’enseignement.
Le niveau B cherche à préciser les objectifs globaux en situant le degré d’approfondissement des capacités (au niveau cognitif) ou le degré d’intériorisation (au niveau affectif) des attentes de l’objectif : c’est le niveau des objectifs généraux
Au niveau C, les intentions se précisent à un point tel qu’on peut y indiquer les conditions précises d’évaluation : catégorie de comportements attendus, contenus précis, conditions de réalisation de la performance et conditions d’acceptation de la performance. C’est le niveau des
objectifs dits spécifiques.
Au niveau D, on retrouve les tâches d ‘examen de même
que les situations entraînant l’observation de performances complexes. C’est le niveau le plus spécifique des quatre niveaux du modèle. Ce n’est pas à proprement parler un objectif (mais la tâche est la meilleure manière de connaître comment se traduisent les objectifs pédagogiques dans les faits).
C’est au niveau B du modèle de Deno et Jenkins qu’interviennent les taxonomies d’objectifs généraux. On
distingue trois grandes catégories taxonomiques :
l. objectifs cognitifs : rôles
- au niveau des programmes d’études ;
- au niveau de l’évaluation des apprentissages
2. objectifs affectifs
3. objectifs psychomoteurs
Lorsque l’on souhaite préciser l’enchaînement de plusieurs objectifs dans un programme d’études, on peut distinguer les objectifs terminaux des objectifs intermédiaires. Expliquez-les.
L’objectif terminal décrit la finalité ultime d’un apprentissage, son point d’arrivée. L’objectif intermédiaire énumère les étapes nécessaires qui doivent jalonner le cheminement de l’élève du point de départ au point d’arrivée. Sans la maîtrise de ces jalons, la maîtrise de l’objectif terminal est compromise. Par contre, lorsque
l’objectif terminal est atteint, on peut conclure que les objectifs intermédiaires ont été maîtrisés
Vrai ou faux ?
Les objectifs terminaux conviennent particulièrement à l’évaluation sommative.
Qu’en est-il de l’évaluation formative ?
Ils permettent de couvrir une grande variété de contenus.
De plus, il est normal qu’un bilan porte sur les apprentissages complétés plutôt que sur ceux qui sont en
voie de réalisation. Enfin, lorsqu’il s’agit d’établir un bilan, il est généralement trop tard pour se demander à quel moment de l’apprentissage l’étudiant a éprouvé des
difficultés. Par contre, cette dernière information peut être utile dans le cas d’une évaluation formative ou encore de ce qu’il est convenu d’appeler une évaluation « microsommative »
Le bilan, qu’il corresponde à une exigence administrative ou pas, se doit d’être représentatif. L’échantillonnage est l’un des outils à la disposition de l’enseignant pour
construire son instrument de mesure. L’échantillonnage des questions peut prendre plusieurs formes (4). Lesquelles ?
- Échantillonnage aléatoire simple. Chaque question a une chance égale d’être choisie.
- Échantillonnage stratifié. Le test entier comporte des questions appartenant à un objectif dans une proportion qui correspond à l’importance de cet objectif dans la matière à couvrir.
- Échantillonnage par grappes. L’échantillonnage, dans ce cas, ne se fait pas par question, mais par objectif, car le nombre d’objectifs à couvrir est extrêmement grand.
- Échantillonnage hiérarchique. L’échantillonnage se fait en deux étapes :
(a) d’abord les objectifs et ensuite
(b) les questions à l’ intérieur des objectifs.
Il est important de noter que seules les deux premières techniques d’échantillonnage permettent, avec un nombre suffisamment grand d’items, d’échantillonner toute la matière. Avec les deux derniers types d’échantillonnage, certaines parties de la matière seront nécessairement omises. Cet inconvénient n’est pas majeur lorsqu’il
s’agit d’un examen qui fait suite à une série d’examens partiels. Cette méthode d’échantillonnage est caractéristique des examens de fin d’année. Par contre, les bilans plus fréquents (fin d’étape) ne peuvent omettre complètement un objectif.
Le tableau de spécifications est un moyen utilisé depuis longtemps pour s’assurer que l’échantillonnage des questions d’examen est véritablement représentatif de
la situation qui a prévalu en salle de classe ou encore des exigences décrites clans le programme d’études. Décrivez ce tableau. À quel type d’échantillonnage correspond-t’il ?
Il prend généralement la forme d’un tableau de contingence à double entrée, la première étant constituée du contenu, la seconde du niveau taxonomique (ex: connaissance, compréhension ou format d’items, ex : vrai/faux) des objectifs mesurés. Un grand soin est pris pour que la proportion des items d’examen corresponde étroitement à l’importance relative du contenu et du niveau taxonomique du programme d’études. Le tableau de spécifications correspond à un échantillonnage stratifié.
Comment peut-on définir la mesure critériée ?
La mesure critériée regroupe un ensemble de procédures permettant une prise d’ information détaillée à propos de l’apprentissage d’un sujet. Ces procédures ont en commun de mieux définir et de mieux contrôler les critères quantitatifs et qualitatifs
de la performance, tels que :
• les aspects de la présentation d’une tâche ;
• les conditions de réalisation d’une tâche ;
• les niveaux d’exigence pour la réalisation d’une tâche.
Quelles sont les 3 techniques qui permettent de construire des instruments de mesure critériée ?
- l’objectif enrichi ;
- l’analyse des concepts ;
- la théorie des facettes.
Expliquez l’objectif enrichi, une des 3 techniques qui permettent de construire des instruments de mesure critériée. Popham (J 980) a défini l’objectif enrichi en distinguant trois parties principales. Lesquelles ?
A pour but de pallier les limites de l’objectif spécifique en en fournissant une description enrichie. L’objectif enrichi permet de réduire les possibilités d’interprétation en définissant l’objectif avec plus de rigueur. L’objectif enrichi nous permet donc de nous prononcer avec une plus grande assurance sur le degré de maîtrise et de non-maîtrise d’un objectif (chances de variation d’un échantillon à l’autre = réduites au min)
- l’énoncé de l’objectif ;
- un exemple d’item incluant :
• une directive ;
• un exemple. - un complément d’information sur :
• l’examen (ce que l’élève aura à faire lors du test, la nature du stimulus) ;
• les choix de réponses ;
• les critères de correction.
Expliquez l’analyse des concepts, une des 3 techniques qui permettent de construire des instruments de mesure critériée. Quelles sont ses 4 parties ?
Capable de faire la différence entre les caractéristiques essentielles et les caractéristiques accessoires du concept étudié. L’analyse de concepts contribue à spécifier un domaine d’items servant à tester l’apprentissage de l’élève. (vérifier s’il y a généralisation des apprentissages avec un objectif particulier)
L’analyse des concepts comporte quatre parties :
- la définition des caractéristiques essentielles ;
- la définition des caractéristiques accessoires ;
- une série d’exemples et de contre-exemples tirés de l’enseignement ;
- une série d’exemples et de contre-exemples pour l’évaluation (similaires à ceux de l’enseignement).