Observation et mesure Flashcards
Qu’est-ce qu’un test? A quoi sert-il?
Dispositif d’observation –>mise en évidence des différences entre les individus (recherche ou application).
Passage individuel ou collectif.
Quels sont les différents types de test?
Test d’aptitude : aspects globaux ou analytiques du fonctionnement intellectuel, de son développement et de son efficience, ou tests psychomoteurs - voir si un individu sera apte.
Test de personnalité : objectifs –> conduites observées, manière habituelle de se comporter / projectifs -> le sujet structure un matériel ambigu et projette sa personnalité.
Tests de connaissance, scolaires ou professionnelles
Questionnaire de personnalité, inventaire d’intérêt et de valeur –> description que le sujet fait de lui-même.
Approche nomothétique et idiographique.
Caractérisation des individus sur des dimensions.
Approche nomothétique = normative –> individus comparables.
Approche idiographique (ipsative) –> caractérisation sans référence à d’autres personnes.
L’observation libre
Pas de règles pour l’observateur, les conditions et les indications données au sujet dépendent du contexte. Manière de caractériser la conduite du sujet = décision de l’observateur.
L’observation contrainte
Situation de test. Situation définie, consignes spécifiées. Modification d’un paramètre –> nouveau test.
La standardisation: définition, rôle, exemples
Uniformité de la démarche d’administration et de correction du test.
Permet la comparabilité de sujets et l’accord entre les observateurs (dernier point discuté)
L’épreuve doit répondre à des **règles strictes de passation et de cotation. **
N’entraine pas forcément un comportement stéréotypé de l’observateur (méthodes qui s’adaptent au sujet)
Standardisation à son maximum: QCM // tests informatisés –> conditions de passation identiques, relevé de bonnes réponses.
Qu’est-ce qu’un item?
Partie, question d’un test.
La figure complexe de Rey: définition, fonction, cotation.

1942, par le psychologue suisse André Rey.
Permet d’évaluer les déficits mnésiques de sujets atteints de troubles cérébraux.
Copier la figure en prenant son temps puis la reproduire de mémoire 3 minutes après (crayons de couleur ou stylet) –> permet de dissocier le déficit mnésique de l’insuffisance de l’organisation perceptive.
Deux systèmes de cotation:
- sept manières de réaliser le dessin, du gribouillage à l’élaboré (pas très objectif)
- Figure : 18 parties. 2 point par unité bien placée; 1 point si mal placée –> plus objectif
Qu’est-ce qui détermine le choix des items?
Les objectifs et les conceptions psychologiques (théories), ainsi que les considérations pratiques.
Choix d’un item sans théorie / avec théorie
Sans théorie: contenu des items issu de la psychologie commune.
Avec une théorie: la théorie donne des indications sur la nature des items à retenir.
Ex: tests scolaires en adéquation avec le programme, test d’intro/extraversion, théorie structurale d’Eysenck –> les cinq facettes de l’extraversion.
Quels sont les différents formats d’item?
Production libre de la réponse
Test papier-crayon –> choix multiples (correction du score en estimant les réponses dues au hasard.)
Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests verbaux.
Compréhension de phrases –> un dessin et six phrases: trouver la phrase exacte.
Proverbes –> trouver la phrase qui correspond le mieux au sens du proverbe.
Analogies verbales –> X est à Y ce que Z est à…?
Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests spatiaux
Soustractions géométriques –> trouver ce qui reste du dessin après une soustraction.
Développement -> qu’obtient-on si on déroule le papier?
Briques –> que voit-on si on est derrière ce tas de briques?
Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests de raisonnement non verbal.
Classement –> intervertir deux cases pour que les dessins de gauche et de droites aient quelque chose en commun
Figures opposées –> chercher la figure la plus différente de la première
Matrices –> trouver le dessin qui manque dans le coin inférieur du carré.
Questionnaires d’intérêt, de personnalité ou de valeur: sous quelle forme principalement? Quelles sont les limites?
On utilise une échelle en plusieurs points, comme celle de Likert, afin d’estimer son degré d’accord ou encore la fréquence de ses conduites.
Problème de compréhension de l’échelle.
Il est parfois plus simple d’utiliser une échelle dichotomique (expression plus simple)
Quelles sont les tendances de réponse (biais)?
Tendance à l’acquiescement.
Tendance à donner des réponses socialement désirables
Comment contrôler la tendance à l’acquiescement?
En formulant la moitié des items avec la réponses “oui” qui indique qu’on est à un pôle d’une dimension, et pour l’autre moitié la réponse “non” qui indique le même pôle.
Comment contrôler la tendance à donner des réponses socialement désirables?
- En mesurant la force de la tendance en construisant des échelles de mensonge, où presque tout le monde devrait répondre de manière identique dans un sens non socialement désirable. Socre –> indication de la force de la tendance (réponses invalidées au-delà d’un certain seuil.)
- En construisant des items à choix forcé –> deux adjectifs à désirabilité sociale égale; choix de celui qui nous décrit le mieux –> modification du cadre de la mesure, d’une normative à une ipsative.Ex: plutôt anxieux ou timide?
Par quoi définit-on le niveau de difficulté d’un item?
Par la fréquence de réussite dans une populations. Items trop simples ou trop compliqués : pas de bonne différenciation (sauf sélection sévère).
Qu’est-ce qu’un test de vitesse? de puissance?
Vitesse: exécution d’une tâche le plus vite possible.
Puissance: difficulté progressive, sans limite de temps.
Qu’est-ce que la sensibilité d’un test?
Capacité des items d’un test à différencier les sujets. Elle est liée au niveau de difficulté des items, leur niveau de difficulté étant déterminé par la fréquence de réussite dans une population.
Items faciles et difficiles –>différenciation la plus faible. Items de difficulté moyenne –> différenciation la plus forte.
Différenciation aussi grâce aux de tests de “vitesse” et de “puissance”.
Dans quels cas la différenciation des sujets n’est pas souhaitable?
Pour évaluer les acquis d’une formation –> l’objectif devrait être atteint par tous.
Qu’est-ce que le score global? Sous quelle conditions est-il valide?
La somme des résultats aux différents items du test.
Il est valide si tous les items évaluent la même dimension, c’est-à-dire qu’ils présentent des corrélations substancielles.
Quelles sont les trois méthodes d’analyse des items pour savoir si chaque item permet une bonne discrimination? (liste)
L’indice de discrimnation
La corrélation item-test
L’intercorrélation entre tous les items