Observation et mesure Flashcards by Roxane Villeneuve

Qu’est-ce qu’un test? A quoi sert-il?

Dispositif d’observation –>mise en évidence des différences entre les individus (recherche ou application).

Passage individuel ou collectif.

How well did you know this?

Not at all

Perfectly

Quels sont les différents types de test?

Test d’aptitude : aspects globaux ou analytiques du fonctionnement intellectuel, de son développement et de son efficience, ou tests psychomoteurs - voir si un individu sera apte.

Test de personnalité : objectifs –> conduites observées, manière habituelle de se comporter / projectifs -> le sujet structure un matériel ambigu et projette sa personnalité.

Tests de connaissance, scolaires ou professionnelles

Questionnaire de personnalité, inventaire d’intérêt et de valeur –> description que le sujet fait de lui-même.

How well did you know this?

Not at all

Perfectly

Approche nomothétique et idiographique.

Caractérisation des individus sur des dimensions.

Approche nomothétique = normative –> individus comparables.

Approche idiographique (ipsative) –> caractérisation sans référence à d’autres personnes.

How well did you know this?

Not at all

Perfectly

L’observation libre

Pas de règles pour l’observateur, les conditions et les indications données au sujet dépendent du contexte. Manière de caractériser la conduite du sujet = décision de l’observateur.

How well did you know this?

Not at all

Perfectly

L’observation contrainte

Situation de test. Situation définie, consignes spécifiées. Modification d’un paramètre –> nouveau test.

How well did you know this?

Not at all

Perfectly

La standardisation: définition, rôle, exemples

Uniformité de la démarche d’administration et de correction du test.

Permet la comparabilité de sujets et l’accord entre les observateurs (dernier point discuté)

L’épreuve doit répondre à des **règles strictes de passation et de cotation. **

N’entraine pas forcément un comportement stéréotypé de l’observateur (méthodes qui s’adaptent au sujet)

Standardisation à son maximum: QCM // tests informatisés –> conditions de passation identiques, relevé de bonnes réponses.

How well did you know this?

Not at all

Perfectly

Qu’est-ce qu’un item?

Partie, question d’un test.

How well did you know this?

Not at all

Perfectly

La figure complexe de Rey: définition, fonction, cotation.

1942, par le psychologue suisse André Rey.

Permet d’évaluer les déficits mnésiques de sujets atteints de troubles cérébraux.

Copier la figure en prenant son temps puis la reproduire de mémoire 3 minutes après (crayons de couleur ou stylet) –> permet de dissocier le déficit mnésique de l’insuffisance de l’organisation perceptive.

Deux systèmes de cotation:

sept manières de réaliser le dessin, du gribouillage à l’élaboré (pas très objectif)
Figure : 18 parties. 2 point par unité bien placée; 1 point si mal placée –> plus objectif

How well did you know this?

Not at all

Perfectly

Qu’est-ce qui détermine le choix des items?

Les objectifs et les conceptions psychologiques (théories), ainsi que les considérations pratiques.

How well did you know this?

Not at all

Perfectly

Choix d’un item sans théorie / avec théorie

Sans théorie: contenu des items issu de la psychologie commune.

Avec une théorie: la théorie donne des indications sur la nature des items à retenir.

Ex: tests scolaires en adéquation avec le programme, test d’intro/extraversion, théorie structurale d’Eysenck –> les cinq facettes de l’extraversion.

How well did you know this?

Not at all

Perfectly

Quels sont les différents formats d’item?

Production libre de la réponse

Test papier-crayon –> choix multiples (correction du score en estimant les réponses dues au hasard.)

How well did you know this?

Not at all

Perfectly

Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests verbaux.

Compréhension de phrases –> un dessin et six phrases: trouver la phrase exacte.

Proverbes –> trouver la phrase qui correspond le mieux au sens du proverbe.

Analogies verbales –> X est à Y ce que Z est à…?

How well did you know this?

Not at all

Perfectly

Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests spatiaux

Soustractions géométriques –> trouver ce qui reste du dessin après une soustraction.

Développement -> qu’obtient-on si on déroule le papier?

Briques –> que voit-on si on est derrière ce tas de briques?

How well did you know this?

Not at all

Perfectly

Donner quelques exemples d’items dans le domaine des aptitudes cognitives : tests de raisonnement non verbal.

Classement –> intervertir deux cases pour que les dessins de gauche et de droites aient quelque chose en commun

Figures opposées –> chercher la figure la plus différente de la première

Matrices –> trouver le dessin qui manque dans le coin inférieur du carré.

How well did you know this?

Not at all

Perfectly

Questionnaires d’intérêt, de personnalité ou de valeur: sous quelle forme principalement? Quelles sont les limites?

On utilise une échelle en plusieurs points, comme celle de Likert, afin d’estimer son degré d’accord ou encore la fréquence de ses conduites.

Problème de compréhension de l’échelle.

Il est parfois plus simple d’utiliser une échelle dichotomique (expression plus simple)

How well did you know this?

Not at all

Perfectly

Quelles sont les tendances de réponse (biais)?

Tendance à l’acquiescement.

Tendance à donner des réponses socialement désirables

Comment contrôler la tendance à l’acquiescement?

En formulant la moitié des items avec la réponses “oui” qui indique qu’on est à un pôle d’une dimension, et pour l’autre moitié la réponse “non” qui indique le même pôle.

Comment contrôler la tendance à donner des réponses socialement désirables?

En mesurant la force de la tendance en construisant des échelles de mensonge, où presque tout le monde devrait répondre de manière identique dans un sens non socialement désirable. Socre –> indication de la force de la tendance (réponses invalidées au-delà d’un certain seuil.)
En construisant des items à choix forcé –> deux adjectifs à désirabilité sociale égale; choix de celui qui nous décrit le mieux –> modification du cadre de la mesure, d’une normative à une ipsative.Ex: plutôt anxieux ou timide?

Par quoi définit-on le niveau de difficulté d’un item?

Par la fréquence de réussite dans une populations. Items trop simples ou trop compliqués : pas de bonne différenciation (sauf sélection sévère).

Qu’est-ce qu’un test de vitesse? de puissance?

Vitesse: exécution d’une tâche le plus vite possible.

Puissance: difficulté progressive, sans limite de temps.

Qu’est-ce que la sensibilité d’un test?

Capacité des items d’un test à différencier les sujets. Elle est liée au niveau de difficulté des items, leur niveau de difficulté étant déterminé par la fréquence de réussite dans une population.

Items faciles et difficiles –>différenciation la plus faible. Items de difficulté moyenne –> différenciation la plus forte.

Différenciation aussi grâce aux de tests de “vitesse” et de “puissance”.

Dans quels cas la différenciation des sujets n’est pas souhaitable?

Pour évaluer les acquis d’une formation –> l’objectif devrait être atteint par tous.

Qu’est-ce que le score global? Sous quelle conditions est-il valide?

La somme des résultats aux différents items du test.

Il est valide si tous les items évaluent la même dimension, c’est-à-dire qu’ils présentent des corrélations substancielles.

Quelles sont les trois méthodes d’analyse des items pour savoir si chaque item permet une bonne discrimination? (liste)

L’indice de discrimnation

La corrélation item-test

L’intercorrélation entre tous les items

Qu'est-ce que l'indice de discrimination? Comment le calcule-t-on?

Sert à déterminer si chaque item est un indicateur. On considère les 25-30% moins bons et les meilleurs 25-30%. Dans chaque groupe, on calcule le pourcentage de ceux qui réussissent et échouent à un item particulier. Différence des deux pourcentage = pouvoir discriminant de l'item --\> les bons réussissent, les mauvais échouent. Indice de discrimination fonction de la difficulté de l'item. Potentiellement max. à .50. Choix des distracteurs --\> action sur l'indice.

Qu'est-ce que la corrélation item-item?

**La part de variance commune au test et à l'item.** Sert à déterminer si l'item est un indicateur de la dimension. S'il n'en est pas un: reformulation ou élimination de l'item.

L'intercorrélation entre tous les items

Si la corrélation est suffisante, la dimension existe. ---\> analyse factorielle de la matrice des intercorrélations pour déterminer les facteurs qui saturent certains items (dimensions)

L'idéal est d'avoir des corrélations et intercorrélations élevées. Comment doit-on s'y prendre?

**Le contenu des items doit être proche** --\> on doit s'intéresser à des dimensions étroites sur une gamme de conduite peu étendue. Choix du seuil qui dit qu'une corrélation est substantielle --\> compromis entre des exigences contradictoires.

Quels sont les trois niveaux de mesure pertinents en psychologie (échelles)

Echelles nominales, ordinales et d'intervalle/numérique.

L'échelle nominale: définition et méthodes statistiques.

**Regroupement des observations enclasses d’équivalence, sans ordre.** Méthodes statistiques : * **mode** = indice de tendance centrale * **entropie** = indice de dispersion * **Khi 2** pour le calcul du degré de liaison entre les variables

L'échelle ordinale : définition et méthodes statistiques applicables.

**Relations antisymétriques et transitives**. **Ordre entre les classes, mais distances quelconques** Méthodes statistiques : * **médiane** : indice de tendance centrale * **dispersion** : proportion d'observations entre une classe et la médiane. * degré de liaison: **tau de Kendall** Echelle de Guttman (1950s): développement linéaire et cumulatif.

L'échelle d'intervalle : définition et méthodes statistiques.

**Distance entre les classes définie par ajouts successifs de nouvelles classes** (concaténation). Unités conventionnelles. Définition des intervalles dans les tests mentaux: convention, tout comme postuler la normalité des distributions. Méthodes statistiques : * **moyenne,** * **variance** * **coefficient de corrélation de Bravais-Pearson.**

Qu'est-ce que la note brute? Pourquoi ne peut-on pas l'utiliser telle quelle?

Le score brut à un test donne une **indication sur la performance du sujet** mais ne permet pas de comparer cette performance à celle des autres sujets d’un groupe de référence. La comparaison est possible grâce à l’étalonnage

Qu'est-ce que l'étalonnage? A quoi sert-il?

C'est la **construction d’une échelle de notation standard** à partir des **résultats obtenus dans un échantillon représentatif d’une population de référence.** Il transforme **un score brut en note standard** ou étalonnée, qui permet * de **situer le sujet par rapport au groupe de référence ** * des **comparaisons interindividuelles et intraindividuelles**

Quels sont les deux systèmes d'étalonnage? Les décrire.

**_Le quantilage_** : c'est le **fractionnement de la distribution** des notes brutes en **classes de même effectif** dont les limites sont les quantiles. **_Les échelles normalisées_** : **notes brutes transformées en notes normalisées** en référence à loi normale de moyenne m et écart-type s au choix (QI : m=100 et s=15; z : m=0, s = 1; T : m=50, s=10)