Observation Et Mesure Flashcards
Quels sont les différents types d’observation ?
Continuum allant de l’observation libre à l’observation contrainte (standardisée)
Quelles sont les fonctions de l’observation standardisée ?
- permettre comparabilité en s’assurant que différences détectées ne viennent pas de la situation ou de l’observateur
- fournir mesures objectives : accord entre observateurs, neutralisation erreurs de subjectivité des observateurs
Indiquez des exemples de tests du plus standardisé au plus libre.
- QCM, tests informatisés : conditions identiques pour tout le monde, correction limitée à compter bonnes réponses
- Réponses libres : cotation à l’aide d’un barème avec exemples
- Tests projectifs
Pourquoi la standardisation ne correspond pas à un comportement stéréotypé de l’examinateur ?
- Consigne adaptable au sujet
- Prise en compte contexte mental réponse
- Demande d’explicitations réponse du sujet, suggestions (méthode “critique” Piaget)
Quelles sont les procédures de l’observation contrainte ?
3 points figurant dans le manuel du test :
- situation bien définie
- consignes spécifiées à l’avance (procédure d’application)
- mode caractérisation du sujet explicité
Qu’est-ce qu’un item ?
Une question ou un problème qui fait partie d’une série constituant le test.
De quoi sont généralement composés les tests ?
D’items
Par quoi peut-on caractériser les items ?
- leur tendances de réponse : biais
- leur niveau de difficulté : sensibilité
- leur analyse : dimension
Quels sont les différents formats possibles des items ?
- Réponse libre : analyse du discours (énumération, description ou interprétation), vérification si réponse correcte
- Questions fermées à choix multiple (papier-crayon) : mauvaises réponses sont distracteurs
- Échelle de Likert : sujet donne son degré d’accord avec l’énoncé ou fréquences certaines conduites. Souvent questionnaires d’intérêts, personnalité, valeurs
Quels sont les critères de choix des items par le constructeur ?
- Objectifs : que veut-il évaluer ?
- Considérations pratiques : longueur, coût, attractivité
- Théorie choisie qui sert de guide : Piaget (stades et structures), Eisenck (facettes extraversion)
Quels sont les inconvénients de l’échelle de Likert ?
Interprétation des réponses variable d’un sujet à l’autre
Quels sont les inconvénients des QCM ?
Quand bonne réponse pas connue, sujet peut répondre au hasard -> nécessité de corriger le score en estimant le nbre de réponses dues au hasard : mode de correction approximatif
Comment contrôler la tendance de réponse par acquiescement ?
Balancer items où “oui” va dans un sens et dans l’autre
Quels sont les biais possibles des questionnaires ?
Les tendances de réponse :
- tendance à l’acquiescement
- tendance à donner réponses socialement désirables
Comment mesure-t-on le niveau de difficulté des items ?
Par leur taux de réussite dans une population
Comment contrôler la tendance à donner des réponses socialement désirables ?
- Mesurer force tendance via “échelles de mensonge” : items où tout le monde devrait répondre d’une manière identique, non socialement désirable (vous est-il déjà arrivé de mentir ?) -> si score dépasse un certain seuil, réponses du sujet invalidées.
- items à “choix forcé”, de même désirabilité sociale, vérifiée auparavant -> cadre modifié en passant de mesure normative à ipsative (comme dans Q-sort)
Qu’est-ce qui permet une forte différentiation des individus et donc que le test ait une sensibilité optimale ?
Des items de difficulté moyenne (environ 50 % de réussite)
Qu’est-ce que la sensibilité d’un test ?
Le niveau de capacité de ses items à différencier les individus
Quelle peut être l’utilité des items difficiles ?
Pour des usages particuliers comme une sélection sévère
Dans quels cas la différenciation des individus est mauvaise ?
Quand les items sont trop faciles ou trop difficiles
Dans quel type de tests n’est-il pas souhaitable d’obtenir une différenciation des individus ?
Les tests pédagogiques car but de la formation est que tous les individus aient atteint les mêmes objectifs
Quelles sont les sources de différentiation possibles ?
- difficulté des items : test de puissance
- vitesse d’exécution : test de vitesse
Quelle est la procédure de passation du test de la figure de Rey ?
- Copie de la figure
2. Reproduction de mémoire après délai de 3 mn
Qu’évalue le test de la figure de Rey ? De quand date-t’il ?
Les déficits mnésiques
1942
Comment obtient-on un mode de cotation parfaitement objectif du test de la figure de Rey ?
En automatisant la correction : le sujet utilise une table digitalisée et un stylet
Que mesure-t-on avec le test de la figure de Rey ?
- Temps de réalisation
- Manières de realiser le dessin : 7 référencées, de primitive (gribouillage) à élaborée (partir du grand rectangle et y rattacher le reste) -> répartition par âge connue
- Nombre d’unités reproduites, avec score global calculé selon si unités bien ou mal placées, déformées ou non
Comment s’effectue l’analyse des items ?
Par un score global, c’est à dire la somme des résultats aux différents items du test
Sous quelle condition le score global est-il significatif ?
Seulement si tous les items évaluent la même dimension, c’est-à-dire s’ils présentent des corrélations substantielles
Quelles sont les 3 méthodes d’analyse des items utilisées ?
- Indice de discrimination : lié à difficulté item
- Corrélation entre chaque item et le test
- Intercorrélation entre tous les items, puis éventuellement analyse factorielle
Comment calcule-t’on un indice de discrimination ?
- considérer les 30 % de sujets qui réussissent le mieux et les 30% qui réussissent le moins bien
- examiner dans chaque groupe % de réussite et d’échec à un item particulier
- différence entre les 2 pourcentages indique valeur de discrimination de l’item
A quel taux la discrimination est-elle maximale ?
50 %
Pourquoi l’indice de corrélation item-test est moins ambigu que l’indice de discrimination ?
Parce qu’il indique la part de variance commune au test et à l’item
Pourquoi l’indice de discrimination et la corrélation item/test postulent existence d’une dimension ?
Parce qu’ils vérifient que chaque item en est bien un indicateur.
Quelle est l’utilité de la méthode de calcul des intercorrélations entre tous les items ?
Vérifier que les intercorrélations sont suffisantes pour considérer que la dimension existe
Que permet l’analyse factorielle de la matrice des intercorrélations ?
De déterminer le ou les facteurs qui saturent certains items
Si tous les items saturent dans un même facteur -> dimension existe et il est bien justifié de les sommer
Par quoi peut-on représenter figurativement les propriétés des items et leur relation au score ?
Par “les courbes caractéristiques des items” :
Score au test en abscisse, % réussite en ordonnée
Permet de repérer les items les plus ou les moins discriminants
Que définissent en général les modèles de mesure ? Citez-en un.
Des règles formelles de correspondance entre variables observables et variables latentes
L’analyse factorielle
Quels sont les modèles de mesure particuliers qui ont été développés ?
Les modèles de réponses à l’item
De quoi dépend la réussite d’un item par un sujet ?
- Position du sujet sur une variable latente (attributs du sujet qualifiés de traits latents)
- Caractéristiques de l’item (paramètres du modèle)
Comment sont définies les courbes de réponse à un item dans les modèles de réponse ?
A priori (plus à partir d’observations)
Quelle est la forme des courbes dans les modèles de réponses à l’item ?
Forme d’une fonction sigmoïde (progression rapide en zone intermédiaire)
Que permettent les modèles de réponse à l’item ?
D’échelonner les items.
A quoi sont utiles les modèles de réponse à l’item ?
Constitution de banques d’items dont les propriétés sont connues (en éducation par ex.)
Testing adaptatif ou sur mesure : repérer zone de compétence d’un sujet avant évaluation plus fine
Quels sont les 3 niveaux de mesure pertinents en psychologie ?
- Les échelles nominales
- Les échelles ordinales
- les échelles d’intervalle
Définissez l’échelle nominale.
Regroupement des observations en classes d’équivalence, sans ordre
Quelles méthodes statistiques sont utilisables dans les échelles nominales ?
- indice tendance centrale : mode
- indice dispersion : entropie (mesure écarts d’effectifs entre les classes)
- calcul degré de liaison entre variables : khi 2
Définissez l’échelle ordinale.
Également regroupement en classes, mais que l’on peut ordonner.
Distance qui séparent les classes sont quelconques.
Représentations graphiques conventionnelles.
Quelles méthodes statistiques sont utilisables dans les échelles ordinales ?
- indice tendance centrale : médiane
- indice dispersion : % observations entre 1 classe et médian
- calcul degré de liaison : tau de Kendall, échelle de Guttman (si dévpt linéaire et cumulatif, càd items réussis dans l’ordre)
Définissez l’échelle d’intervalles (numérique)
Distance entre les classes est définie.
Unités et forme distribution conventionnelles (ex. loi normale intelligence)
Quelles méthodes statistiques sont utilisables dans les échelles d’intervalles ?
- indice tendance centrale : moyenne
- indice dispersion : variance
- calcul degré de liaison : coefficient corrélation Bravais Pearson
Qu’indique la note brute ou le score brut à un test ?
Une indication sur la performance du sujet mais pas de comparaison avec la celle des autres sujets d’un groupe de référence
Comparaison possible avec l’étalonnage
Définissez l’étalonnage
Construction d’une échelle de notation standard à partir des résultats obtenus dans un échantillon représentatif d’une population de référence
Qu’est-ce que permet l’étalonnage ?
- Transformer une note brute en note standard (ou étalonnée)
- Situer le sujet par rapport au groupe de référence
- comparaisons inter et intraindividuelles
Dans un test, quels sont les 2 systèmes d’étalonnage qui permettent de situer les sujets dans des groupes de références ?
- Le quantilage : fractionnement en classes de même effectif (ex. percentiles -> échelle de rang exprimée en %)
- Les échelles normalisées : notes normalisées en référence loi normale de moyenne m et écart-type au choix (QI : m = 100 et écart-type = 15)
De quelle manière simplifiée peut-on situer un sujet sur un centilage ?
Transformer l’échelle de scores bruts en échelle de rangs exprimée en %