Examen 2 Flashcards
Les 5 composantes des tests
fidélité validité échantillon standardisation mesure objective
L’échantillon : précision
restreint mais soigneusement sélectionné
+ grand = représente plus la population
plus la variance d’erreur baisse du à l’échantillon (erreur d’échantillonnage) et donc plus on mesure la vraie qualité du test
standardisation
uniformité
même administration pour tous ( consignes,notes,temps,..)
même normes
mesure objective + binet et simon
établir le niveau de difficulté des items de manières empiriques et objective (Binet et Simon)
selon binet et simon : le test est objectif si ordre de facile à dure.
la fidelité
- reproductiblité ( test retest + formes parallèles)
- degré de fidelité (a de conbach, gamma, beta)
- spécifier types de fidelité
- =fiabilité, stable à travers le temps?
la validité
- test mesure ce qu’il veut mesurer?
- coefficient de validité
- spécifier le type de validité
- selon critères externes +indépendants
Pourquoi utiliser des tests?
objectivité
rapport temps/Argent
prouvé de manière empirique
Pourquoi contrôler les tests?
- anonymat
- examinateur qualifié pour sa validité
- évité que le public ne connaisse le contenu
fonctions de l’administrateur du test (à quoi faire attention, que doit-il faire)
-lire préparer son test
-se familiariser avec le test
2 rapports: 1) conversation, tranquiliser. 2) explication du test
-vérifier l’état des examinés
Mesure et évaluation: concept de base (5)
1) mesure et évaluation
2) échelle de mesure
3) classification des échelles
4) mesure et statistiques
5) normes,scores et distribution
Mesure et évaluation, où trouve-t-on la mesure?
la mesure est partout!
Pourquoi la mesure en psycho est dure? A quoi sert-elle? Sous qu’elle forme la trouve-t-on?
car science humaine
elle sert à prédire ou identifier des comportements voir a les expliquer.
Une mesure comprend un symbole numérique et une unité de mesure (style 2M)
différence mesure et évalution?
mesure = 2m, c’est le symbole et l’unité de mesure mais
évaluation: porter un jugement sur la valeur, connaître la limite ( moyenne, écart-type etc) pour pouvoir juger. 2m pour une femme c’est très grand: évaluation Pour juger il FAUT connaitre les limites
Les Echelles de mesures : 4 types
nominales
ordinale
intervalles égaux
proportions
échelles de mesure: nominale
pas d’opération arithmétique dessus! Juste des fréquences et des pourcentages%
catégories EXCLUSIVES
pas d’ordre
exemple: métier, sexe,;.
échelle de mesure: intervalles égaux
les intervalles sont égaux! pas de zero absolu!
exemples: température, localisation
échelles de mesures : proportions
2 doubles de 1. Les distances sont égales. Zero = absolu donc absence de la chose.
exemples: Ages, nombre d’enfants,..
normes?
normes = évaluer de manières empiriques et objectives
+ situer le score sur la distribution
=> transformer le score brut en mesure relative: déterminer la position relative de l’individu, permet de comparer la performance de 2 individus ou d’1 individus à 2 tests.
normes intragroupes et groupe normatif
manières dont les scores vont être distribués, permet de situer un score par rapport au autres grâce au groupe normatif.
centiles
limite et explications
avantage et désavantage
% de sujets ayant un score inférieur au notres.
Exemple si j’ai 28% de gens qui réussissent 15 problèmes, j’ai un score de 15 pour le CEntile 28.
Le centile 100 et 0 ne devraient pas vraiment exister.
avantage: compréhensible, universellement applicable
désavantage: inégalité des distances
Au centiel 98 j’ai 98% de la population ayant un score inférieur.
SCORE Z
limite et explications
avantages et désavantages
score Z = s(core - moyenne)/ écart type
il faut que la distribution soit transformée ( moyenne = 0 et écart type de 1) pour faire une courbe normale
entre +1 et -1 il y a 68% des scores
formule: LE QI
AM/AC * 100
la fidelité c’est quoi
la reproductibilité!!!
théoriquement les résultats restent les mêmes avec le temps mais non , car 2 types de variances:
-variance d’erreur (fatigue,entrainement,..)
et la variance réel (voulue)
impossible d’avoir une fidelité de 100%
permet de déterminer dans quelle mesure les différences individuelles sont réelle et pas du à la variance d’erreur
comment contrôler la variance d’erreur
le temps, les consignes le climats,..uniformisation, contrôle de l’environnement, consignes,..
les corrélations
6types:
une corrélation exprime le degré de correspondance entre 2 series de scores r de pearson Rho de spearman Rt : tétrachorique Rpo : polychorique Rpa: partielle R :multiples
interprétation d’une corrélation
par exemple : les enfants qui réussissent en math tendent (R8)=0,40) dans une certaines mesure à réussir en lecture et vice versa. Bien que la relation soit modéré
PAS CAUSE A EFFET
coefficient de détermination
R² % de variabilité expliqué par l’autre variable.
Elle doit être de 0,8 mini car 0,8²= 0,64 alors que si 0,7² ça fait 0,49 donc pas assez.
impact de N sur les corrélations
plus l’échantillon est grand plus la corrélation peut être basse pour être significative. Si p est plus petit ou égal ) 0,05 alors on avec
n = 10 on veut une corrélation de 0,63
N=104 on veut une corrélation de 0,25 pour être significatif
N=800 : 0,08!
est-ce utile d’avoir 2 items qui corrèle à 0,9?
NON car l’un détermine 0,81 de l’autre donc autant le supprimer.
les types de fidelité
fidelité test restest (stabilité)
fidelité par version parrallèles (équivalence)
fideliter par bissection (cohérence interne)
Kr20 et alpha de cronbach (homogénéité)
Fidelité intercorrecteur/interjuge
fidelité test retest: (stabilité temporelle)
même test à 2 moments différents! On calcule la corrélation entre les 2. ( Rtr).
La variance d’erreurs correspond au fluctuations aléatoire de performance
Il est important de spécifier l’intervalle entre 2 passations
la pratique peut modifier ( se rappeler des réponses :effet de mémoire et effets de pratiques)
fidelité par versions parallèles (équivalence)
voir la corrélation entre 2 tests qui mesurent la même chose
même nombre d’items, mêmes formes, mêmes contenus!
même difficulté, standardisé
réduit l’impact du monitorat et de la tricherie
permet de voir la variable intermédiaire
faiblesse: Sujet différent quand à leurs amélioration (pratique), ou pas la même motivation à passer le test
fidelité par bissection (cohérence interne)
on prend les items pairs et impairs par xemple
on calcul la fidelité d’un DEMI TEST!!!!
faiblesse: ne tient pas compte de la stabilité temporelle
fidelité KR20 et alpha de cronbach (homogénéité)
c’est la fidelité entre les reponses
c’est l’homogénéité inter-items.
la variance d’erreur= degré d’homogénéite du domaine des contenus étudiés
Si + de 2000 personnes on utilisera l’omega de mcdonald
Kr 20 pour les items tout ou rine
Alpha de cronbach pour les échelles de types likert
on affiche toujours les 2 mêmes si alpha > kr20
Fidelité intercorrecteurs (interjuges)
utile pour correction types subjectives
faire corriger le test par au moins 2 juges indépendants et en calculer la corrélation
il faut un R de 0,8 car si 0,7² ça fera 0,49 et pas assez!
fidelité intercorrecteur = kappa
tests de vitesses et de puissance
test de vitesse: énormément d’items simples , pas le temps de tout faire, on calcul la rapidité
test de puissance type le QI, question rangé du plus simple au plus dure, impossible d’avoir un score parfait.
dans les 2 cas il est impossible d’avoir un score parfait
Si je passe 100 fois le même test de QI, j’ai 100 résultats dépendants les différences de scores sont dues à quoi?
les différences seront dues à l’erreur standard de mesure
si 100 personnes passent le même test de QI, à quoi sont dues les différences?
l’écart-types, les différences individuelles
Si on prend 100 personnes au test de Q.I. description des résultats
1 personne sortira du +2,58 et -2,58 écart-types donc hors 61,3 et 138,7