cours 1-5 Flashcards
test - 2 définitions
Test : une procédure destinée à établir la qualité, les performances ou la fiabilité de quelque chose, en particulier avant qu’il ne soit utilisé à grande échelle.
Test : méthode ou outil standardisé qui fournit de l’information sur un échantillon de comportements ou de processus cognitifs sous une forme quantifiée
SAT 1 et 2 VS SAT 10 –> mêmes initiales mais pas le même test!
SAT1 :
SAT2 :
SAT 10 (Stanford Achievement Test) :
SAT1 (Scholastic Aptitude Test) : test de raisonnement
SAT2 (Scholastic Aptitude Test) : tests mathématiques dans divers domaines
SAT 10 (Stanford Achievement Test) : utilisé pour évaluer la réussite scolaire de maternelle au secondaire
5 types de tests
- Tests d’aptitudes intellectuelles
- Tests d’accomplissement/tests de rendement
- Tests de personnalité
- Intérêts et attitudes
- Tests neuropsychologiques
Tests d’aptitudes intellectuelles
- Évalue fonctions cognitives/mentales (mémoire, visualisation spatiale, pensée créatrice, raisonnement, vocabulaire…)
- individuels ou collectifs
- Exemples :
SAT 1-2
Scholastic Aptitude Test (SATs) - SAT 1 et 2
Wechsler Adult Intelligence Scale (WAIS)
Échelle d’intelligence Stanford-Binet
Test d’habileté scolaire d’Otis-Lennon
Tests d’accomplissement/tests de rendement
- Évaluer le niveau de connaissance ou d’habileté dans un domaine particulier
- Inclut seulement tests standardisés élaborés par professionnels (pas examens d’école)
- le + utilisé
1. Batteries de tests = ensemble de tests sur une discipline
2. Sujet unique / tests thématiques
3. Certification, homologation (diplômes, brevets)
4. Programmes parrainés par le gouvernement (exemple : test du ministère)
5. Tests individuels de rendement : pour diagnostiquer problèmes comme les troubles d’apprentissage
Tests de personnalité
- Visent à obtenir de l’info sur la personnalité d’un individu
-
Tests objectifs de personnalité : notation objective/impartiale, et basée sur des réponses à des items à choix de réponses.
2 catégories :
– traits
– troubles - Tests projectifs de personnalité : présentent au candidat une tâche simple mais non-structurée.
o HEXACO (Très moderne, plus moderne que le livre) ***
o HEXACO.org
o NEO-PI (big 5)
o MMPI (Très clinique) :
o MMPI1-2 : fournit un profil comparant les rép du candidat à celles de plusieurs groupes cliniques
o SD3 – (Short-Dark Triad-3)
o BDI (Inventaire de dépression de Beck)
o EDI (inventaire des troubles alimentaires)
“——————————————”
Rorschach
SJT
Tests d’intérêts et attitudes
- Échelles d’attitudes (opinions)
- Valeurs
- Intérêts
Tests neuropsychologiques
- Obtenir des infos sur le fonctionnement du système nerveux central, notamment celui de l’encéphale
- Constitue une catégorie + ou – distincte pcq bcp de tests utilisés pour les évaluations neuropsychologiques appartiennent à d’autres catégories. Par exemple, tests d’aptitudes et de personnalité
- Mais catégorie distincte pour les tests qui visent uniquement à évaluer les fonctions cérébrales. Exemple : tests de coordination psychomotrice
Autres méthodes de classement des tests
Performance VS papier-crayon : tâche VS répondre sur papier/informatisé
Vitesse VS puissance
individuel VS collectif
Performance maximale VS performance typique
Référentiel normatif VS référentiel critérié : absolu vs relatif (percentile)
Utilisateurs des tests (4)
- Clinique
- Éducatif : collectifs d’aptitudes et rendement
- Travail
- Recherche
4 hypothèses de base
- Les humains ont des traits ou des caractéristiques qui sont reconnaissables
Ces traits décrivent certaines facette importantes des personnes ; les différences entre les personnes peuvent avoir de l’importance - Nous pouvons quantifier ces traits
- Les traits ont un certain degré de stabilité ou permanence
- Les trais stables quantifiés par les tests (nos mesures) sont liés au comportement dans des situations réelles.
5 questions fondamentales
- Fidélité
- Validité
- Utilisation de normes
- Élaboration du test
- Questions pratiques sur le test (coût, durée, accès, traduction, etc.)
Perspective différentielle
Perspective différentielle suppose que la réponse peut varier d’une personne à l’autre (contrairement à par exemple la théorie de conditionnement opérant de skinner qui décrit des lois universelles qui s’appliquent à tous les humains)
Ici, on s’intéresse + aux différences qu’aux ressemblances entre individu
Processus de développement de l’échelle (6 étapes)
- Générer des questions
- Distribuer les questions
- Évaluation initiale des questions et réduction des items
- Évaluation de la structure des questions (évaluer fiabilité du test)
- Évaluation de la validité/exactitude des questions
- Reproduire les résultats
Principales sources de développement (raisons pour lesquelles essor des tests) (6)
- Impulsion scientifique
- Préoccupation/intérêt envers l’individu
- Applications pratiques
- Méthodologie statistique
- Essor de la psychologie clinique
- Utilisation des ordinateurs
les statistiques opèrent sur des données brutes ou normalisées ?
sur des données brutes
4 types d’échelle
nominale, ordinale, intervalle, rapport
On peut décrire les variables selon 3 niveaux de généralité :
Construit :
Variable mesurée :
Données brutes :
Construit : la variable est décrite et définie verbalement. Niveau le plus général. Exemple : l’intelligence peut être définie comme la capacité de manipuler des symboles abstraits.
Variable mesurée : définition opérationnelle de la variable. Souvent sous forme de test.
Données brutes : obtention de données brutes – chiffres résultant de l’application des mesures. Données brutes sont le niveau le plus spécifique d’une variable. Résultat provenant de mesures.
2 volets des statistiques :
Statistiques descriptives :
Statistiques inférentielles :
- Statistiques descriptives : aide à résumer ou décrire les données brutes pour faciliter la compréhension des résultats. Données proviennent la plupart du temps d’un échantillon de personnes faisant partie de la population d’intérêt.
- Statistiques inférentielles : aide à tirer des conclusions (inférences) sur ce qui est probablement vrai au sein de la population, en fonction de ce qui a été découvert au sujet de l’échantillon
Façons d’organiser nos données brutes
Pourquoi organiser nos données brutes ?
- Tableau de fréquences, histogramme, polygone de fréquences
- Permet de voir certaines caractéristiques dans nos données (étendue, zone où les scores sont plus concentrés…) qu’on ne verrait pas s’ils n’étaient pas organisés.
Indice qui permet encore mieux que les tableaux de fréquences de représenter l’ensemble des données
indice de tendance centrale
= le centre autour duquel les données brutes tendent à se regrouper. = la valeur “typique” de la distribution
moyenne, mode et médiane
3 mesures de tendance centrale bcp utilisées :
Moyenne
Mode : score le plus fréquent d’une distribution
Médiane : score du milieu qui divise la série de scores en 2.
quelle(s) mesure(s) de tendance centrale est/sont affectée(s) par les scores extrêmes ?
juste la moyenne
mesures de tendances centrale VS mesures de dispersion
- tendance centrale indique la valeur “typique” de la distribution
- mesures de dispersion indiquent comment les données sont distribuées/réparties autour de la moyenne
indices de dispersion
Étendue : distance entre le max et le min
Écart-type : indice de la variabilité
Variance : très semblable à l’écart-type
Intervalle interquartile : distance qui sépare le premier quartile du troisième (le 25e et le 75e centile).
Formes de distributions -
3 manières principales de les distinguer :
étendue
forme (symétrie et aplatissement)
tendance centrale
distribution normale :
moyenne et écart-type
moyenne = 0
écart-type = 1
Comment savoir où se situe une observation dans la distribution normale ?
transformer en score z
Vrai ou Faux :
Donc toutes les distributions de scores Z ont la même moyenne et écart-type, peu importe la valeur des scores bruts initiaux
VRAI
rang centile
Indique la proportion des membres du groupe de référence qui se situent sous un score donné
rang centile - inégalité des unités dans l’échelle
les rangs percentiles se regroupent au centre et sont plus étalés aux extrémités de la distribution. Implique qu’une différence de scores bruts donnée (exemple : 3 points) est une grosse différence de rangs percentiles si au milieu de la distribution, mais petite différence si à une extrémité. C’est un problème dû au fait qu’on calcule les rangs percentiles à partir de la distribution normale.
pcq courbe normale a moins d’observations regroupées aux extrémités donc si à la base la personne se trouve à une extrémité et qu’on ajoute 3 pt à son score brut, ça va presque pas changer son rang percentile pcq elle va pas dépasser full plus de monde. alors qu’au milieu, si 3 pts de plus à son score brut, ya plein de gens être détronés (pcq plus de fréquences au milieu de la courbe) donc elle va gagner bcp dans le percentiles
Stanines (standard nines) -
moyenne et écart type
moyenne = 5
ET = ~2
stanines - pourquoi?
La raison pour laquelle ce nouveau format a été créé est qu’il y a un espace égal entre les intervalles de la distribution normale - sauf aux extrémités.
scores pondérés :
qu’est-ce que c’est et quels sont les différents types ?
conversion des scores brut en un système avec une certaine moyenne et ÉT
* scores Z : M = 0, ET = 1
* Scores T : M = 50, ET = 10
* SATs, GREs : M = 500, ÉT = 100
* Écart QI : M = 100, ÉT = 15 ou 16
* Stanines : M = 5, ÉT = ~2. = transformation NON-LINÉAIRE
avantages et inconvénients des scores standardisés/pondérés
Avantages
* Pratiques pour interpréter le rendement à un test. Bcp de traits étudiés en psycho suivent une courbe normale
* Évite le problème d’inégalité des intervalles dans les percentiles (inégalité des unités). Donc mieux pour les calculs statistiques
Inconvénients
* Peu de gens savent ce qu’est une courbe normale ou un score Z.
* Faut connaître les valeurs de moyenne et d’écart-type pour que le score Z veuille dire qqchose pour nous. Mais c’est pas automatiquement 0 parce qu’il existe d’autres systèmes de scores pondérés où la moyenne et ÉT sont différents. Exemple, un score de 26 sur l’ACT ne veut rien dire pour nous si on va pas consulter quelle moyenne et écart-type est utilisée dans ce système
Groupes de référence
Qu’est-ce que c’est ?
Différents types (8)
- Un groupe normatif est un échantillon de candidats au test qui sont représentatifs de la population à laquelle le test est destiné
- Le test est soumis au groupe de référence dans le cadre d’un programme d’étalonnage/programme de normalisation.
- On fonde les normes du test sur les résultats obtenus par le groupe de référence
- L’interprétation des scores est influencée par le groupe de référence utilisé dans l’établissement des normes
Types de groupes de référence :
1. Normes nationales : normes fondées sur groupe représentatif d’un segment de la population nationale. exemple : test dont les normes sont fondées sur des échantillons représentatifs des enfants de 5e année du Québec
2. Normes internationales : normes fondées sur les résultats de gens provenant de différents pays
3. Groupes de commodité : visent à présenter une norme nationale, mais taille trop élevée. Donc ont plutôt des normes qui reposent sur un ou plusieurs groupes de commodité qui sont «opportunément» disponibles. Les membres de ces groupes proviennent souvent d’une même région géographique, héritage culturel similaire, etc.
4. Normes d’utilisateurs : reposent sur les groupes qui se sont soumis au test, quels qu’ils soient. Les nouvelles données sont ajoutées à la base de données normative.
5. Pas de tentative à priori de s’assurer que les groupes soient représentatifs d’une population en particulier
6. Normes de sous-groupe : sous-groupes sont tirés du groupe de référence global. Par exemple, des normes distinctes selon le sexe, groupe sociodémographique, ethnie, région démographique… Sont utiles juste s’il y a des diff importantes entre les sous-groupes sur la variable mesurée
7. Normes locales : exemple : test fait dans une école, on fait une distribution des scores et interprète les scores par rapport à l’ensemble des élèves. Scores s’exprimeraient presque tjrs sous forme de percentile.
Exemple : entreprise utilise test d’aptitudes de calcul pour sélectionner des employés. Administré à 200 candidats chaque année. Tiennent compte de ces 200 candidats pour élaborer une norme locale
Avantage : on connait bien les caractéristiques du groupe de référence, pcq il est formé de personnes se trouvant dans une même situation.
Désavantage : la personne type est la moyenne. Donc la norme locale ne permet pas de déterminer si le sujet type se situe au-dessus ou sous la moyenne relativement à un certain cadre de référence extérieur
8. Normes institutionnelle : normes institutionnelles sont fondées sur les moyennes relatives aux personnes au sein des institutions
Exemple : 5000 étudiants de 200 collèges sont soumis à un test et un score moyen est établi pour chacun des 200 collèges. On fait une distribution des fréquences de ces moyennes, puis une norme à partir de ces moyennes, souvent sous forme de centile. = une norme institutionnelle.
Peut aussi l’appeler norme scolaire ou norme de groupe
Habituellement, distributions des scores indiv et des moyennes de groupe ont approximativement le même centre, mais scores indiv sont plus variés que les moy de groupe. Donc un score brut donné est plus déviant p/r à une norme d’institution que p/r aux normes liées aux individus. Scores sous la moyenne seront encore plus déviants p/r à la moy institutionnelle que p/r à la norme individuelle, et vice-versa pour les normes sous la moyenne.
Peut y avoir confusion si on fait pas clairement la distinction entre les normes individuelles et les normes institutionnelles. Exemple : «Le score de la région de Montréal est au 95e percentile de la norme provinciale.» gens pourraient penser que les résultats de l’élève type de Montréal sont supérieurs à ceux de 95% des élèves du Qc. Mais si ce 95e percentile est fondé sur des normes institutionnelles, très probable que cet élève type de Mtl ait eu des résultats supérieurs à 70 % des élèves de la province uniquement. Figure 3.21
Toutes les normes sont-elles bonnes ?
2 questions particulières
NON! –> biaisées
Effet de non-participation et effet de motivation
Effet Barnum
tendance des gens à accepter des desctiptions très vagues qui sotn probablement vraies pour tous, mais ne contiennent aucun renseignement spécifique découlant du test
percentiles, scores pondérés, normes de développement et groupes de référence –> types d’interprétation ____
interprétation NORMATIVE
Interprétation normative VS interprétation critériée :
Résultat de 90 % ou plus correspond à A+ –> = une interprétation ____.
Si tout le monde dans la classe obtient un 85 et qu’un professeur décide ensuite de fléchir [bell curve] les notes pour que la moyenne soit de B –> interprétation ____
Résultat de 90 % ou plus correspond à A+ –> = une interprétation critériée.
Si tout le monde dans la classe obtient un 85 et qu’un professeur décide ensuite de fléchir [bell curve] les notes pour que la moyenne soit de B –> interprétation normative - norme locale (pcq on interprète les scores par rapport à l’ensemble de la classe)
Normes de développement
- Quand le trait mesuré se développe systématiquement avec le temps
- Normes de développement n’ont de signification que si le trait mesuré se développe ou croît avec le temps dans la population visée.
- Le score brut est interprété en fonction de l’âge ou du niveau scolaire auquel il est normalement associé
Équivalents d’âge (âge mental) : dans certains tests d’aptitudes intellectuelles. Le score est appelé «âge mental». Proviennent des échelles métriques de l’intelligence (Binet-Simon)
Déterminés en établissant le score moyen ou médian de la personne à des âges successifs
Équivalents de niveau scolaire : utilisés dans des tests de connaissances. Déterminés lors de l’administration d’un test à des élèves de différents niveau scolaires
Permet de déterminer la performance type ou médiane de chaque niveau scolaire
Autres normes de développement :
Tests fondés sur les théories concernant les stades de développement de l’être humain. Exemples : théorie de Piaget sur le dév cognitif, théorie de Kohlberg sur le dév moral
Résultats à ces tests situent le sujet à un certain stade. Exemple : épreuve de développement de la pensée logique qui situe un enfant au «stade préopératoire» du dév cognitif
Mesures anthropométriques (ex : taille et poids). Sont souvent interprétées en fonction de normes de développement. Souvent interprétés par rapport à l’âge de l’enfant. Exemple : il est très grand pour son âge
validité & fidélité -
Un test peut être ____ mais pas ____
Mais un test ne peut PAS être ____ s’il n’est pas ____
Un test peut être fidèle mais pas valide
Mais un test ne peut PAS être valide s’il n’est pas fidèle
fidélité > validité
fidélité -
changement réel VS changement temporaire
Changement réel du trait mesuré
VS
Fluctuations dues à modification temporaire des circonstances personnelles, hasard qui détermine la version du test ou différences imputables à l’évaluateur
Changement réel du trait –> n’est pas une source d’erreur de mesure
Changement temporaire –> sources d’erreur de mesure
fidélité -
Erreurs systématiques VS erreurs aléatoires
Erreur systématique –> réduit systématiquement les résultats pour un individu ou un groupe et survient en raison de facteurs étrangers au test.
La fidélité ne tient pas compte de ces erreurs systématiques
Erreurs systématiques (non aléatoires) –> ne nuisent pas à la fidélité
Variations aléatoires des résultats –> nuit à sa fidélité
Distribution bivariée
représente relation entre 2 variable
= nuage de points = diagramme de dispersion
Corrélations -
Si pour chaque score X donné, peu de variabilité sur score Y –> coefficient est ____
coefficient élevé
corrélation -
taille d’effet (r^2)
proportion de la variance dans les scores qui expliquée par la relation entre les variables. r^2
0.1-0.3 –> petite
0.3-0.5 –> moyenne
0.5 et + –> forte
Droite de régression :
Droite qui parvient le mieux à montrer la relation entre les points de 2 variables.
Minimise l’erreur de prédiction
Plus r est élevé, moins les scores sont dispersés
Le Y prédit est noté par le symbole Y ‘
Est-ce que c’est la position relative ou absolue qui affecte le coefficient de corrélation ?
la position relative
position absolue n’a aucun impact
3 choses qui influent sur le coefficient de corrélation
- linéarité VS non-linéarité
- position relative (et non absolue)
- hétérogénéité du groupe
corriger le r pour une étendue trop restreinte
On fait ça pcq si l’étendue est trop restreinte, les scores vont être plus homogènes, et donc la corrélation sera sous-estimée
Si variabilité beaucoup plus faible dans groupe homogène que dans groupe hétérogène –> correction pour l’homogénéité a effet important.