Ppt. 3 Flashcards
Quelle est la fondation de toutes les méthodes d’évaluation des propriétés psychométriques?
La variabilité dans les scores générés par un instrument (les différences individuelles)
Pourquoi est-ce que la variabilité des scores générés est importante?
Il n’y aurait pas d’utilité à utiliser un instrument qui ne permet pas de différencier les personnes. Les scores doivent permettre de discriminer/séparer les personnes!
Quels types de différences doit-on considérer dans les scores générés par un instrument?
Interindividuelles (entre individus)
Intraindividuelles (entre différents contextes/conditions ou à travers le temps)
Les différences individuelles et intraindividuelles sont représentées par quoi statistiquement?
Par la variabilité ou la variance
Est-ce que les instruments psychométriques évaluent seulement les construits individuels comme l’intelligence ou la personnalité?
Non! C’est une fausse croyance. On peut aussi évaluer les construits environnementaux (environnement scolaire, pratiques parentales, etc.)
Quelle est la définition de la mesure selon Stevens?
«La mesure, prise au sens large, consiste à associer des nombres à des objets ou à des événements selon certaines règles»
Quel est le stric minimum pour le nombre de questions dans un questionnaire?
2!
Comment peut-on interpréter ou qualifier les informations des items présents dans un questionnaire?
Écouter la réponse verbatim et interpréter
OU BIEN
Utiliser un instrument de mesure avec des items proposant une échelle de mesure pour quantifier
“jamais, rarement, souvent, toujours”
Vrai ou faux : Avec deux items (questions), on peut créer un score composite.
Vrai! C’est une valeur numérique qui, dans le cas de l’évaluation de la supervision parental, va mesure la supervision.
Par exemple, si la mère répond “souvent” à Q1 et “rarement” à la q2, son score est alors de 3 (1+2)
Qu’est-ce qu’un test selon Anastasi et Urbina?
Un test est une «(1) mesure (2) standardisée et (3) objective (4) d’un échantillon de comportements»
**Comportements = émotion, cognition, sentiment, motivations, etc.
Quelle est la première composante d’un test selon Urbina et Anastasi?
Mesure = Associer des nombres à des caractéristiques (individuelles ou/et environnementales) d’une personne
Selon Anastasi, quelle est la deuxième composante d’un test ?
Standarisée = Uniformité de la procédure d’administration de l’instrument
- contrôle rigoureux de la démarche de l’observation scientifique
- administration standard d’un test (consignes, conditions d’administration, les questions doivent être les mêmes)
Quelle est la 3iem composante d’un test?
Objective.
Signifie que (a) les items doivent être compris de façon non-ambiguë et de la même façon par tous.tes les évalués.es et que (b) les résultats obtenus (scores) devraient systématiquement procurer de l’information sur le construit ciblé, indépendamment (ou en dépit) du jugement subjectif d’un évaluateur
*On veut un estimé du construit qu’on mesure, pas un estimé contaminé par d’autres facteurs confondants
e.g., Un questionnaire contenant des items avec un niveau de langage non adapté pour certaines personnes ou groupes de personnes évalués
Quelle est la 4ième composante d’un test?
Échantillon de comportements : : signifie qu’on ne couvre pas toutes les manifestations possibles d’un construit, mais qu’on sélectionne soigneusement un échantillon restreint, mais représentatif du contenu du construit.
importance = représentativité!
Urbina souligne que les instruments d’évaluation sont des _____
outils.
Donc, un moyen pour atteindre une fin et non une fin en soit!
Lorsque la distribution de scores d’une variable est normale,
Combien d’individus doivent se trouver dans un écart-type de la moyenne ?
68.2%
Lorsque la distribution de scores d’une variable est normale,
Combien d’individus doivent se trouver à deux écarts-types de la moyenne ?
95.4%
Lorsque la distribution de scores d’une variable est normale,
Combien d’individus doivent se trouver à trois ÉT (écart-type) de la moyenne ?
99.8%
Nous savons que les scores bruts sont difficiles à interpréter dans les échelles d’éval dimensionnelles…que devons-nous faire pour déterminer si un individu présente un score brut « différent », ou « anormal », ou « problématique » ?
On a besoin de comparer le score brut obtenu avec un critère de comparaison, avec une norme
Nommez les deux grands types de qualification et interprétation de score ?
- Qualification basée sur un critère de référence
- Qualification basée sur une norme de référence
Qu’est-ce que la qualification basée sur un critère ?
On l’appelle aussi l’interprétation critériée :
À partir d’un score établi a priori par les auteurs.trices d’un instrument qui permet de conclure qu’une « performance » ou un « statut » a été atteint
Donnez un exemple de qualification critériée.
- Le modèle de notation universitaire (A+, A, A-, B+, B, B- …)
- Les seuils du nombre minimal de symptômes manifestés qui suggèrent la présence d’un trouble ou d’une psychopathologie dans plusieurs instruments diagnostiques et de dépistage (Seuils des algorithmes du DSM-5)
Qu’est-ce que la qualification basée sur une norme ?
On l’appelle aussi interprétation normative ou interprétation normée
À partir de la moyenne des réponses d’un groupe de référence, ou groupe étalon. La moyenne de ce groupe devient le critère comparatif dont on se sert pour qualifier les évaluations subséquentes avec l’instrument
Vrai ou faux
Dans la qualification basée sur une norme, il n’est pas obligatoire de sélectionner un échantillon représentatif de la population d’intérêt pour la comparaison de moyenne.
Faux!
On sélectionne un échantillon d’individus qui sont représentatifs de la population d’intérêt et ils sont évalués avec l’instrument (super important)
Il existe trois grandes catégories de normes, certaines comportant plusieurs sous-catégories , nommez-les.
- Scores standardisés
- Centiles
- Normes développementales
Sachant que les scores bruts sont difficiles à interpréter, comment pouvons-nous qualifier et interpréter les scores ?
En utilisant les scores standardisées
On les appelle aussi par plusieurs autres noms : scores standards, scores étalonnés, scores pondérés
Quels sont les deux grands avantages des scores standardisés en général ?
- ils permettent d’utiliser les principes de la distribution normale
- ils ont des intervalles égaux le long du continuum de scores
Que permettent les scores standardisées ?
Les scores standardisés permettent d’indiquer de combien, en valeur d’écart-type, un score obtenu à un test se situe au-dessus ou au-dessous de la moyenne normative
Quelles sont les deux grandes fonctions ou utilités des scores standardisés ?
- Déterminer la position relative d’un individu par rapport à la population d’intérêt (groupe de référence) Quelle est sa position p/r aux autres ?
* i.e., déterminer si un score est significativement différent de la moyenne normative (un écart-type ou plus, lorsque la personne est à l’intérieur d’un écart-type, le score est normatif) - Faire des comparaisons entre différentes échelles qui n’ont pas la même métrie en valeur brute
* Comparer des scores sur une échelle similaire (e.g., anxiété) provenant de différents instruments (e.g., GAD7 vs HAM-A)
* Comparer des scores sur différentes échelles provenant d’un même instrument (e.g., anxiété vs dépression)
Vrai ou faux
Les scores standardisés sont obtenus avec une transformation linéaire des scores bruts.
Vrai
Quelle est la différence entre un score standardisé et un score normalisé ?
Score standardisé : Obtenues avec une transformation linéaire, la distribution originale n’est pas changée.
Score normalisé : Ce sont des scores qui obtenus initialement avec une distribution non-normale, il est donc possible d’utiliser une transformation non-linéaire pour les ramener à une distribution normale.
Vrai ou faux
Les scores-Z et les scores-T sont des types de scores standardisés.
Vrai
Pour les scores-T : Que signifie un score entre entre 41 et 59
Le score se retrouve à l’intérieur d’un écart type en dessous-dessus de la moyenne: Dans la moyenne normative
Pour les scores-T : Que signifie un score entre entre 60 à 69 ?
Le score de la personne est à un écart type au dessus de la moyenne : Significativement au-dessus de la moyenne normative
Pour les scores-T : Que signifie un score entre entre 70 à 79 ?
Deux écarts-type au-dessus de la moyenne : Très significativement au-dessus de la moyenne normative
Pour les scores-T, que signifie un score de 80 ou plus ?
Trois écarts-type au-dessus de la moyenne): Scores extrêmes
Dans les scores-T, que signifie un score de 31 à 40 ?
Significativement au-dessous de la moyenne
* « Bonne adaptation »
Dans les scores-T, que signifie un score de 30 et moins ?
30 et moins : Très significativement au-dessous de la moyenne
* « Très bonne adaptation »
Dans les scores-T, que signifie un score de 20 et moins ?
20 et moins : Scores extrêmes
Interprétez les scores-T de la personne suivante :
Agressivité reactive : Score de 80+ (3 écarts type au dessus de la moyenne), extrême et significativement élevé.
Agressivité proactive : Score de 40, dans la moyenne.
Agressivité physique : Score de 60+(un écart-type au dessus) significativement plus élevé que la moyenne.
Agressivité relationnelle : Score de 20. Elle n’utilise pas beaucoup cette forme d’agressivité.
Les scores standardisés peuvent être complexes à saisir pour les gens sans formation en psychométrie ou en statistiques, que pouvons-nous utiliser pour faciliter leur interprétation?
Les centiles
Que signifie un centile de 80 ?
Un centile de 80 signifie que 80% des individus ont un score plus bas ou égal au score observé.
Que sont les centiles ?
Ce sont des scores qui permettent de déterminer la position relative d’un individu par rapport à un échantillon normatif en termes de pourcentage d’individus
Nommez un problème avec les centiles ?
La distance entre les scores n’est pas égale le long du continuum (voir figure, diapo 41)
* Différences de scores entre les centiles sont très petites près de la moyenne et très grandes aux extrêmes de la distribution
* Les intervalles ne sont donc pas égaux le long de la distribution de centiles, contrairement aux scores standardisés
* e.g., la différence de scores standardisés entre le 51e et le 55e centiles peut être très petite (T=3), alors que la différence entre le 95e et le 99e centiles peut être très grande (T=20)
* Peut sembler beaucoup, mais les centiles entre 16 et 84 sont dans la moyenne
Quels sont les deux formes de normes développementales utilisées en psychologie et psychoéducation ?
les équivalents d’âge et les équivalents de niveau scolaire
Comment on fait pour obtenir des scores selon une norme développementale ?
Pour obtenir ces scores, bien que les calculs soient un peu plus complexes, il s’agit essentiellement de calculer des scores moyens (ou médians) à différents âges successifs ou différentes périodes développementales
Vrai ou faux
La qualification/interprétation des scores présentée avant dépend de la qualité du groupe de référence servant de norme, ou dit autrement, de l’échantillon normatif
Vrai
Nommez trois caractéristiques d’un bon échantillon normatif
- Représentatif de la population ciblée
* Idéalement échantillon national stratifié si population générale
* Souvent basés sur quelques caractéristiques sociodémographiques de base (e.g., âge, sexe/genre, lieu de résidence), mais certaines demeurent négligées - Grande taille
* Basé sur les principes probabilistes des méthodes asymptotiques
* Pas de chiffre magique. - Récent : 10 ans = toujours correct. 20 ans et + = moins bonne qualité.
Laquelle des trois caractéristiques d’un bon échantillon normatif est la plus importante ?
La représentativité