COURS 8 Flashcards
Définition d’une échelle dans la recherche psychologique?
- Une échelle est un type d’index qui mesure un construit psychologique (variable) qui est d’intérêt pour le chercheur
- Cette échelle est créée à partir d’un groupe d’énoncés (aussi appelés items) qui sont des indicateurs du construit psychologique mesuré
- Par exemple, une échelle de la dépression contiendra des items où la réponse à l’énoncé est considérée comme étant causée par le construit de la dépression
- Les réponses sont quantifiées, et un score plus élevé sur l’échelle représente un plus haut niveau de dépression rapporté par le participant.
Définition de l’échelle de Thurstone?
- Une échelle de type Thurstone est caractérisée par une série d’énoncés pour lesquelles les répondants doivent indiquer s’ils sont en accord ou en désaccord.
Quelles sont les étapes de conception d’une échelle de Thurstone?
Étape 1:
* Le chercheur écrit une série d’énoncés (environ 100) qui reflètent des attitudes favorables, défavorables ou neutres envers un thème.
Étape 2:
* Des juges indépendants doivent indiquer où chaque item se situe sur un continuum de 11 points, allant de très défavorable à très favorable
* Les juges ne DOIVENT PAS indiquer leur opinion personnelle à propos du thème, ou s’ils sont d’accord ou en désaccord avec les énoncés
* Nous voulons qu’ils jugent le niveau de faveur/défaveur de chacun des items individuellement, tel qu’ils sont formulés par rapport aux chats, où 1 = “Fortement défavorable envers les chats” et 11 = “Fortement favorable envers
les chats”
Étape 3:
* Les scores des juges pour chaque item sont analysés et le score médian et l’écart-type autour de la moyenne pour chaque item sont calculés
* La médiane est la valeur au-dessus et en-dessous de laquelle 50% des scores tombent (c.-à-d., le score au centre)
* L’écart-type est une mesure de variabilité dans les scores, indiquant à quel point les scores dévient étroitement ou largement à partir de la moyenne – un grand écart-type signifie qu’ily a un haut degré de variabilité à travers les scores que les juges ont attribué à un item, et un faible écart-type signifie qu’il y a peu de variabilité
* Les énoncés avec un grand écart-type sont éliminées, puisqu’il y a un manque de consensus à travers les juges par rapport à ces énoncés
* Le score final de chaque item (i.e., 1, 2, 3…,11) est ensuite déterminé en utilisant la médiane (un score de 4 est assigné à un énoncé ayant une médiane de 4, un score de 7 est assigné à un énoncés avec une médiane de 7, etc.)
Étape 4:
* Le chercheur doit maintenant sélectionner environ 2 items qui
représentent chacun des 11 différents scores (de = “Fortement défavorable envers les chats” à 11 = “Fortement favorable envers les chats”) [la version finale de l’échelle contiendra donc environ 22 items]
* Lorsque l’échelle finalisée est donnée aux participants, leur score individuel à l’échelle est calculé en additionnant les valeurs (1 à 11) qui correspondent aux énoncés avec lesquelles ils sont en accord
* Un score plus élevé signifie une opinion plus favorable, ou un accord avec le thème.
Définition des échelles de Guttman?
- Une échelle de type Guttman (aussi parfois appelée échelle cumulative) consiste en une série d’énoncés qui évaluent l’intensité progressive d’un phénomène
- Le but de l’échelle de Guttman est d’établir un continuum à une dimension pour un concept que l’on veut mesurer
- Cela signifie que le chercheur va créer une suite d’items, organisée de façon à ce qu’un répondant qui est d’accord avec une question spécifique de la liste sera également d’accord avec toutes les questions précédentes
- Ainsi, les énoncés sont placées en ordre ascendant pour refléter l’intensité progressive du phénomène étudié
- Le répondant doit indiquer s’il est en accord avec chacune des énoncés de l’échelle jusqu’à ce que l’une d’entre elles ne corresponde pas à son opinion
- Le but de l’utilisation de l’échelle de Guttman est de prédire les réponses aux items parfaitement, à partir du score total du répondant seulement
- L’échelle de Guttman est dite parfaite lorsque l’ordre des items est respecté, significant que les gens qui répondent positivement à une certaine énoncé ont nécessairement répondu positivement à toutes les énoncés précédentes.
- Par exemple, imaginez une échelle cumulative de 10 items : si un répondant obtient un score de quatre, cela devrait signifier qu’il est d’accord avec les quatre premières énoncés
- Si un répondant obtient un score de huit, cela devrait signifier qu’il est d’accord avec les huit premières.
Quelles sont les étapes de conception d’une échelle de type Guttman?
Étape 1:
* Les items sont généralement développés en utilisant le même processus que pour l’échelle de Thurstone (e.g., environ 100 items sont d’abord générés, pour une échelle finalisée contenant 25 items)
* Lorsque les juges évaluent les items, la taille de l’échelle reflétera le nombre d’items qui seront inclus dans l’échelle finale
* Par exemple, pour une échelle finalisée contenant 20 items, les items seront évalués sur une échelle de 20 points, et une échelle finale de 10 items utilisera une échelle de 10 points.
Étape 2:
* Une fois que les items ont été validés, le chercheur doit sélectionner un item valide à inclure pour représenter chacun des scores.
* Les items sont présentés en ordre ascendant, d’après les scores des items (e.g., l’item avec le score 1, ensuite l’item avec le score 2 etc.)
* Les items commencent généralement de façon neutre, et deviennent progressivement favorables (ou positifs) ou progressivement défavorables (ou négatifs) envers le thème.
Quelle est la particularité des échelles de Guttman?
- Pour qu’une échelle de type Guttman soit précise, les gens qui répondent positivement à un énoncé doivent nécessairement avoir répondu positivement aux énoncés précédentes
- Il est important de noter qu’il est possible pour un participant de répondre “en accord” avec un énoncé, mais “en désaccord” pour avec l’énoncés précédente, limitant potentiellement la validité de l’échelle – lorsque cela se produit, nous appelons cela une imperfection
- Pour déterminer si cela est un problème, les échelles de Guttman nécessitent un coefficient de reproductibilité qui est calculé avec les résultats obtenus par les participants
- Plus simplement, le coefficient de reproductibilité reflète la proportion de réponses valides (pas d’imperfection) sur le nombre total de réponses à travers tous les participants.
- Un coefficient de reproductibilité de 0.90 ou plus est considéré comme acceptable.
Quel coefficient reflète la proportion de réponses valides sur le nombre total de réponses à travers tous les participants?
Le coefficient de reproductibilité.
Définition des échelles de Likert?
- Les échelles de type Likert type sont composées d’items qui demandent aux participants de répondre en sélectionnant une option indiquant un degré d’accord ou de désaccord avec un énoncé (e.g., une échelle sur 7 points allant de 1 = fortement en désaccord à 7 = fortement en accord).
- Une échelle de Likert peut avoir un point milieu qui contient une réponse neutre telle que “je ne suis ni en accord ni en désaccord”, ou ne contient pas de milieu, forçant ainsi le participant à se “ranger d’un côté” en étant soit d’accord, soit en désaccord.
- Si un point milieu est offert, les participants pourraient avoir tendance à choisir cette option, et pour cette raison, le point milieu n’est pas souvent inclus.
- Il est également important d’avoir un nombre approximativement égale d’énoncés positives et négatives afin d’éviter les biais dans les réponses (e.g., « je suis une personne
de valeur » contre « je ne suis pas une personne de valeur »).
Quelles sont les étapes de conception d’une échelle de Likert?
Étape 1:
* Comme pour les échelles précédentes, le chercheur doit développer une série d’énoncés qui représentent le concept psychologique à l’étude (encore une fois, environ 100 items est préférable).
Étape 2:
*La prochaine étape est d’avoir un groupe de juges qui évaluent les items – voici un exemple où une échelle de 1 à 5 est utilisée :
1. Fortement défavorable au concept
2. Légèrement défavorable au concept
3. Indécis
4. Légèrement favorable au concept
5. Fortement favorable au concept
- Remarquez que, comme pour les autres échelles, les juges ne disent pas ce qu’ils pensent par rapport à l’énoncés en elle-même – ils jugent seulement à quel point chaque item est favorable ou défavorable par rapport au construit d’intérêt.
Étape 3:
*Parce que les résultats d’une échelle de Likert finalisée fournissent au chercher une mesure continue, des analyses statistiques plus complexes sont effectuées pour rejeter les items problématiques. Ces analyses incluent les corrélations, les coefficients alpha de Cronbach et l’analyse factorielle
Comment se fait l’analyse des corrélation dans la conception d’une échelle de Likert?
- En utilisant les scores obtenus par les juges, des corrélations standards entre toutes les paires d’items possibles peuvent être calculées
- Puisque le but est que chaque item de l’échelle soit capable de mesurer le même phénomène psychologique, une faible corrélation entre un item et les autres (e.g., plus faible que r = 0.30) indique que cet item ne devrait pas être inclus dans l’échelle finalisée.
Comment les coefficients alpha de Cronbach peuvent aider dans la conception de l’échelle de Likert?
- L’utilisation des coefficients alpha de Cronbach peut aussi aider le chercheur à affiner davantage la sélection des items à inclure dans l’échelle de Likert finalisée
- Une analyse de l’alpha de Cronbach produit un index qui est utilisé pour estimer la fidélité d’un test, puisque cette valeur est reliée au niveau de cohérence interne
- La cohérence interne réfère au degré d’homogénéité entre les items de l’échelle
- Lorsqu’il y a un haut degré de cohérence, les items mesurent relativement le même concept.
- L’alpha de Cronbach reflète la corrélation globale de tous les items d’une échelle de Likert, ou en d’autres mots, à quel point les items de l’échelle sont liés ensemble en tant que groupe.
- Si les items d’une échelle sont corrélés les uns aux autres, la valeur de l’alpha de Cronbach est augmentée
- Un coefficient alpha de Cronbach de >= 0.70 ou plus est généralement considéré comme acceptable, mais la plupart des échelles utilisées ont un coefficient alpha de Cronbach d’une valeur de 0.8 ou 0.9.
- Le calcul de l’alpha de Cronbach se fait uniquement à partir d’échelles de type Likert
- En bref, d’évaluer le niveau de cohérence interne en utilisant l’alpha de Cronbach peut être très utile afin de vérifier à quel point les différentes énoncés d’un test sont homogènes.
définition de l’analyse factorielle?
- L’analyse factorielle est une analyse multivariée plus complexe qui peut être utilisée pour détecter les items problématiques d’une échelle
- L’analyse factorielle teste pour la présence de construits latents (non-observés) ou facteurs (y1, y2, y3 … yi) qui sont partagés entre un certain nombre de variables mesurées (x1, x2, x3 … xi).
- Dans ce cas, le xi représente les items de l’échelle et yi représente les facteurs latents que les items de l’échelle partagent
- Lorsque des items (e.g., x2, x5, x7) sont corrélés avec un facteur (e.g., y1), on dit qu’ils saturent le facteur.
- Pour comprendre quel construit latent les facteurs représentent, le chercheur doit interpréter le contenu des items spécifiques qui ont saturé un facteur, et celui des items qui n’ont pas saturé ce même facteur.
- L’analyse factorielle peut révéler plus d’un facteur – par exemple, il est possible que
certains items d’une échelle vont saturer le facteur 1 (y1), alors que d’autres items de
l’échelle vont saturer un facteur 2 (y2) - Lorsque cela se produit, le chercheur a une preuve que son échelle mesure plus d’un thème ou construit psychologique
- Parfois, un chercheur souhaite mesurer plus d’un construit psychologique (ou facteur) dans une même échelle, mais il pourrait également vouloir éliminer les items qui sont reliés à un second facteur non-ciblé.
- Pour comprendre quels items spécifiques sont corrélés avec un facteur, le chercheur doit examiner le coefficient de saturation (cs) produit par l’analyse factorielle
- Un coefficient de saturation est produit pour chaque item de l’échelle, et représente la corrélation entre un certain item (e.g. x1) et un certain facteur (e.g., y1)
- Les items avec un faible coefficient de saturation pour un facteur ciblé (e.g., < 0.3) devraient être retirés de l’échelle, alors que les items avec un haut coefficient de saturation (e.g., > 0.5) devraient être conservés.
Définition des échelles avec analogie visuelle?
- Les échelles avec analogie visuelle sont similaires aux échelles de type Likert, mais la réponse est marquée sur une ligne continue
- Le chercheur mesure donc la distance entre le début de la ligne et la marque, et attribue au répondant cette distance à titre de score
- Ce type d’échelle est plus sensible pour détecter les effets induits par une variable indépendante (les petites différences peuvent être mesurées en millimètres).
- Les biais de réponse peuvent donc être réduits dans les situations où la même mesure doit être répétée plusieurs fois.
- Par exemple, un participant pourrait être tenté de sélectionner le même numéro pour une réponse à chaque fois, si une échelle de Likert est utilisée – toutefois, cela peut être plus difficile si le participant souhaite vraiment répondre la même chose.
définition de la fidélité des tests psychologiques?
- La fidélité des tests psychologiques fait à référence à la précision d’une échelle, peu importe ce quelle mesure
- En psychologie, il n’y a pas d’unité de mesure standard pour comparer les construits psychologiques tels que l’estime de soi, la dépression, ou encore l’amour des chats
- Afin de réduire le plus possible les erreurs de mesure, les chercheurs doivent donc utiliser plusieurs indicateurs (ou énoncés) pour mesurer un concept
- Une approche utilisée pour estimer la fiabilité d’une échelle est d’évaluer sa fidélité temporelle
- L’échelle est donnée au même groupe de participants à deux moments différents.
- Généralement, une période d’approximativement un mois entre les deux tests est utilisée.
Définition de la fidélité temporelle?
- La fidélité temporelle est calculée comme une corrélation entre les scores des deux échelles complétées par les mêmes participants.
- Plus la corrélation entre les scores des deux échelles est élevée (positive), plus le test est considéré comme étant fiable.
- Généralement, une corrélation de r = 0.80 est considérée comme étant acceptable
- La fidélité temporelle s’applique seulement à certains types d’échelles qui mesurent des construits qui devraient rester stables au fil du temps tels que les traits de personnalité, l’estime de soi ou l’amour des chats.
- La fidélité temporelle ne devrait pas être utilisée quand une échelle veut estimer une variable “situationnelle” ou un état temporaire, tel qu’une émotion transitoire ou encore l’humeur de quelqu’un à un moment précis.