cours 8 examen final Flashcards
Pourquoi a-ton créé des échelles
pour permettre au chercheur de recueillir de l’information sur un concept psychologique donné qui n’est pas observable par autrui
qu’est ce qu’une échelle dans la recherche psychologique
type d’index qui mesure un construit psychologique (variable) qui est d’intérêt pour le chercheur
de quoi est composé une échelle
est créée à partir d’un groupe d’énoncés (aussi appelés items) qui sont des indicateurs du construit psychologique mesuré
que mesure et que sont les échelles de type Thurstone?
pour mesurer les attitudes des gens vis-à-vis d’un thème donné
est caractérisée par une série d’énoncés pour lesquelles les répondants doivent indiquer s’ils sont en accord ou en désaccord
quelles sont les étapes pour construire une échelle de type Thurstone (4)
Étape 1: Le chercheur écrit une série d’énoncés (environ 100) qui reflètent des attitudes favorables, défavorables ou neutres envers un thème
Étape 2: Des juges indépendants doivent indiquer où chaque item se situe sur un continuum de 11 points, allant de très défavorable à très favorable. Les juges ne DOIVENT PAS indiquer leur opinion personnelle. Nous voulons qu’ils jugent le niveau de faveur/défaveur de chacun des items individuellement. 1= fortement défavorable vs 11 = fortement favorable.
Étape 3: Les scores des juges pour chaque item sont analysés et le score médian et l’écart-type autour de la moyenne pour chaque item sont calculés.
score médian = valeur au dessous et au-dessus 50% des scores tombent.
écart-type : mesure variabilité par rapport à la moyenne DONC énoncés avec haut degré de variabilité (haut écart-type) sont éliminés pcq pas consensus des juges.
si peu de variabilité = énoncé valide
le score final de chaque item est déterminé selon la médiane (ex score de 4 associé à énoncé avec médiane de 4)
Étape 4: Le chercheur doit maintenant sélectionner environ 2 items qui représentent chacun des 11 différents scores DONC échelle contient 22 items.
comment le score individuel est calculé pour une échelle de type Thurstone
leur score individuel à l’échelle est calculé en additionnant les valeurs (1 à 11) qui correspondent aux énoncés avec lesquelles ils sont en accord
que signifie un score plus élevé dans échelle de Thurstone
signifie une opinion plus favorable, ou un accord avec le thème
les items d’une échelle de Thurstone doivent être formulé de quelle manière
formulation doit etre similaire entre items et doit etre bref et direct possible
quel est l’avantage et 2 désavantages des échelles de type Thurstone
avantage : la position de l’énoncé n’est pas déterminé subjectivement par le participant mais par des juges indépendants
désavantage :
- demande bcp de temps et d’effort pour concevoir cette échelle
- pas facile de trouver des énoncés qui vont s’insérer dans chacune des catégories du continuum
quel est le niveau de mesure de l’échelle de type Thurstone et pourquoi
ordinal parce que les chiffres du continuum réflètent l’augmentation ou la diminution du niveau d’attitude mais sans pour autant préciser de quel ordre est cette augmentation ou diminution (on peut pas dire 2 fois + que)
quest ce qu’évalue une échelle de type Guttman et quel est son but de sa création
(aussi parfois appelée échelle cumulative) consiste en une série d’énoncés qui évaluent l’intensité progressive d’un phénomène
but : établir un continuum à une dimension pour un concept que l’on veut mesurer. Cela signifie que le chercheur va créer une suite d’items, organisée de façon à ce qu’un répondant qui est d’accord avec une question spécifique de la liste sera également d’accord avec toutes les questions précédentes DONC énoncés placé en ordre ascendant pour réfléter intensité progressive.
comment le répondant doit répondre une échelle de type Guttman
Le répondant doit indiquer s’il est en accord avec chacune des énoncés de l’échelle jusqu’à ce que l’une d’entre elles ne corresponde pas à son opinion
quel est le but d’utilisation de l’échelle de Guttman
prédire les réponses aux items parfaitement, à partir du score total du répondant seulement
quand est ce que l’échelle de Guttman est dite «parfaite»
lorsque l’ordre des items est respecté, significant que les gens qui répondent positivement à une certaine énoncé ont nécessairement répondu positivement à toutes les énoncés précédentes
quel est le niveau de mesure de l’échelle de Guttman et pourquoi
ordinal car les intervalles des énoncés ne sont pas égaux
quelles sont les étapes pour construire une échelle Guttman (2)
Étape 1: Les items sont généralement développés en utilisant le même processus que pour l’échelle de Thurstone (e.g., environ 100 items sont d’abord générés, pour une échelle finalisée contenant 25 items)
Lorsque les juges évaluent les items, la taille de l’échelle reflétera le nombre d’items qui seront inclus dans l’échelle finale (ex : si 30 itemps alors échelle sur 20)
Étape 2: Une fois que les items ont été validés, le chercheur doit sélectionner un item valide à inclure pour représenter chacun des scores
* Les items sont présentés en ordre ascendant, d’après les scores des items (e.g., l’item avec le score 1, ensuite l’item avec le score 2 etc.)
* Les items commencent généralement de façon neutre, et deviennent progressivement favorables (ou positifs) ou progressivement défavorables (ou négatifs) envers le thème
Selon l’échelle de Guttman, si un répondant répond «en accord» pour un énoncé, il a répondu «en accord» pour tous ceux précédent. est-ce possible que non?
oui, Il est important de noter qu’il est possible pour un participant de répondre “en accord” avec un énoncé, mais “en désaccord” pour avec l’énoncés précédente, limitant potentiellement la validité de l’échelle – lorsque cela se produit, nous appelons cela une imperfection
comment détermine-t-on si une imperfection est un problème pour l’échelle
- Pour déterminer si cela est un problème, les échelles de Guttman nécessitent un coefficient de reproductibilité qui est calculé avec les résultats obtenus par les participants
- Plus simplement, le coefficient de reproductibilité reflète la proportion de réponses valides (pas d’imperfection) sur le nombre total de réponses à travers tous les participants
- Un coefficient de reproductibilité de 0.90 ou plus est considéré comme acceptable
quels sont les avantages(2) et désavantages(1) de l’échelle Guttman
avantages :
- faciles et brêves
- intensité du phénomène n’est pas déterminé subjectivement par les participants mais par juges indépendants (comme Thurstone)
Désavantage :
- bcp travail pour trouver énoncé qui reflètent un degré d’inclusion constant
que mesure les échelles Likert
mesurer un état psychologique donné (échelle d’estime de soi ex)
de quoi est constitué une échelle Likert
de plusieurs énoncés qui prennent la forme déclarative (ex : je suis une personne de valeur) suivis d’un choix de réponses qui présentent un degré d’accord ou de désaccord (ex : échelle de 7 points allant de 1=fortement en désaccord à 7= fortement en accord)
est ce possible d’avoir un point milieu qui contient un réponse neutre dans échelle de Likert
Oui, MAIS participants pourraient avoir tendance à choisir cette option, et pour cette raison, le point milieu n’est pas souvent inclus, forcant ainsi le participant à se “ranger d’un côté” en étant soit d’accord, soit en désaccord
quest ce qui est important par rapport au nombre d’énoncé positif ou négatif dans échelle de Likert
Il est également important d’avoir un nombre approximativement égale d’énoncés positives et négatives afin d’**éviter les biais dans les réponses **
comment calculons le score pour une échelle Likert
les énoncés positifs : on additionne le score avec le chiffre donné
énoncés négatifs : on inverse le score donné puis l’additonne avec les autre énoncés (ex : échelle sur estime de soi ; «je ne suis pas personne de valeur» et je dois répondre de 1=tout à fait en désaccord à 4= tout a fait en accord. si je met 1, dans le calcul, il faudra inversé le chiffre 1 pour 4 car j’ai une haute estime de moi)
quel niveau de mesure est l’échelle Likert
ordinal car intervalles entre valeurs pas égaux
quelles sont les étapes pour créer échelle Likert(3)
Étape 1: Comme pour les échelles précédentes, le chercheur doit développer une série d’énoncés qui représentent le concept psychologique à l’étude (encore une fois, environ 100 items est préférable)
Étape 2: La prochaine étape est d’avoir un groupe de juges qui évaluent les items par rapport au concept (ca fit au concept oui, un peu, pas sur, non)
Étape 3: Parce que les résultats d’une échelle de Likert finalisée fournissent au chercher une mesure continue, des analyses statistiques plus complexes sont effectuées pour rejeter les items problématiques. Ces analyses incluent les corrélations, les coefficients alpha de Cronbach et l’analyse factorielle
explique comment on utilise les corrélations pour rejeter les items problématiques d’une échelle de Likert
Puisque le but est que chaque item de l’échelle soit capable de mesurer le même phénomène psychologique, une faible corrélation entre un item et les autres (e.g., plus faible que r = 0.30) indique que cet item ne devrait pas être inclus dans l’échelle finalisée
explique les coefficiants alpha de Cronbach pour rejeter les items problématique et que signifie un haut coefficiant ou bas et quest ce ce qui acceptable comme valeur
Une analyse de l’alpha de Cronbach produit un index qui est utilisé pour estimer la fidélité d’un test, puisque cette valeur est reliée au niveau de cohérence interne (degré d’homogénéité entre items), à quel point les items de l’échelle sont liés ensemble en tant que groupe.
haut degré : items de l’échelle sont corrélés les auns aux autres et mesurent même concept
si 0,70 et plus acceptable, mais la majorité se trouve entre 0,8 et 0,9
Le calcul de l’alpha de Cronbach se fait pour quelle type d’échelle
Likert et uniquement elle
quels sont les avantages (2) et désavantages(2) de l’échelle Likert
avantages :
- travail de conception est facile vs Guttman et Thurstone
- fidélité et validité + faciles à évaluer puisque possible de calculer coefficiants de cohérence et vérifier structure factorielle
Désavantages :
- échelle peut avoir grand nombre d’énoncé
- exige de la part des participants de porter jugement éclairé sur la valeur à accorder à l’énoncé sur une échelle de six ou sept point
quest ce que l’analyse factorielle mesure
pour détecter les items problématiques d’une échelle, c-à-d L’analyse factorielle teste pour la présence de construits latents (non-observés) ou facteurs (y1,
y2, y3 … yi) qui sont partagés entre un certain nombre de variables mesurées (x1, x2, x3 … xi) (items de l’échelle)
Lorsque des items (e.g., x2, x5, x7) sont corrélés avec un facteur (e.g., y1), on dit qu’ils saturent le facteur
quest ce qui arrive si l’analyse factorielle révèle + d’un facteur (2)
si items saturent facteur 1 et d’autre items saturent facteur 2 = preuve que son échelle mesure plus d’un thème ou construit psychologique
DONC 1) soit chercheur souhaite mesurer pls facteurs OU il voudrait éliminer les items qui sont reliés à un facteur qui ne veut pas étudier
comment un chercheur trouve quels items sont liés à certains facteurs
- le chercheur doit examiner le coefficient de saturation (cs) produit par l’analyse factorielle
- Un coefficient de saturation est produit pour chaque item de l’échelle, et représente la corrélation entre un certain item (e.g., x1) et un certain facteur (e.g., y1)
que signifie un faible coefficiant de saturation vs un élevé
Les items avec un faible coefficient de saturation pour un facteur ciblé (e.g., < 0.3) devraient être retirés de l’échelle, alors que les items avec un haut coefficient de saturation (e.g., > 0.5) devraient être conservés.
si 0,90 good si -0,90 good (car relié à l’opposé du facteur) si 0,1 ou -0,1 alors on retire car sature un autre facteur. ce qui faut retenir cest que négatif ou positif si élevé cest bon
que ce passe-t-il une fois que les items problématiques sont retirés dans l’échelle Likert
un sous-ensemble des items reflétant les différentes positions reliées au concept psychologique est sélectionné (très défavorable à très favorable envers le concept) – habituellement 20 items ou moins, puis présentée aux participants
quelle est la différence d’une échelle avec analogie visuelle vs Likert
analogie visuelle : réponse marquée sur une ligne continu
comment mesure-t-on les score d’une échelle avec analogie visuelle
Le chercheur mesure donc la distance entre le début de la ligne et la marque, et attribue au répondant cette distance à titre de score
quels sont les avantages (4) d’une échelle avec analogie visuelle
avantages :
1. très sensible car encore ++ précise que une échelle sur 7 points (distance mesurée en ml ex)
2. possibilité d’éliminer les biais de réponses lorsque les mêmes mesures sont utilisées à plusieurs reprise dans le temps (moins de chance que résultat soit le mm si par ex participants voudraient rester constant (+facile avec chiffres que endroit précis sur ligne)
3. + facile à construire et ++ facile à évaluer validité et fidélité
4. s’utilisent bine avec les nouvelles technologies
quelles sont les limites pour tous types d’échelle (5)
- répondant peut avoir difficulté à comprendre l’énoncé
- si questionnaire long, participants peuvent devenir fatigués et répondre sans réfléchir
- certaines personnes donnent des réponses erronées délibérément
- ca arrive que participants peuvent manquer d’introspection vis-à-vis à leurs motivations, émotions donc répondent au hasard
- certains répondent pour se présenter de façon favorable ou idéalisée
quest ce que la fidélité des tests psychologiques
fait référence à la précision d’une échelle, peu importe ce quelle mesure
quest ce que la fidélité temporelle
évalue la stabilité temporelle en donnant un test à deux reprises avec un intervalles de temps entre les deux (un mois ou un peu moins ou plus)
quest ce que la fidélité temporelle
évalue la stabilité temporelle en donnant un test à deux reprises avec un intervalles de temps entre les deux (un mois ou un peu moins ou plus)
quest ce qu’évalue la fidélité temporelle
la corrélation entre les scores des deux échelles complétées par les mêmes participants
Plus la corrélation entre les scores des deux échelles est élevée (positive), plus le test est considéré comme étant fiable (r=0,80 et +)
à quel types d’échelles la fidélité temporelle peut être appliqué et pour quel type elle ne devrait pas etre utilisé?
- types d’échelles qui mesurent des construits qui devraient rester stables au fil du temps tels que les traits de personnalité, l’estime de soi ou l’amour des chats
- quand une échelle veut estimer une variable “situationnelle” ou un état temporaire, tel qu’une émotion transitoire ou encore l’humeur de quelqu’un à un moment précis
quest ce que la technique des formes équivalentes
participants complètent l’échelle à deux reprises; toutefois, ce sont deux versions différentes de l’échelle qui sont administrées mais mesure le même construit psychologique. dans une même session ou en deux sessions séparées (un mois d’écart).
les deux versions doivent avoir langage similaire et avoir mm nbr d’énoncé et présentation visuelle pareil.
Encore une fois, la fiabilité est calculée par la corrélation entre les deux tests, et une corrélation de r = 0.80 est considérée comme acceptable
quelles sont les deux manière d’administrer la technique des formes équivalentes et la particularité
doit deux test dans mm séance ou différentes séances
si différentes séances, il faut tenir compte du passage du temps (+ erreur de mesure) dont corrélation prob + faible si différents moments.
quels sont les désavantages de la techniques des forces équivalentes
- influence du premier test sur le second(effet d’apprentissage)
- difficile de créer deux versions équivalentes d’une échelle (– validité)
quest ce que la cohérence interne
pour tous types de tests stable sou instables (faut uste que les réponses soient précisés par les participants sur échelles quantifiables, SEULEMENT LIKERT)
en utilisant l’alpha de Cronbach, on mesure le degré d’homogénéité entre les items de l’échelle (peut aussi etre utilisé pour retirer itemps problématiques)
si haut degré de cohérence ; items mesurent mm concept donc valeur alpha augmente (0,70 et plus acceptable)
quest ce que la validité des tests psychologiques
La validité d’un test réfère au contenu des énoncés de l’échelle (évalue le construit visé)
quels sont les types de validité (3)
- validité de contenu
- validité de critère
- validité de construit
quest ce que validité de contenu (2)
mesure si les items d’une échelle sont pertinents au construit à l’étude
1. à quel point les énoncés couvrent l’ensemble du construit
2. à quel point les énoncés ne contiennent pas de variables non pertinentes
doit-on faire validité de contenu avant ou après construction test
peut être les deux
1. avant : utilisation des juges utiles
2. après : avec réponses des participants
quest ce que la validité de critère
l’efficacité d’une échelle en ce qui concerne la prédiction des comportements dans une variété de situations
deux formes de prédiction : validité concomittante et validité prédictive
quest ce que la validité de critère concomittante
évalue le pouvoir prédictif d’une échelle lorsque à la fois l’échelle et le critère (une autre mesure psychologique ou comportement) sont mesurés au même moment et que leur deux scores sont corrélés
si corrélation élevée alors échelle a haut niverau de validité concomittante (capable de prédire comportements) DONC on peut juste (par la suite) évaluer l’échelle sans le critère (ex : échelle motivation et critère nbr d’heures d’étude, si corrélation forte, alors on peut juste évaluer motivation pour dire que élève motiver)
quest ce que la validité de critère prédictive
est évaluée lorsque le critère est mesuré plus tard dans le temps (est-ce qu’un certain comportement dans le futur (au temps 2) peut être prédit avec le score obtenu à l’échelle au temps 1?)
ex : motivation(t1)et notes scolaire (t2)
MAIS pas souvent utilisé car lourd à réaliser
quest ce que la validité de construit
évalue si l’échelle est assez sensible pour mesurer le concept basé sur la théorie basé sur anlayse factorielle et les aspects convergents et divergents.
donc si théorie = 2 facteurs alors il faut trouver 2 facteurs dans échelle évaluer le construit de cette théorie
quest ce que l’analyse factorielle dans validité de construit (2)
exploratrice et confirmatoire
exploratrice : chercheur soumet pointages des participants à l’analyse qui détermine le nbr de facteurs regroupant les énoncés.
quest ce que l’analyse factorielle confirmatoire
cherche à tester un modèle théorique dans lequel les résultats de l’analyse sont prédits d’avance
* La façon dont chaque énoncé devrait saturer chacun des facteurs est prédite d’avance et est testée en utilisant l’analyse factorielle
* Le niveau de concordance entre les prédicitons et les résultats de l’analyse indique au chercheur si son modèle est supporté
quest ce que la validité convergente et divergente (de construit)
convergente : le degré avec lequel une échelle et un critère qui sont théorisés comme étant reliés convergent vers un même concept
divergente : démontrer qu’elle n’est pas significativement corrélée à un critère non-pertinent
en utilisant la matrice multitrait-multiméthode (MMM)
explique MMM
compare le construit mesurée par une nouvelle échelle avec au moins un autre construit indépendante et en utilisant au moins deux méthodes différentes
DONC on évalue 2 construits qui semblent pas avoir de liens (ex estime de soi et narsicisme) avec 2 méthodes (échelles et observations faite par psychologues)
il devrait avoir corrélationn élevée entre mm construit et différentes méthodes pour validité convergente
il devrait avoir corrélation faible entre construit différent d’une même méthode pour validité divergente
ps : la diagonale de «1» (qui représente typiquement la comparaison de chaque mesure avec elle-même) pour estimer fiabilité (fidélité) de chacune des mesures grâce à alpha de cronbach ou accord interjuges