Mesures des phénomènes étudiés Flashcards
En quoi consistent les qualités psychométriques?
Ce sont des qualités qui permettent de juger la valeur des mesures en psychologie (jusqu’à quel point elle est bonne) car plus les mesures ont de bonnes qualités, plus l’étude est rigoureuse
Quelles sont les deux principales qualités psychométriques?
Fidélité et validité
Pourquoi est-il important de maximiser la fidélité et la validité?
Parce que sinon ça mène à des erreurs de diagnostics
Qu’est-ce que la fidélité?
La précision de l’instrument peu importe ce qu’il mesure: entraîne toujours des résultats semblables alors mesure toujours le concept de la même façon
Qu’est ce qu’une erreur de mesure systématique? +exemple
Lorsque les facteurs inhérents au test influencent l’erreur (mauvais items): distorsion systématique des scores observés alors on surestime ou sous-estime les scores vrais
Ex: Problèmes mathématiques sur sujets masculins = sous-estime vrai perfo. des filles
Qu’est-ce que l’erreur de mesure non-systématique?
Remet-elle en question la fidélité du test?
Une erreur provenant de facteurs extérieurs au test (erreur aléatoire)
Non, car elle est aléatoire et se distribue normalement chez les gens (ex: avoir le rhume pendant exam)
Combien de types de fidélité existe-il?
4!
1: Fidélité temporelle (ou satbilité ou test-retest)
2: Fidélité par formes équivalentes (ou parallèles)
3: Cohérence interne (homogénéité ou consistance interne)
4: Fidélité de type accord inter-juges
Qu’est-ce que la fidélité temporelle?
La capacité d’un test à reproduire les mêmes résultats à la suite d’application répétés de ce test
Pourquoi est-il important d’avoir un intervalle de 2 semaines à 1 mois dans la fidélité temporelle?
On veut que la personne oubli les questions (pas influencer les résultats) mais qu’il n’y ait pas trop de changements liés au temps
Pour quels types d’études recommande-t-on ce type de fidélité?
Pour les concepts plus stables (ex: estime de soi, personnalité) mais déconseillé pour les tests qui mesurent l’état passager (ex: émotions, humeur) et tests pouvant être influencés par la mémoire ou l’apprentissage
En quoi consiste la fidélité par formes équivalentes?
Participants remplissent deux versions différentes mais équivalentes d’un même test en une seule passation
Pourquoi est-il plus rare de vérifier la fidélité par formes équivalentes?
Il faut deux versions avec même nrb d’items, même présentation et même directives = peu de tests possèdent des versions équivalentes donc utilisation limitée
Quel est le type de fidélité le plus utilisé en psycho?
La cohérence interne!!!
En quoi consiste la cohérence interne?
- Fait référence au degré d’homogénéité des items d’un test: Jusqu’à quel point le personne répond tjrs aux items dans le même sens
- Une seule passation requise
- Utilisée pour concepts stables ou qui varient selon temps/situation
Pourquoi le fait de poser des questions redondantes aide à la fidélité?
Ça aide la cohérence interne car on veut s’assurer que la personne a bien compris les questions et répond toujours dans ce sens = très utile lorsque l’enjeu est élevé
Quelles échelles de mesure utilise-t-on pour la cohérence interne?
- Alpha de Cronbach (x): ordinales ou intervalles
- Alpha de Kuder-Richardson: nominale dichotomique (vrais ou faux)
Qu’est-ce que la fidélité de type accord inter-juges?
C’est le niveau d’accord entre les jugements d’observateurs et de juges lorsqu’on souhaite observer un cmpt
Comment mesure-t-on la fidélité de type accord inter-juges?
Kappa de Cohen: % d’accord qui est corrigé pour l’influence du hasard ou de la chance
La fidélité ou la validité est préalable à la validité?
La fidélité est préalable à la validité mais ne détermine PAS la validité (pas pcq fidèle que valide)
Qu’est-ce que la validité?
Degré d’adéquation avec lequel un instrument de mesure correspond au construit qu’il prétend mesurer: est-ce que l’instrument mesure bien ce qu’il est sensé mesurer?
Combien de types de validité existe-il?
4!
1: Validité apparente
2: Validité de contenu
3: Validité decritère
4: Validité de construit (ou val. théorique)
Qu’est-ce que la validité apparente?
Correspond à la logique entre les items du test et ce qu’il prétend mesurer = évaluation en surface des items par des juges non experts qui donnent leur avis sur la qualité des items pour mesurer le construit
Pourquoi est-ce que la validité apparent est la procédure de validation la moins scientifique?
Elle ne nécessite aucune analyse statistique, car elle se fie au jugement des juges: caractère superficiel et peu rigoureux
Quel est l’avantage d’utiliser la validité apparente?
Permet de créer des tests mieux acceptés pas les utilisateurs car apparaît plus légitime. Les instruments sont destinés à un large public.
À quoi sert le test MMPI?
À détourner la validité apparente afin de contrer la désirabilité sociale (poser des questions de manière indirecte)
Qu’est-ce que la validité de contenu vérifie?
Que les items d’un test sont pertinents au construit visé
- À quel point les énoncés du test couvrent l’ensemble du construit
- À quel point les énoncés du test ne contiennent pas de variables non-pertinentes
Comment vérifions-nous la validité de contenu?
Les créateurs demandent à des EXPERTS du domaine d’évaluer la validité de contenu de CHAQUE item en fonction de son lien avec le construit visé
Quelles sont les étapes proposées pour évaluer la validité de contenu?
- Définir avec soin le domaine et dimensions du construits + valider la définition
- Échantillon d’experts et membres population de référence pour créer les items et autres aspects test
- Soumettre les items à une validation de contenu
- Utiliser plusieurs experts pour valider le contenu et quantifier jugement à l’aide d’échelles formalisées
- Examiner la représentation propor. des items relativement aux dimensions du concept
- Présenter résultats de validation de contenu lors de la publication du nouvel instrument
- Tenir compte de toutes analyses psychométriques ultérieures pour affiner la validation de contenu du test
Quel type de validité est le plus important?
La validité de critère!!!
Qu’est ce que la validité de critère?
Lorsque la mesure est reliée à un cmpt (le critère) auquel elle est sensée être reliée = efficacité d’un test à prédire le cmpt psychologique (affects, cognitions, actions)
Quelles sont les deux formes de validité de critère?
- Validité concomitante
2. Validité prédictive
Qu’est-ce que la validité concomitante?
C’est la capacité de prédiction d’un test alors que le test et le critère sont mesurés au même moment. Demander à un échantillon de participants de répondre à notre instrument de mesure puis de se soumettre à une mise en scène qui permet d’observer le cmpt
Comment évaluons-nous la validité concomitante et prédictive?
Avec un coefficient de corrélation entre le test et le critère
Qu’est-ce que la validité prédictive?
Capacité de prédire un comportement mesuré ultérieurement à partir d’un test
Qu’est-ce que la validité de construit (ou validité théorique)?
La justesse avec laquelle un test psychologique permet de bien mesurer le construit (comme définit par cadre théorique)
Vrai ou faux: La validité prédictive est limité par la grandeur de l’échantillon et par la fidélité
Vrai!
- À cause de la perte de participants liée au temps
- La fidélité temporelle (cmpt évalué plus tard = risque de changement)
Quels sont les éléments essentiels à la validité de construit?
- La structure du construit
2. La validité divergente/convergente
Qu’est-ce que la structure du construit? Et comment faire pour la vérifier?
Un test possédant un haut niveau de validité de construit devrait être en mesure de démontrer une structure en accord avec la théorie sous-jacente (ex: voir si les items vont dans les bonnes dimensions)
Administrer l’instrument de mesure à un échantillon de forte taille
Comment faire pour valider la structure factorielle?
Avec l’analyse factorielle exploratoire (début d’une étude pour ajouter ou enlever aux dimensions) ou confirmatoire (refaire le test sur une population similaire)
Qu’est-ce que la validité convergente? Comment on la vérifie?
Capacité d’une mesure de produire des résultats semblables à ceux produits par d’autres mesures reliées au contexte en question
Corrélation de Pearson entre ma mesure et test déjà existant
Pourquoi voudrions-nous refaire un test pour mesurer un construit?
- Pour en faire un plus simple/court
- Pour suivre l’évolution du construit (nouvelle réalité)
Qu’est-ce que la validité divergente/discriminante? Comment on la vérifie?
Consiste à démontrer que le test n’est pas significativement corrélé avec des construits non pertinents: On a évalué une seule et même chose
Elle est divergente si elle obtient une corrélation non significative (pas plus fort que validité convergente)
Pourquoi est-ce que la fidélité limite la validité?
Une faible fidélité = plus d’erreur de mesure = une validité moins élevée (ne représente pas bien le construit)
Que pouvons-nous faire comme observation de la validité en clinique?
Chaque mesure ou observation n’est qu’un score = c’est la sommes des mesures convergentes avec les indices sur le terrain qui permettent d’avoir une certitude clinique
Qu’est-ce qui arrive si le test comporte trop de faux-positifs?
On dit que le test est trop sensible
Si je décide de classifier tous les participants qui ont pris 2 bières la semaine dernière comme étant alcooliques, quels seront les résultats de mon test?
Le test est TRÈS sensible, alors je vais déterminer que tous les alcooliques sont des alcooliques MAIS j’aurai beaucoup de gens qui ont bu légèrement et qui seront classés comme alcooliques. Il y a trop de faux-positifs.
Qu’est-ce qui arrive si le test comporte trop de faux-négatifs?
On dit que le test est trop spécifique.
Si je classe comme alcooliques seulement les participants qui ont pris au moins 45 consommations d’alcool la semaine dernière, quels seront les résultats de mon étude?
Le test est TRÈS spécifique, alors plusieurs alcooliques seront classés comme n’étant pas alcooliques. On dira alors que j’ai trop de faux négatifs.