cours 5 : Validité Flashcards

Question

Qu'est-ce que la validité factorielle ?

Answer 1

- On veut vérifier si la structure factorielle théorique qui représente le construit est reproduite sur le plan empirique (i.e., avec des données) - L’objectif est de vérifier deux aspects inter-reliés de la structure factorielle théorique 1. Les items sont-ils significativement (statistiquement) associés au facteur (construit) ? 2. Dans le cas d’un instrument multidimensionnel, a) Les items sont-ils significativement associés au bon facteur et non-associés aux autres facteurs ? b) Dans le cas d’une structure hiérarchique, est-ce que les sous-domaines sont significativement associés au domaine général (e.g., traits spécifiques associés à trait général) ?

Answer 2

- On utilise généralement le terme « facteur » pour représenter une dimension latente (ou variable latente, trait latent : qqchose que l'on ne peut pas mesurer directement, donc on mesure des manifestations observables), d’où l’utilisation du terme validité factorielle - Facteur : une réduction parcimonieuse de plusieurs variables (items ou questions) expliquées par une variable latente - Dans les instruments multidimensionnels (ex. l'EDC car il comporte 3 échelles), les items se regroupent évidemment en plusieurs facteurs

Answer 3

(ça se fait tout seul dans le logiciel --> permet de voir si les items sont associés aux bons facteurs) - On identifie des regroupements d’items inter-corrélés, signifiant que les individus tendent à y répondre de façon similaire ○ e.g., Si les répondants.es ont tendance à répondre oui à la Q#1 ont aussi tendance à répondre oui à Q#5 et à Q#8, ces items seront donc regroupés dans un même facteur - Le chercheur.euse n’impose aucune restriction à la matrice de corrélations (ou de covariances) entre les items - Critère classique : on devrait avoir des saturations factorielles de 0,40 ou plus pour les items associés à un facteur (corrélation entre un item et le score général de l'échelle)

Answer 4

Degré auquel les scores d’une échelle sont associés avec ceux d’une autre échelle existante qui mesure le même construit théorique

Answer 5

Degré auquel les scores d’une échelle ne sont pas associés avec une échelle qui ne mesure pas le même construit

Answer 6

la méthode de la matrice multitraits-multiméthodes

Answer 7

- Aussi appelée validité pragmatique - Réfère au degré auquel les scores à une échelle sont associés à l’adaptation (ou la performance) des individus - Les scores à l’échelle sont donc comparés à ceux d’un critère externe - Le critère devrait être une mesure objective et indépendante de l’instrument, mais reliée conceptuellement au construit d’intérêt (réseau nomologique)

Answer 8

Concomitante et prédictive

Answer 9

1. Corrélation avec un critère indépendant ○ Test d’intelligence avec réussite académique (notes) ○ Test d’empathie avec conduites délinquantes 2. Méthode des groupes contrastés ○ On teste les différences de scores moyens entre des groupes ○ e.g., Pour EDC, on prend un échantillon d’enfants déjà identifiés avec des TC (par psychologues scolaires) et on les compare avec un groupe d’enfants sans TC afin de déterminer si les scores à l’EDC distinguent bien les groupes

Answer 10

- Le degré auquel une mesure est capable de prédire un critère externe prospectivement (plus tard dans le temps) - Besoin d’une étude longitudinale prospective * e.g., les scores à une échelle d’impulsivité à la fin de l’enfance peuvent-ils prédire l’abus de psychotropes lorsque les individus sont au début de l’adolescence, deux ans plus tard ? * e.g., les scores sur une échelle de qualité de l’attachement aux parents au préscolaire permettent-ils de prédire un diagnostic d’anxiété de séparation plus tard, à l’entrée à l’école ?

Answer 11

- Forme de validité pas toujours présente dans les livres de psychométrie, mais dans les faits, est une forme spécifique de validité de critère - À quel point les scores à un test ont une « valeur ajoutée » pour prédire un critère externe, au-delà de la capacité d’autres facteurs (autres tests) prédictifs importants ? - Liée à l’idée de « contrôle statistique » en analyse de régression e.g., quel est l’effet d’un prédicteur important après que le SSÉ soit contrôlé ? - En contexte de classification par ex., les scores d’une échelle de dépistage qui procurent une meilleure sensibilité et spécificité que ceux d’une autre échelle similaire ○ Sur le plan clinique, ceci signifie qu’on prend possiblement de meilleures décisions avec la nouvelle échelle - Peut aussi s’appliquer à la révision d’un test Les scores de la nouvelle version (a) prédisent mieux que l’ancienne version un critère au-delà de facteurs de contrôle, ou encore (b) procurent une meilleure sensibilité et spécificité que l’ancienne version

Answer 12

- Il s’agit essentiellement de déterminer à quel point les scores d’un test peuvent classifier adéquatement les personnes dans des groupes - La théorie de la décision comprend une série de concepts visant l’analyse des effets quantitatifs des décisions prises avec des tests - Pertinent dans différents contextes de classification tels que pour le dépistage, le diagnostic, la sélection du personnel, la certification, la dérogation scolaire, etc. - Les concepts de la théorie de la décision sont donc intimement liés à la validité de critère

Answer 13

Capacité d’une échelle de procurer un résultat positif pour les personnes présentant le statut (e.g., un trouble) qu’elle prétend identifier - Se rapporte donc à la capacité de détection - Dans le tableau 2 X 2, on voit qu’il s’agit simplement des vrais positifs divisés par tous ceux qui ont vraiment le statut (i.e., trouble) * e.g., Avec l’EDC : proportion d’enfants obtenant un score égal ou supérieur à un score critère donné (ex., T = 60) parmi tous les enfants qui présentent réellement un TC

Answer 14

Capacité d’une échelle de procurer un résultat négatif pour les personnes ne présentant pas le statut (ex., un trouble) qu’elle prétend identifier - Se rapporte donc à sa capacité de discrimination - Dans le tableau 2 X 2, on voit qu’il s’agit des vrais négatifs divisés par tous ceux qui n’ont réellement pas le statut (i.e., trouble) * e.g., avec l’EDC : proportion d’enfants obtenant un score inférieur à un score critère donné (ex., T = 59 et moins) parmi tous les enfants qui n’ont pas un TC

Answer 15

de la performance rétrospective d’un test

Answer 16

ils sont calculé à partir d'une classification de différents groupes diagnostiques (ou d’attributs autres) ○ On estime la proportion des individus dont le statut est connu en regard du trouble mesuré qui obtiennent un score au dessus ou au dessous d’un score critère - Ces indices sont déterminés par le score critère établi par les auteurs.trices du test - Si le score critère suggéré pour identifier le trouble est changé, les indices de sensibilité et de spécificité de l’échelle vont aussi changer

Answer 17

sur la capacité de classification d’une échelle ou d’un test lorsque ce dernier est utilisé avec des personnes dont le statut est connu

Answer 18

non, dans la pratique clinique, les tests sont utilisés avec des personnes dont le statut n’est pas connu (ou pas confirmé), par exemple pour le dépistage

Answer 19

Pour obtenir des indices probabilistes Pour déterminer le niveau de confiance qui peut être accordé à un résultat positif (ou un résultat négatif) pour un individu classifié ○ Autrement dit, pour savoir la probabilité qu’un individu présente réellement le trouble, étant donné un résultat positif à un test

Answer 20

La probabilité qu’un individu avec un résultat positif sur une échelle ait réellement le statut prédit ○ i.e., proportion d’individus ayant un trouble qui obtiennent un résultat positif, parmi tout ceux qui ont obtenu un résultat supérieur au score critère

Answer 21

La probabilité qu’un individu avec un résultat négatif sur une échelle n’ait réellement pas le statut prédit ○ i.e., proportion d’individus n’ayant pas de trouble qui obtiennent un résultat négatif, parmi tout ceux qui ont obtenu un résultat inférieur au score critère

Answer 22

- Les PPP et PPN sont des indices de performance extrinsèques d’un test et ils dépendent de la prévalence du trouble - Autrement dit, pour une sensibilité et spécificité données, les PPP et PPN vont varier selon la prévalence

Answer 23

- Sensibilité et spécificité sont des paramètres d’un test – ils sont seulement influencés par le score critère choisi (la prévalence est fixe, puisqu’elle est connue) - PPP et le PPN sont quant à eux des paramètres d’un test et de la prévalence du trouble

Answer 24

Lorsque la prévalence est faible, le PPN > PPP – et c’est l’inverse lorsque prévalence élevée

Answer 25

1. L’estimation de ces indices statistiques dépend de la validité et de la fidélité du critère utilisé (e.g., est-ce que les diagnostics du DSM sont suffisamment valides et fiables ?) 2. L’estimation de la prévalence réelle dans différents contextes cliniques peut être difficile - Néanmoins, des estimés imprécis (sans être grossièrement incorrects) n’ont pas un impact important sur les estimés du pouvoir prédictif pour les échelles qui ont une sensibilité et spécificité élevées (e.g., Griner et al., 1981)

Answer 26

- La validité est un préalable à la fidélité * À quoi sert de ne pas faire d’erreur de mesure si on ne sait pas ce qu’on mesure vraiment ? - La fidélité est une condition nécessaire à la validité * Est-ce qu’on mesure vraiment ce qu’on prétend mesurer si on fait beaucoup d’erreurs de mesure ? - Les deux sont interreliées empiriquement: les indices de validité sont directement influencés par le degré de fidélité * Quantité d’erreur influence la taille des corrélations; le nombre d’items aussi (Prophétie de Spearman)

Answer 27

pour une population particulière et/ou une utilisation particulière ○ Les scores d’un instrument peuvent être tout à fait valides et fiables pour une population et une utilisation particulière, mais pas du tout pour une autre population ou une autre utilisation

cours 5 : Validité Flashcards

(52 cards)