Examen 2 Flashcards

1
Q

Qu’est-ce qu’un test psychologique?

A

Une mesure objective, standardisée, valide et fidèle d’un échantillon de comportements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Sur quoi sont effectuées les observations?

A

Sur un échantillon restreint, mais soigneusement sélectionné, des comportements des individus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

De quoi dépend la valeur diagnostique (ou prédictive) d’un test ?

A

De la capacité que l’on a de représenter les comportements (capacité de formuler des items pour bien représenter les comportements)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que la standardisation?

A

L’uniformité de la démarche d’administration et de correction du test (principle général de contrôle rigoureux de la démarche pour toute l’observation scientifique) UNIFORMITÉ !!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les consignes détaillées pour une administration standardisée?

A

Matériel à utiliser, limites de temps, démonstrations préliminaires, façon de répondre aux questions des examinés, normes (préparation et lecture)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une mesure objective ?

A

Selon la conception d’aujourd’hui, pour être objectif, on doit déterminer le niveau de difficulté.
L’établissement du niveau de difficulté des items (croissant, du plus facile au plus difficile) s’appuie sur des démarches empiriques et objectives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelles sont les deux principales raisons justifiant le contrôle de l’utilisation des tests ?

A

Pour s’assurer que le test soit utilisé par un examinateur qualifié

Pour éviter que le public connaisse le contenu précis du test

(Des usages impropres peuvent invalider les résultats ou blesser des gens)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les éléments qui définissent un examinateur qualifié ?

A

Connaissance pour faire le choix du test à utiliser

Capable de faire une administration standardisée et une correction précise du test

Capable de faire l’interprétation des scores, selon ses connaissances approfondies du groupe utilisé pour établir les normes et ses connaissances des antécédents de l’examiné, son état physique et émotif et son degré d’accoutumance à une situation de testage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Sachant que des personnes différentes peuvent avoir un même score à un test pour des raisons fort différentes …

A

Même à un test objectif, comme en maths, elles peuvent avoir une même réponse mais sans avoir le même raisonnement, le même motif, parfois même à cause du hasard/chance. Si l’on peut faire une entrevue pour comprendre pourquoi, ok! Sinon, doit ajouter une « erreur ajoutée »

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les éléments importants dans l’administration des tests?

A

Préparation des examinateurs (lire et se familiariser avec le matériel, prévoir des situations d’urgence …)
Conditions de testage (consignes verbales, minutage, matériel, environnement de l’évaluation)
Présentation du test (climat interpersonnel car on doit faire des rapports, la motivation de l’examiné, est-il prêt)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelles sont les conditions de testage ?

A

Les consignes verbales, le minutage, le matériel, l’environnement de l’évaluation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce qu’un rapport 1 ?

A

Tout ce dont on va parler aux gens qui passent le test, de façon générale. Expliquer ce qui va se passer, ce à quoi ils vont répondre, leur demander comment ils vont … Le but étant de réduire l’anxiété

ON EN FAIT UN SEUL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’un rapport 2 ?

A

ON EN FAIT UN POUR CHACUN DES TESTS QU’ON VA FAIRE PASSER. Parler spécifiquement d’un test, expliquer quoi faire pour répondre à ce test spécifiquement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Si les personnes mémorisent les réponses à un test, est-ce qu’il continue d’être valide ?

A

Non, il devient moins valide, ce pourquoi il est important de protéger les tests et leur contenu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quels sont les concepts de base en mesure et en évaluation ?

A
La mesure et l'évaluation
Les échelles de mesure
La classification des échelles de mesure
La mesure et les statistiques
Les normes : scores et leur distribution
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La mesure est partout. Donne des exemples

A

Physique : Longueur, poids, masse …
Biologie : Rythme cardiaque, taux de métabolisme …
Économie : Taux de chomâge, produit national brut …
Loisir : Performance sportive, cote d’un film …
Éducation : Notes en maths, en français …
Psychologie : Intelligence, motivation, anxiété …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quel est le rôle de la mesure en psychologie ?

A

Définir certaines caractéristiques du comportement
Décrire/Prédire les différences de comportement
Prédire les changements de comportement
Expliquer le pourquoi de ces différences

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

De quoi dépend la qualité des descriptions et des prédictions ?

A

En partie, de la qualité de la mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelle est la définition générale de la mesure ?

A

Un ensemble de méthodes utilisées pour donner une description quantitative d’une caractéristique d’un phénomène

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quelle est la définition spécifique de la mesure ?

A

Une opération qui consiste à associer, selon certaines règles, des symboles (souvent numériques) à des objets, des évènements ou des individus, de façon à évaluer le degré auquel ils présentent certains attributs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce qui doit accompagner un symbole numérique pour qu’il soit représentatif ?

A

Une unité de mesure!
Pour une personne de 2m, on associe au 2 le mot mètre, qui est l’unité de mesure appliquée deux fois sur la longueur de la personne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Laquelle de la mesure des attributs physiques ou psychologiques soulève le plus de problèmes? Pourquoi ?

A

La mesure des attributs physiques (poids, taille, etc) ne soulève pas trop de problème, est beaucoup moins complexe
La mesure des attributs psychologiques est plus complexe, il y a beaucoup de variables à définir et à contrôler pour obtenir un résultat réaliste (valide et fidèle)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

En mesure, qu’est-ce qui doit être explicite ? Qu’est-ce que cela implique ?

A

Les procédés d’obtention d’une mesure. Cela implique qu’il existe des règles précises qui régissent le processus de mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce qui contribue à ce que des résultats obtenus soient reproductibles ?

A

La formulation rigoureuse des règles (qui régissent le processus de mesure).

Les gens ont le droit de faire la réplique de l’étude, en suivant la même logique car les processus doivent être rendus explicites

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Quelles sont les avantages de la mesure par rapport à l'évaluation subjective ?
La mesure permet une quantification, donne une description plus objective et est plus économique en temps et en argent qu'une évaluation subjective (ex entrevue) conçue pour donner des informations comparables (Si on veut obtenir des résultats différents, on ne peut alors pas les comparer ... )
26
Qu'est-ce que l'évaluation ?
Une opération qui consiste à porter un jugement de valeur, ou à accorder une valeur à un objet ou à une personne en la comparant avec un critère donné (2,14m est le résultat d'une mesure, une règle précise a été appliquée. Une personne de 2,14m est généralement évaluée comme étant TRÈS GRANDE)
27
Quelles informations doit-on connaître pour porter un jugement de valeur (évaluation) ?
L'unité de mesure et les limites du phénomène en question Il est fréquent qu'on les ignore, et il faut résoudre ce problème quand on évalue l'intelligence, les aptitudes, les intérêts d'une personne. Le score 128 ne révèle pas énormément sur la qualité (classification) de la personne, ni sur sa compétence. 128, dans le cas du QI, ce serait une personne intelligente car le QI moyen est de 100. 128 de maturité, on ne pourrait pas dire, car on connait plus ou moins les limites du phénomène
28
Qu'est-ce qui nous permet de connaitre les limites d'un phénomène ?
Avoir une moyenne .. Ajouter des écarts-types à cette moyenne, on connaît déjà un peu mieux. D'autres mesures, comme le minimum et le maximum
29
Plusieurs auteurs s'entendent pour reconnaître un des postulats de la mesure, proposé par Stanley Smith Stevens (Postulat très important en psychométrie). Quel est-il ?
Les quatre principaux niveaux de mesure correspondent à quatre types fondamentaux d'échelles de mesure: Nominale, Ordinale, d'Intervalle égal et de Proportion
30
Quelles sont les caractéristiques de l'échelle nominale ?
De classe ou catégorielle C'est la forme la plus simple de classification (Niveau primaire) Elle permet de regrouper les individus en fonction des caractéristiques communes Il n'y a pas d'ordre inhérent à la mesure Il suffit de préciser les critères utilisés pour juger de l'inclusion d'un individu dans une classe ou dans une catégorie La rigueur de la discrimination dépend de la capacité d'observation de l'évaluateur Son utilisation est limitée aux sciences humaines, car elle ne fournit pas d'indications sur l'amplitude des attributs Elle permet de classer les sujets dans des catégories qui sont exclusives. Chaque observation se trouve dans une catégorie, et UNE SEULE. On l'utilise quand on peut dire qu'un individu appartient à une catégorie, qu'un autre individu appartient à une autre catégorie, mais qu'on ne peut pas dire que l'un est plus que l'autre, du point de vue de la variable mesurée C'est une échelle non ordonnée et non ordonnable AUCUNE OPÉRATION ARITHMÉTIQUE PERMISE Les statistiques possibles : Fréquences et pourcentages EX : Sexe, couleur des yeux, lieu de naissance, etc ...
31
À quoi est limitée l'utilisation de l'échelle nominale, et pourquoi ?
Aux sciences humaines, car elle ne fournit pas d'indications sur l'amplitude des attributs
32
Quand utilise-t-on l'échelle nominale ?
Quand on peut dire qu'un individu appartient à une catégorie et un autre individu à une autre catégorie, mais qu'on ne peut pas dire que l'un est plus que l'autre, du point de vue de la variable mesurée
33
Quelle est l'erreur qui se perpétue par rapport à l'échelle nominale et le fait qu'aucune opération arithmétique n'est permise ?
Les gens mettent parfois le sexe dans un modèle de régression, mais ON NE PEUT PAS !! La seule chose qu'on peut faire, c'est un modèle de régression pour les hommes, un pour les femmes, et calculer l'invariance !! (Va dire si la variabilité d'un modèle est semblable ou différente de l'autre ... mais il n'y a pas de pourcentage de variation prédite)
34
Quelles sont les caractéristiques de l'échelle ordinale ?
Il doit y avoir un ordre inhérent !! L'ordre relatif des individus est important. Les symboles numériques attribués aux individus sont des rangs Pas de garantie que la différence entre 1 et 2 soit la même que entre 4 et 5 Elle ne permet pas de savoir s'il y a absence totale de l'attribut, alors elle n'admet pas le zéro absolu On ne peut pas dire combien de fois plus que ... La relation entre les observations est transitive (Si A>B et B>C alors A>C) 4 veut pas forcément dire 2x2 Par convention, on pouvait calculer une moyenne d'une échelle ordinale (Likert, seulement) mais plus les années passent, plus cette convention devient faible et cible de fortes critiques Ex: Échelle de satisfaction à un cours (type Likert), poste de l'armée, poste dans une entreprise, etc.
35
Comment l'échelle ordinale pourrait-elle donner des résultats plus complets ?
S'il était possible de connaître la distance qui sépare les objets ou les individus en fonction de l'attribut mesuré.
36
Qu'est-ce qu'une échelle à intervalles égaux (ou simplement échelle d'intervalles) ?
Si plusieurs objets ou individus sont également distants (égalité des intervalles) selon le degré auquel ils présentent l'attribut, la distance qui les sépare peut être considérée comme une unité linéaire de mesure, et l'échelle ainsi constituée est appelée échelle à intervalles Si également distant, on connait la distance, intervalle
37
Quand connait-on nécessairement la différence entre les items ?
Quand ça donne une ligne droite à 45° dans un graphique, il y a une augmentation linéaire de la mesure, on connait nécessairement la différence
38
Sommes-nous capables de mesurer l'intelligence ?
Non, nous sommes incapables de mesurer l'intelligence en tant que telle. Ce que nous mesurons, ce sont les manifestations de l'intelligence ... et les psychologues ne s'entendent même pas sur la façon de faire, utilisent parfois des tests différents Nous sommes aussi incapables de mesurer l'absence d'intelligence, car on ne sait même pas encore exactement ce qu'est l'intelligence
39
Quelles sont les caractéristiques d'une échelle à intervalles ?
C'est une échelle numérique. Elle permet la mesure des différences entre les degrés de présence des attributs, mais n'indique pas l'amplitude absolue de ces degrés, car elle n'admet pas le zéro absolu. Le point zéro est défini de façon arbitraire 0 ne veut pas dire absence du phénomène. EXCEPTION de la température en Kelvin, 0 Kelvin c'est une absence de température, un zéro absolu. Se calcule pas avec l'échelle à intervalles Cette échelle numérique peut être transformée en échelle ordinale, mais pas l'inverse. C'est une échelle quantitative, alors que la nominale et l'ordinale sont qualitatives Ex : Température (SAUF KELVIN), localisation (latitude et longitude), heure de la journée ...
40
Quelles sont les caractéristiques d'une échelle de proportions (de ratio) ?
Pareil comme intervalles, mais accepte le zéro absolu Sa première caractéristiques réside dans la probabilitéde connaître la distance entre le zéro absolu et la position 1 d'un objet ou d'un individu sur un continuum défini selon un attribut donné (Les nombres représentent donc de façon réelle le degré de présence d'un phénomène chez un individu) On peut aussi établir que l'individu 2 présente le double du degré de l'attribut présenté par l'individu 1 De plus, comme pour les échelles moins complexes, la direction du continuum est connue, de même que le rang des individus en fonction de l'attribut et de l'étendue des intervalles entre les scores, intervalles évidemment égaux EX : Âge, nombre d'enfants, etc.
41
La classification des échelles de mesure serait plutôt ...
Une affaire de convention et d'utilité
42
Complète la phrase : Par convention et utilité, les techniques puissantes d'analyses statistiques ...
sont compatibles avec les données relatives aux attributs humains (incluant les attributs psychologiques)
43
Quel est le « problème » des conventions ?
Les gens très rigoureux ne les acceptent pas toujours forcément ... mais il y en a qui les appliquent. Par exemple, on ne peut pas utiliser la moyenne dans une échelle Likert, mais il y en a qui le font
44
À quoi doit-on recourir en psychométrie ?
À un échantillon d'individus, et un échantillon de contenu (items du test)
45
Qu'est-ce que le problème d'échantillonnage ?
On a un échantillon d'individus et un de contenu. Il est virtuellement impossible de tenir compte simultanément, dans les analyses statistiques, de ces deux dimensions du problème d'échantillonnage Aucune formule statistique ne va gérer, être capable de traiter, deux échantillons de nature différente (ex. 98 personnes et 60 contenus d'items) Pour deux échantillons de même nature, ex deux groupes de personnes, certaines formules vont pouvoir le faire par contre
46
Quelle est la façon typique de régler le problème d'échantillonnage ?
On va tenir compte explicitement d'une des deux dimensions, par convention l'échantillon de contenu (en gardant à l'esprit que l'autre dimension peut éventuellement influencer les résultats)
47
Quelle est l'approche préconisée en psychométrie, lors de l'élaboration d'un instrument de mesure ?
On utilise un échantillon d'individus suffisamment grand pour que l'erreur d'échantillonnage se rapportant aux individus soit peu importante. Cela règle le problème de représentativité de l'échantillon d'individus La représentativité de l'échantillon de contenu devient alors la préoccupation centrale
48
Qu'est-ce que l'erreur d'échantillonnage (des personnes) ?
La différence entre le résultat obtenu avec les individus de notre échantillon, et celui obtenu avec la population On ne connait pas cette erreur, car on ne connait pas le résultat de la population ...
49
Comment minimiser l'erreur d'échantillonnage ?
THÉORIE DES GRANDS NOMBRES !! On doit trouver le plus de personnes possibles, car avec beaucoup de personnes, on se rapproche plus de la réalité de la population, minimisant ainsi l'erreur d'échantillonnage
50
De quoi dépend la précision d'un test ?
Pour autant que l'échantillon des sujets soit suffisamment grand, la précision d'un test sera indépendante du nombre de sujets de l'échantillon, et sera directement reliée au contenu du test, c'est-à-dire au nombre d'items
51
Comment sont généralement interprétés les scores des tests psychologiques ?
En se référant à des normes qui représentent la performance au test d'un échantillon de normalisation Il suffit de situer le score brut de tout individu à l'intérieur de la distribution de scores des membres de l'échantillon de normalisation, de façon à préciser sa position relative au sein de ce groupe - Le score coïncide-t-il avec la moyenne ? - Est-il légèrement inférieur ? - Est-il situé près de l'extrémité supérieure de la distribution?
52
Comment établi-t-on les normes ?
De façon empirique, en observant dans quelle mesure les membres d'un groupe représentatitf répondent effectivement au test en question. C'est fait à partir d'un échantillon de normalisation (ou normatif)
53
Pourquoi un score brut doit-il parfois être transformé en une mesure relative (score dérivé) ?
Dans le but d'établir de façon plus précise la position exacte d'une personne à l'intérieur de l'échantillon normatif
54
Quelles sont les deux fonctions remplies par les mesures relatives (scores dérivés) ?
1. Ils déterminent la position relative de l'individu à l'intérieur de l'échantillon normatif et permettent de comparer sa performance à celle d'autres personnes 2. Ils permettent de comparer directement la performance d'une même personne à différents tests
55
Quel est l'un des principaux objectifs de la méthode statistique ?
Organiser et systématiser des données quantitatives de façon à en faciliter l'interprétation
56
Quelle est la première étape de mise en ordre des données brutes ?
Elle consiste à regrouper ces scores sous forme d'une distribution de fréquences
57
Que faut-il pour qu'une distribution soit normale ?
Elle doit être symétrique, mésokurtique, avoir une moyenne, une médiane et un mode dont les valeurs sont à peu près similaires
58
Que doit-on calculer pour voir si une distribution est normale ou pas ?
Des comparaisons de fréquences. Le KS si on a plus de 50 personnes, le SW pour 50 et moins Lilliefors dit que si on fait la comparaison des fréquences, tel que le test KS, on peut comparer des fréquences qui sont similaires à la distribution normale. On compare nos fréquences, de nos données, avec les fréquences théoriques de la courbe normale (68% entre -1 et +1 ÉT, 95% entre -2 et 2 ÉT, 99% entre -3 et 3 ÉT) On veut que p > 0,05 donc pas de différence statistiquement significative, on veut que ce soit pareil, que ce soit normal
59
L'information fournie par une distribution de fréquences peut être représentée graphiquement sous la forme d'une courbe. Qu'a-t-elle de particulier ?
Elle possède des propriétés importantes et sert de base à plusieurs sortes d'analyses. Elle indique que la majorité des sujets se regroupent autour de la partie centrale de l'étendue, et que leur nombre diminue progressivement de chaque côté
60
Quelles sont les mesures pour déterminer si une courbe est normale ?
La symétrie (si on trace une ligne imaginaire au centre de la courbe, on peut voir si la 1ere moitié ressemble à la 2eme). On la calcule en divisant la symétrie par l'erreur type de la symétrie. Le score obtenu doit être entre -1,96 et 1,96 pour être symétrique L'aplatissement, calculé en divisant l'aplatissement par l'erreur type de l'applatissement, doit donner un score entre -1,96 et 1,96 .... 1,59 étant mésokurtique
61
Quels sont les trois types d'aplatissement ?
Platykurtique, mésokurtique, leptokurtique
62
À l'aide de quels types de mesures peut-on décrire un groupe de scores ?
- Tendances centrales (Moyenne, médiane, mode, etc) - Variabilité (Étendue, Écart-Type, etc) - Distribution (Normale = Symétrique + aplatissement modéré) Si on utilise des scores Z, on doit faire une transformation linéaire pour pouvoir comparer
63
Que peut-on dire sur l'interprétation de l'écart-type ?
Qu'elle est particulièrement claire lorsqu'elle s'applique à une distribution normale (ou quasi normale) Dans ce type de distribution, il existe une relation directe entre l'ÉT et le pourcentage de sujets Ces relations sont particulièrement pertinentes lors de l'interprétation des centiles
64
Que permettent les normes intragroupes ?
Presque tous les tests psychométriques sont maintenant accompagnés d'une forme quelconque de norme intragroupe Elles permettent de situer la performance d'un individu en fonction de celle du groupe normatif (même âge/même niveau scolaire, etc) Le score Z est une forme de notre intragroupe
65
Qu'est-ce qu'un centile ?
Un centile correspond au pourcentage des personnes de l'échantillon de normalisation dont le score est inférieur à un score brut donné (Exemple, si 28% des personnes réussissent 15 problèmes dans un test de raisonnement mathématique, un score brut de 15 correspondra ainsi au 28e centile) Ainsi, plus le centile est bas, plus le score de l'individu est faible
66
Que sont les centiles 0 et 100 et quelle est leur particularité ?
Un score brut inférieur à tout autre score obtenu dans l'échantillon de normalisation recevra un centile de 0. Un score brut plus élevé que tout autre score de l'échantillon de normalisation recevra le centile 100 ATTENTION !! Ces centiles ne représentent pas forcément un score brut de zéro ou un score brut parfait !! Les gens ne sont pas tous d'accord pour utiliser ça. Ils vont dire qu'il est toujours possible de trouver un score plus petit ou plus grand. Certains chercheurs l'acceptent, d'autres pas ... Aussi, centile 0 ne veut pas dire absence de centile, amène une certaine confusion ... Donc souvent va dire <1 ou >99
67
Quels sont les avantages des centiles ?
Ils sont ... - Faciles à calculer - Facilement compris - Universellement applicable (enfants et adultes) - Conviennent à tous les types de test (d'aptitudes ou de personnalité)
68
Quel est l'inconvénient des centiles ?
L'inégalité des distances entre les unités. La distance entre les centiles n'est pas la même, on ne peut pas dire que 2+2 = 4 Donc, c'est une mesure ordinale, qualitative
69
À quoi peut-on comparer les centiles ?
Aux écart-types (C2 = -2 ÉT ... C98 = 2 ÉT)
70
Qu'est-ce qu'on score standard (cote/score Z) ?
Une mesure quantitative, une norme, et tout comme les ÉT, la distance est la même entre les scores Ils sont de plus en plus utilisés dans les tests. Ces scores dérivés s'avèrent satisfaisants dans le sens de faciliter des calculs subséquents
71
D'où proviennent les scores standards ?
D'une distribution transformée pour l'ajuster à une courbe normale (Moyenne de 0 et ÉT de 1)
72
Qu'indique un score standard normalisé de 0 ? Un score de -1 ? Un score de +1 ?
Que l'examiné se situe au niveau de la moyenne d'une courbe normale, surpassant ainsi 50% du groupe. Un score de -1 indique qu'il surpasse 16% du groupe Un score de +1 signifie qu'il surpasse 84% du groupe (Ces pourcentages correspondent à des distances de 1 ÉT au-dessus et au-dessous de la moyenne)
73
Quel est l'objectif du QI ?
Convertir les âges mentaux (AM) en un indice uniforme de la position relative d'une personne au sein d'un groupe de référence Des problèmes techniques (même ÉT pour tous les âges) et sociaux ont ralenti son utilisation
74
Comment calculer le QI ?
Diviser l'âge mental (AM) par l'âge chronologique (AC) puis multiplier par 100 pour éliminer les décimales
75
Quel lien existe-t-il entre les normes ?
Un QI avec un ÉT de 15, devient la même mesure que le score Z, qui est la même que l'ÉT ... les distances sont toutes les mêmes !!
76
À quoi réfère le concept de fiabilité ?
À la reproductibilité des scores obtenus par les mêmes personnes ... - Lorsqu'on leur administre un même test à des occasions différentes - Lorsqu'on leur administre des ensembles différents d'items équivalents
77
Qu'est-ce que la fidélité d'un test permet de déterminer ?
Elle permet de déterminer dans quelle mesure les différences individuelles dans les scores aux tests peuvent être attribuées à des « réelles » différences sur le plan des caractéristiques mesurées (variance réelle) et dans quelle mesure elles doivent être attribuées à des erreurs dues au hasard (variance d'erreur)
78
Qu'est-ce que la variante d'erreur ?
Essentiellement, toute condition non pertinente à l'objectif d'un test représente de la variance d'erreur On ne peut pas la contrôler Elle peut aussi être due aux propriétés du test
79
Comment les examinateurs s'efforcent-ils de maintenir les conditions de testage uniformes ?
En contrôlant l'environnement du testage, les consignes, les limites de temps, le climat interpersonnel avec les sujets, et bien d'autres facteurs
80
Pourquoi les examinateurs s'efforcent-ils de maintenir les conditions de testage uniformes ?
Pour réduire l'erreur de mesure, et ainsi rendre plus fidèles les scores aux tests
81
De quoi tout test devrait être accompagné ? Et pourquoi ?
D'un rapport sur son degré de fidélité (un manuel) | Car aucun test n'est parfaitement fidèle
82
Le degré de fidélité caractérise bien le test sous quelle réserve ?
Sous réserve qu'il soit administré dans les mêmes conditions standardisées et à des personnes similaires à celles qui composent l'échantillon normatif (Les caractéristiques de l'échantillon devraient être précisées, de même que le type de fidélité)
83
Quelle forme les types de fidélité peuvent-ils prendre, et pourquoi ?
Comme ils ont pour objet un degré d'association entre deux séries indépendantes de scores à un test, ils peuvent tous prendre la forme d'un type de coefficient de corrélation
84
Que fait un coefficient de corrélation ?
Il exprime le degré de correspondance (ou relation) entre deux séries de scores
85
Quels sont les différents coefficients de corrélation?
``` r = Pearson rho = Spearman rpar = Partielle rt = tetrachorique rpo = polychorique R = multiple ``` Les r sont bivariées, donc deux variables, deux passations R est multivariées, + que deux variables r² = variance ... x 100 = pourcentage de variation, pourrait dire combien une chose a varié
86
Quel est le rationnel d'un coefficient de corrélation ?
Si le sujet qui obtient le meilleur score pour la variable 1 obtient aussi le meilleur score pour la variable 2, que le sujet en deuxième position pour la variable 1 l'est aussi pour la variable 2 et ainsi de suite jusqu'au sujet le plus faible, on observerait une corrélation parfaite (+1,00) entre les variables 1 et 2 Il est très rare que les corrélations sont parfaites. 0,80 ou 0,90 selon les auteurs, c'est considéré énormément élevé
87
Qu'est-ce qu'un problème de colinéarité dans nos données ?
Quand une variable influence beaucoup l'autre de façon non voulue, si cette variation n'est pas voulue, on a ce problème
88
Qu'indique une corrélation de 0 ?
L'absence complète de relation, ce qui produirait le hasard. Si on tire au hasard les sujets pour déterminer leur position sur la variable 1 et même chose pour la variable 2, il en résulterait une corrélation zéro (ou presque) Dans de telles conditions, il est tout à fait impossible de prédire le résultat d'une personne sur la variable 2, à partir de notre connaissance de son score sur la variable 1 0,003 ce n'est pas zéro !! Donc avec une corrélation de zéro ou presque zéro, on est en train de reproduire le hasard, on ne peut pas prédire !! Mauvais, car en psychométrie, on veut des corrélations très fortes car on VEUT PRÉDIRE !!
89
Que voulons-nous dire lorsque nous affirmons qu'une corrélation est statistiquement significative au seuil de 0,05 (ou p < 0,05 ou 5%) ?
On veut dire que les chances ne sont pas supérieures à 5 sur 100 que la corrélation dans la population soit zéro (ou proche de zéro)
90
Quel est l'impact du N sur une corrélation ?
Il est fondamental !! Très important !! Il influence les résultats des corrélations Il est difficile d'établir une relation générale de façon relativement certaine avec un échantillon de seulement 10 sujets. Avec un échantillon de 10 sujets, la plus petite corrélation significative au seul de 5% serait de 0,63. Tout indice de corrélation inférieur à cette valeur laisse sans réponse la question de savoir si les deux variables sont statistiquement corrélées dans la population dont fut tiré l'échantillon Plus on a de personnes, moins la corrélation a besoin d'être forte pour être significative
91
Quels sont des exemples de corrélations significatives en fonction du N ?
Avec 104 sujets, toute corrélation égale ou supérieure à 0,25 serait statistiquement significative Avec 800 sujets, une corrélation de 0,08 serait statistiquement significative ... Donc avec un N très gros, toute corrélation pourrait être significative ... Il faut faire des compris, ne cacher aucune info, on doit tout dire !
92
Quel est le problème lorsqu'une corrélation significative est obtenue avec un trop gros N ?
Le coefficient de corrélation obtenu pourrait être inférieur (parfois de beaucoup) à ce que l'on considère désirable pour un coefficient de fidélité (au-dessus de 0,80 ou même 0,90) La corrélation prend ici une forme de coefficient de fidélité. 0,80 x 0,80 = 0,64 x 100 = 64% ce qui dépasse la chance, qui est 50% ... mais a quand même 36% d'erreur !! Donc, 0,80 est le minimum !! Mais pas convention, on va accepter 0,70 ... On doit d'ailleurs dire quelle est notre convention
93
Quels sont les types de fidélité ?
- Fidélité par test-retest (stabilité) - Fidélité par versions parallèles (équivalence) - Fidélité par bissection (cohérence interne) - Fidélité de Kuder-Richardson (KR20) et coefficient Alpha (Alpha de Cronbach) (Homogénéité) - Fidélité intercorrecteurs (équivalence interjuges)
94
Qu'est-ce que la fidélité test-retest ? (Stabilité temporelle)
On ré-administre un même test aux mêmes sujets. Le coefficient de fidélité (rtr) équivaut tout simplement à la corrélation entre les scores obtenus par les mêmes personnes aux deux passations La variance d'erreur correspond aux fluctuations aléatoires des performances d'une séance de testage à l'autre
95
Qu'indique la fidélité test-retest ?
Dans quelle mesure il est possible de généraliser, à des occasions diverses, les scores d'un test Plus elle est élevée, moins les scores sont influencés par des changements quotidients imprévisibles (ces changements imprévisibles = variance d'erreur)
96
Que doit-on spécifier quand on inclu ce type de fidélité dans le manuel d'un test, et pourquoi ?
L'intervalle de temps entre les deux passations, étant donné que les corrélations test-retest diminuent progressivement à mesure que s'accroit l'intervalle de temps (Par convention, cet intervalle est par multiples de 3)
97
Quelles sont les difficultés soulevées par la technique du test-retest ?
- L'effet de pratique peut augmenter les scores au retest | - Si l'intervalle est court, les sujets peuvent se rappeler de leurs réponses (effet de la mémoire)
98
Qu'est-ce que la fidélité par versions parallèles ? (Équivalence)
- Un moyen pour contourner les difficultés soulevées par le test-retest. (Ici le temps n'a pas d'importance, car ce n'est pas le même test) - Les individus peuvent ainsi passer une version lors de la première séance de testage et une autre version (parallèle ou équivalente) lors de la seconde séance - La corrélation obtenue entre les deux séries de scores deviendra le coefficient de fidélité - On remarque qu'un tel coefficient mesure, simultanément, la stabilité et la similitude des réponses à des échantillons d'items différents (il combine donc deux types de fidélité)
99
Quelles précautions doit-on prendre pour assurer un véritable parallélisme, lors de la rédaction de versions parallèles ?
- Contenir le même nombre d'items, avoir la même forme, couvrir le même type de contenu - L'étendue des difficultés et le niveau de difficulté moyen devraient être les mêmes - Il faut assurer l'équivalence des consignes, du minutage, des exemples, du format de présentation, bref de tous les aspects du cadre de passation du test
100
À quelles autres fins les versions parallèles peuvent-elles servir ?
- Pour étudier l'impact d'une variable intermédiaire | - Permet de réduire l'impact du monitorat et de la tricherie
101
Quelle faiblesse la fidélité par versions parallèles soulève-t-elle ?
Il est bien probable que les sujets différeront quant à leur degré d'amélioration due à la pratique (n'auront pas les mêmes occasions de se pratiquer, ne seront pas également motivés à repasser le test, etc) ce qui implique une autre forme de variance d'erreur, qui tend à réduire la corrélation entre les deux versions
102
Qu'est-ce que la fidélité par bissection ? (Cohérence interne)
- Même avec une seule administration d'une seule version d'un test, il est possible d'obtenir une mesure de fidélité à l'aide de la méthode de bissection (split-half) - Diviser le test en deux parties équivalentes (ce qui permet de calculer deux scores pour chaque examiné). Étant donné que l'unique passation n'implique qu'une seule version d'un test, le coefficient de fidélité obtenu porte le nom d'INDICE DE COHÉRENCE INTERNE - Il faut décider comment diviser le test en deux (de manière à ce que les deux moitiés soient aussi équivalentes que possible) - Lorsque tous les sujets ont reçu leurs deux demi-scores, ces derniers peuvent être mis en corrélation par la technique usuelle (corrélation)
103
Quelle serait une critique de la technique par bissection ?
Cette corrélation n'indique que la fidélité d'un demi-test. En effet, dans le cas d'un test de 100 items, la corrélation sera calculée entre les deux séries de scores qui comptent chacune 50 items. (Alors que dans le cas des fidélités test-retest et versions parallèles, tous les items du test contribuent au calcul de chacun des scores)
104
Que permet la formule de « Spearman-Brown » ?
D'estimer l'impact que le raccourcissement d'un test aurait sur son coefficient de cohérence interne
105
Quelle est la faiblesse de la fidélité par bissection ?
Parce qu'il n'y a qu'une seule passation, ce type de fidélité ne tient aucunement compte de la stabilité temporelle des scores. (Il y a donc toujours un problème avec chaque type, ce pourquoi souvent les gens vont en utiliser 2-3)
106
Qu'est-ce que la fidélité de Kuder-Richardson et Coefficient Alpha ? (Homogénéité)
Une seule passation d'une seule version d'un test. Cette fidélité a pour fondement l'homogénéité entre les réponses de tous les items du test Cette homogénéité interitems est sensible à une source de variance d'erreur = le degré d'hétérohénéité du domaine des contenus échantillonnés (plus le domaine est homogène, plus la cohérence interitems est élevée) EX = Si un test ne contient que des problèmes de multiplication alors que l'autre contient des problèmes d'additions, soustractions, multiplications et divisions, il est fort probable que le premier manifestera une plus forte cohérence interitems Leur première formule qui a marché c'était la KR20. Elle était utilisée pour des questions dichotomiques. Puis Cronbach l'a reprise et ajoutée à la sienne et cela a donné l'Alpha de Cronbach qui fait les deux, dichotomique et Likert Formule KR s'applique aux items du système « tout ou rien » Formule Alpha s'applique aux items selon une échelle de type Likert
107
Que s'est-il passé depuis les années 1980 (avec la popularisation des ordinateurs et des logiciels statistiques) ?
Le coefficient alpha a remplacé le KR dans presque toutes les situations. Jusqu'aux années 2012 il était le coefficient de fidélité par excellence. De nos jours, on vit un moment historique important. Le coefficient Omega prend une place de plus en plus importante dans les articles scientifiques en psychologie, à cause des certaines difficultés associés aux calculs Alpha
108
Quelles difficultés de l'Alpha, Macdonald a-t-il essayé de contourner et comment ?
Remplacer l'alpha (qui est influencé par le N, qui maximise l'effet du N) avec l'Omega, qui minimise l'effet du N Avec de gros gros échantillons, l'Omega est mieux que l'Alpha (ou avec beaucoup d'items, car l'Alpha serait immense) Beaucoup de revues vont demander les deux
109
Qu'est-ce que la fidélité par intercorrecteurs (équivalence interjuges)
- Les grilles de correction de certains types de tests, tout spécialement les tests de personnalité de type projectif, accordent un rôle important au jugement du correcteur. Dans le cas de ces tests, il devient nécessaire d'évaluer la fidélité intercorrecteurs - On peut l'évaluer en faisant corriger un test (le Rorschach par exemple) par au moins deux examinateurs. Les deux scores (ou plus) qu'obtiendront ainsi les sujets seront alors mis en corrélation de façon usuelle. Le coefficient obtenu indiquera la fidélité dans toutes les études qui font appel à des instruments à correction subjective On devrait retrouver de tels coefficients dans les manuels de tous les tests
110
Qu'est-ce que le Kappa de Cohen ?
Un genre de mesure de corrélation, de mesure d'association. On mesure le niveau de concordance entre l'avis des correcteurs. Il varie entre -1 et 1 (mais on dit souvent entre 0 et 1, car si deux personnes connaissent bien quelque chose, ce devrait être positif) SPSS le fait pour 2, pour 3, 4, 5 on le fait à la main, pas plus que 5 sinon on augmente trop la variabilité. Le nombre idéal serait de 3 à 5 (l'exception étant 2, on va faire avec) Si on augmente trop la variabilité, on augmente artificiellement la corrélation, donc le coefficient de fidélité est élevé mais artificiel
111
Qu'est-ce qu'un pur test de vitesse ?
Dans un pur test de vitesse, la rapidité de la performance explique les différences individuelles observées. On prépare ce type de test avec des items qui sont tous faciles et qui font partie des habiletés maîtrisées par les sujets. On fixe une limite de temps si courte que la perosnne ne peut pas compléter tous les items. Dans de telles conditions, le score de chaque personne reflète exclusivement son rythme (ou sa vitesse) de travail Veut mesurer la VITESSE. La variance va être la différence en terme de vitesse entre les gens, certains vont faire 40, 55, 70 questions ... Si on leur laissait le temps de finir, on ne verrait pas la variabilité entre les gens
112
Qu'est-ce qu'un pur test de puissance ?
Un pur test de puissance offre une limite de temps suffisamment longue pour que tous puissent tenter de répondre à chacun des items. Ceux-ci sont cependant ordonnés selon une échelle de difficulté qui augmente très rapidement jusqu'à des items à peu près insoluble. Ainsi, personne ou presque ne peut obtenir un score parfait. Le test d'intelligence est un exemple de test de puissance. On laisse le temps de le finir, mais les questions ne sont pas faciles
113
Quelle est la précaution prise avec les tests de vitesse ET de puissance ?
Ils sont tous les deux conçus pour empêcher une réussite parfaite. Cela s'explique par le fait qu'un score parfait est indéterminé, en ce sens qu'il est impossible de savoir quel score plus élevé le sujet aurait atteint si le test avait contenu plus d'items ou des items plus difficiles
114
Quelle est la différence entre l'Écart-Type et l'Erreur Type de Mesure ?
``` ÉT = Variabilité inter-personnes ETM = Variabilité intra-personne ``` Une personne qui répond 100 fois à un même test, c'est l'erreur type de mesure 100 personnes qui répondent à un test, c'est l'ÉT