Les concepts et méthdologies vu en TD Flashcards

1
Q

Les indispensables pour construire une histogramme

A

Le titre doit être le plus clair et complet que possible. S’il y a des indications des caractéristiques des sujets, il faut les mentionner.

En ordonnée, on décrit l’effectif du nombre des sujets.

En abscisse le nom du test et si possible spécifier l’échelle de mesure. Il peut avoir un minimum et maximum théorique mais cela n’est pas obligatoires.

Si les valeurs peuvent continuer, on met des flèches.

Au niveau des l’aspect du graphique, on préfère des bâtons (stapeldiagram) et les ordonner à l’origine du 0.

Dans l’ordonnée, si on a une échelle likert, on devrait dire ici que, par ex. “1 = faible ; 7 = forte” en mentionnant bien sûr quoi qu’on mesure.

Investiguer la présence des effets:

  • Effet planché : notes plutôt basses, courbe asymétrique à droite, test trop difficile
  • Effet plafond : notes plutôt hautes, courbe asymétrique à gauche, test trop simple
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Les indispensables pour construire une diagramme de corrélation

A

Donner un titre le plus exhaustif au diagramme.

Si tous les scores ne sont pas représentés, on met des flèches.

S’il y a plusieurs participants au même endroit, on met un point plus gros.

On essaye de faire un diagramme carré, pour que le nuage ne soit pas déformé.

Répondre aux questions :

  • Est le nuage positif (ascendant) ou négatif (descendant)?
  • Est le nuage plus diffus (corrélation plutôt faible) ou plus compacte (corrélation plutôt forte)?

Savoir que les axes sont interchangeables, car une corrélation est une relation non causale entre deux VD. La corrélation est l’ordre de classement des participants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les deux caractéristiques d’un test psychologique?

A

La standardisation et l’étalonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est ce que le test psychologique?

A

Le test psychologique est un dispositif d’évaluation permettant de mesurer les caractéristiques des individus en comparant leurs scores avec une population de référence. C’est un instrument de mesurer, une observation de comportements qui a deux caractéristiques primaire : la standardisation et l’étalonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La standardisation

Définition de standardisation

A

Elle réponde à la question “Le test est-il objectif ?”

La standardisation permet de rendre les évaluations et leurs interprétations objectives. Comme ça, on peut interpréter les résultats entre les individus en évitant des biais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels aspects faut-il standardiser ?

A

La consigne : Standardiser les consignes permet d’éviter qu’un passant soit surpris dans un test.

Les conditions de passation : On cherche à assurer qu’un test se passe dans un cadre similaire à chaque fois qu’il est passé

Le matériel : On doit avoir les mêmes matériels, qui sont présentés dans la même ordre pour tous les participants et fourni dans en bon état

La cotation : Tous les évaluateurs sont censés donner un score identique au même test. Il est important alors d’avoir des cotations bien définies. Il faut seulement interpréter les résultats dans un test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

L’étalonnage

Définition d’étalonnage

A

Il réponde à la question “Le test permet-il de situer une note parmi un ensemble de notes?”.

La note brute ne prend sens que lorsqu’elle est comparé à une population de référence. Cela va donner une indication sur la performance d’un individu. L’étalonnage permet donc d’attribuer un rang aux participants. Étalonner une distribution consiste à diviser la distribution en classes.

Alors, l’étalonnage est une action de situer une note parmi un ensemble de notes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Les deux grand types d’étalonnage

A

Le quantilage : Il est fait de façon à avoir X catégories contenant le même effectif. Il permet de bien discriminer les sujets moyens (qui se trouvent au milieu de la distribution). En revanche, il permet moins bien de discriminer les participants aux extrémités.

L’étalonnage normalisé : Il est fait de façon à reproduire X catégories respectant la loi normale (= beaucoup de sujets au milieu de la distribution et peu aux extrémités). L’étalonnage normalisé permet de bien discriminer les participants aux extrémités, mais, il permet de moins bien discriminer les personnes au milieu. Un distribution normale est symétrique autour de la moyenne qui est égale à la mode et à la médiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

La sensibilité

Définition de sensibilité

A

Elle réponde à la question “Le test est-il discriminant?” et désigne la capacité d’un test à différencier finement les individus les un entre les autres dans une population définie. Un test n’est pas informatif si tous les participants ont la même note. La distribution est gaussienne si les scores observés sont similaires aux scores théoriques.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Les deux types de sensibilité

A

La sensibilité des items : Un item est parfaitement discriminant lorsqu’il y a 50% de bonnes réponses. Cela permet de parfaitement distinguer ceux qui réussissent à répondre à un item et ceux qui ne réussissent pas. Un item est dit sensible lorsqu’il se trouve dans un intervalle de 30 à 70% de bonnes réponses.

La sensibilité du test : On dit qu’un test sensible lorsque cinq points sont réunis :

  1. Il y a une distribution symétrique des scores.
  2. Les indices de centralité (moyenne, mode, médiane) doivent être proches entre eux.
  3. Les indices de centralité observés doivent être proches des indices de centralité théoriques.
  4. L’étendue observée doit être proche de l’étendue théorique.
  5. L’écart-type observé doit être supérieur à l’écart-type théorique.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La fidélité

A

La fidélité répond à la question “Le test est-il reproductible ?”. La fidélité s’intéresse à la reproductibilité du score. Il s’agit de la précision des mesures. L’objectif sera d’obtenir un score qui va être au plus près du score vrai de la personne qui répond.

En psychologie, tous les scores que l’on observe sont une _estimation du score vrai. En effet, aucun concept n’est directement observable. Par conséquent, on va systématiquement l’inférer à partir de comportements observables. Il s’agit du processus d’oppérationnalisation du concept. La différence ∆ entre le score vrai et le score observé sera appelée erreur de mesure.

Il y a quatre façons d’estimer la fidélité, qui reposent toutes sur la notion de corrélation. Une forte correlation indique une note vraie plus significante et que le test est fiable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Les quatres façons d’estimer la fidélité

A

La FIDÉLITÉ TEST RETEST, dont l’indicateur s’appelle le coefficient de stabilité temporelle, consiste dans le fait d’administrer deux fois le même test aux mêmes participants dans les mêmes conditions. La corrélation entre t1 et t2 indique si on a préservé le classement des sujets. On choisit un intervalle de temps qui est pertinent selon la stabilité supposée de la mesure. Lorsqu’on choisit un intervalle court, on mesure la stabilité de test et quand on choisit un intervalle long on mesure la stabilité de trait (ex l’intelligence ou la personnalité de l’individu).

La FIDÉLITÉ INTER-JUGE qui permet de calculer la stabilité entre les évaluateurs.

La FIDÉLITÉ DES FORMES PARALLÈLES permet de calculer un coefficient d’équivalence. On administre deux versions du même test. La corrélation examine la préservation du classement des individus.

La CONSISTANCE INTERNE (fidélité interne) permet de calculer un coefficient d’homogénéité avec la méthode de bissection et alpha de Chronbach.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

La méthode de bissection (split-half)

Consistance interne (fidélité)

A

On coupe le test en deux parties égales en items pairs/impairs, en 1ère partie/2ème partie du test ou même de manière aléatoire. Puis, on étudie la corrélation entre ces deux sous-scores pour vérifier que le test est bien homogène et consistant (= que les items mesurent la même chose).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Méthode d’alpha Chronbach

Consistance interne (fidélité)

A

Elle permet de vérifier la co-variance entre les items, c-a-d si plusieurs items d’une échelle mesurent bien la même chose.

Il essaie de résumer la corrélation entre les différents items, deux à deux. L’alpha de Chronback prend des valeurs de 0 à 1. On estime qu’il est satisfaisant à .80 et acceptable à .70.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

La validité

A

La validité est la capacité du test à mesurer ce q’il est censé à mesurer. Cela renvoie à la pertinence de la mesure. Un test n’est pas valide dans l’absolu mais par rapport aux objectifs et au contexte. L’examen de la validité est un processus où l’on essaye d’accumuler le plus de preuves possibles en faveur de cette validité.

Pour vérifier la validité d’un test d’intelligence, on va essayer de voir s’il corrèle avec un autre test d’intelligence. On s’attend donc à une corrélation modérée et positive.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

La validité de contenu

från APR4

A

Elle vise à vérifier si le contenu d’un test est représentatif des différentes composantes du construit théorique.

17
Q

Comment créer un test valide basé sur le contenu (validité de contenu)

A

Il y a 7 principes de base pour la validité du contenue :
1. Définir le domaine et la facette du concept et valider cette définition.
2. Utiliser un échantillon d’experts pour créer les items du test.
3. Mettre tous les composants de contenu du test à une étude de validité.
4. Utiliser plusieurs expert pour évaluer les indices de validité du contenu.
5. Examine la représentation proportionnelle des items relativement aux différentes facettes du test.
6. Présente l’épreuve de validité de contenu dans l’application de tous nouveaux instruments.
7. Prend en compte toutes les analyses psychométriques antérieures pour poruver la validité.

18
Q

La validité de construction

från APR4

A

Elle vise à vérifier si la structure d’un test est conforme aux travaux et théories psychologiques antérieures.

19
Q

La validité de critère (ou empirique)

A

Elle vise à vérifier que les résultats obtenus dans un test corrèlent bien avec un ensemble de comportements dans une situation. Cette forme de validité est la plus recherchée, mais demande de concevoir des protocoles très lourds. On distingue deux types de validité de critère:

La validité concourant/concomitant : On cherche le lien entre les scores au test et une observation concomitante^, c’est-à-dire que l’on receuille les données d’un test et les données de notre critère en même temps.

  • La validité convergente : L’objectif est de vérifier que les scores au test sont liés au score obtenu au critère. On cherche à montrer une corrélation positive ou négative.
  • La validité divergente : L’objectif est de vérifier ce que le test ne mesure pas. On cherche à montrer un coefficient de corrélation nul ou très faible entre deux tests. Par exemple, dans un test de personnalité on s’attend à retrouver des corrélations nulles ou faibles avec un test d’intelligence.

La validité prédictive : On cherche à savoir si les scores au test ont un lien avec une observation naturelle fait ultérieurement (ex. performance dans un poste, réussite scolaire).

^observation fait en même temps que le test

20
Q

La validité de protocole

A

Elle consiste à vérifier si les réponses du sujet sont valides. Pour cela, on regarde si les différents scores du sujet aux différentes séries ne s’éloignent pas du score normal. On compare les scores observés aux notes probables. Si les scores s’éloignent de plus de 2 points de déviation par rapport à la note probable, on peut considérer que la note totale n’est pas une estimation valide des capacités générales du participant.

Il y a une différence entre la validité du protocole et la validité du test : score invalide ≠ test invalide

Quand un score est invalide, on devrait analyser ses erreurs et ne pas le mettre dans un étalonnage.

21
Q

Analyse des erreurs

Pour comprendre l’invalidité du protocole

A

Dans le cas où le score n’est pas normal, l’analyse des erreurs permet d’étudier les difficultés du sujet. Cela nous permet d’aller plus loin que le score total pour comprendre le fonctionnement du sujet. Il existe quatre types d’erreurs:

  • L’erreur de différence : Le distracteur a une apparence très différente des autres choix. L’option n’a rien à voir avec la réponse correcte
  • L’erreur de corrélation incomplet ou approximatif : Le distracteur est souvent mais pas toujours correcte. L’item ressemble un peu à la réponse correcte (un trait en commun par ex).
  • L’erreur de mauvais principe ou individualisation inadéquate : Le distracteur est une copie ou une composition des éléments de la matrice.
  • L’erreur de répétition du pattern : Le distracteur choisi est une copie des entrées de la matrice. Le participant est donc bloqué sur ces entrées sans les transposer à la partie manquante.
22
Q

Analyse des stratégies de résolution

A

Hunt a montrés qu’il y a deux stratégies peuvent conduire à la réussite :

  • La stratégie globale : Les opérations mentales s’appuient sur le contenu visuel. _La matrice est considérée comme un tout_et les opérations utilisées peuvent être de simple continuation, une extension de la partie manquante ou une superposition de configurations isolées.
  • La stratégie analytique : On fait un dénombrement des éléments figurant à chaque intersection. Les données de problèmes ne sont plus un pattern visuel mais un ensemble d’organisme de propriété abstrait. On essaie d’analyser indépendamment chaque item.

Normalement, la stratégies globale est la plus simple. Pour avoir un score élévé, il faut alors maitriser la stratégie analytique.

23
Q

Est-ce que des profils avec une note brute totale similaire veux dire que ces individus ont la même forme d’intelligence?

A

Non!

Des notes totales proches ne reflètent pas la même forme d’intelligence. Quelqu’un peut être bon dans les tests spatials et mauvais dans les tests verbals tandis qu’un autre peut montre un profil inverse.

Alors, il faut comparer les résultats de chaque sous-test/aptitude pour mieux comprendre les points forts et points faibles de chaque individu.

24
Q

Quelles sont les conséquences de la transformation de note brute à note centrée réduite (z)?

A

Les différentes aptitudes testées ne sont pas notées sur la même échelle (ils ont différents moyens et écart-types). Il est donc impossible de les comparer. Pour pouvoir les comparer, il faut transformer les scores bruts en notes z.

Cette transformation permet de donner la même moyenne (0) et le même écart-type (1) à chaque sous-test.

Le rang des sujets reste le même après une conversion de note brut en note z.

25
Q

La formule de la note z

A

z = (note brute – moyenne) / l’écart-type

26
Q

Comparaison des notes brutes vs comparaison des notes z

A

Il est possible de faire des comparaisons inter-individuelles en notes brutes car on reste sur la même échelle et même dimension. En revanche, l’écart entre les sujets change ; il est impossible de faire des comparaisons intra-individuelles en notes brutes car on n’est pas sur la même échelle.

27
Q

Les étapes pour faire un comentaire sur un profil d’aptitudes

A
  1. On commente globalement si le participant est fort, moyen ou faible par rapport aux autres participants (variabilité inter-individuelle).
  2. On commente les points forts et les points faibles du participant (variabilité intra-individuelle).
  3. On indique si le participant a un profil homogène ou hétérogène.
  4. On indique la théorie de l’intelligence qui est illustrée par le profil.
28
Q

L’emergence de la théorie hiérarchique d’intelligence

A

Les études plus récentes s’accordent pour montrer que, d’une part, le facteur g,définit par Spearman, ne suffit pas à rendre compte de toutes les corrélations entre des épreuves se ressemblant. Il faut admettre l’existence d’un facteur de groupe pour expliquer le supplément de corrélation. D’autre part, les facteurs de premier ordre de Thurstone ne sont pas indépendants et ont de ce fait quelque chose en commun, le facteur g. Nous pouvons donc parler de complémentarité des deux conceptions, qui sont compatibles avec un modèle hiérarchique de l’intelligence.

29
Q

approche hiérarchique d’intelligence

Comment valider la présence des clusters dans un test d’intelligence?

A

Il faut vérifier dans la matrice une forte corrélation entre les tests de même dimension (validité convergente = intra-cluster) et une faible corrélation avec les autres (validité divergente = inter-cluster).

Pour avoir une forte corrélation, le rang des participants doit percister entre les tests de même dimension.

30
Q

Quels sont les deux formes de validité qui renvoie à la notion de cluster?

A

La validité convergente, que l’on retrouve dans l’intra-cluster : l’on s’attend à de forte corrélation, à ce que les tests d’une même dimension convergent entre eux

La validité divergente, que l’on observe dans l’inter-cluster : l’on s’attend à des corrélations nulles ou faibles entre les dimensions.

La validité convergente et divergente renvoie à la validité de critères.

31
Q

La notion de saturation

A

En psychologie on fait des mesures de saturation pour mesurer des concepts en étudiant des caractéristiques observables. C’est un lien entre une variable observé et une facteur inobservable.

Elle s’interprète comme une corrélation, mais ce n’est pas une corrélation (la corrélation est un lien entre deux variables observées), donc on utilise le terme saturation .

Le principe de lecture d’analyse factorielle est similaire à celui d’une matrice de corrélation. On peut retrouver des clusters et des notions de validité convergente et divergente.