Examen 2 Flashcards
Définir la mesure en psychologie
Transformer des construits psycho-sociaux en chiffre en respectant des règles strictes.
À quoi sert la précision de la mesure ?
mesurer de manière fine les différences entre les individus.
Qu’est ce que la reproductibilité de la mesure ?
donne des résultats similaires lorsque le test est administré à plusieurs reprises dans des conditions semblables.
Quels sont les enjeux éthiques de la mesure ?
Confidentialité et protection des données
Les scores doivent servir à améliorer le bien-être des personnes évaluées.
Quel autre nom donne-t-on à construit psychosocial ?
Variable latente
À quoi sert l’évaluation psychologique ?
Elle permet une interprétation basée sur des critères scientifiques pour comprendre et diagnostiquer des phénomènes psychologiques
Quels sont les 3 aspects nécessaire pour interpréter une évaluation psychologique ?
Une connaissance de ce qui est mesuré
Les instruments doivent être valides et fiables ;
Prendre en compte des erreurs de mesure.
Pourquoi dit-on que l’évaluation est un processus dynamique ?
Parce qu’elle est une source d’information explicative sur des phénomènes psychologiques qui s’adapte aux changements et aux nouvelles informations
Quelles sont les étapes de l’évaluation ? (5)
Identifier la problématique ;
Choisir les outils d’évaluation ;
Collecter les données
Analyser et interpréter les résultats ;
Élaborer le rapport et le plan d’intervention.
Quelles sont les normes éthiques de l’évaluation ?
Confidentialité ;
Consentement éclairé
Collecte des données
Communication claire des résultats
Nommez les méthodes d’analyse de données
Statistiques descriptives
Statistiques inférentielles
Régressions et modèles prédictifs
Comment interpréter les intervalles de confiance ?
nous pouvons être confiants à 95% que l’effet réel se situe à l’intérieur de cet intervalle
Quelles sont les recommandations APA pour l’analyse des données ? (4)
Utiliser des estimateurs appropriés : robustes ;
Rapporter la taille d’effet ;
Rapporter les intervalles de confiance ;
Éviter le “p-hacking”
Qu’est ce que le p-hacking ?
manipuler les analyses de données pour obtenir des résultats significatifs
Définir l’analyse de donnée
Processus qui permet de mieux comprendre le comportement humain.
Quels sont les 4 niveaux d’échelles de mesures selon Stevens ?
Nominales (de classes ou catégorielles) ;
Ordinales ;
Intervalle ;
Proportionnelle (ratio).
Qu’est ce que l’échelle nominale ?
Classification sans ordre,
Opérations statistiques limitées : fréquences et pourcentages.
Nommez des exemples de variables nominales
Le sexe (XX ou XY)
Type de personnalité (introverti, extraverti) ;
Diagnostic clinique (trouble dépressif majeur, etc.).
Qu’est ce qu’une corrélation tétrachorique ?
Se base sur le mode
Permet d’estimer des relations sous-jacentes entre des variables catégoriques.
Est-ce que la matrice tétrachorique produit de meilleurs résultats que la matrice de de Pearson pour les analyses factorielles ?
Oui, produit de meilleurs résultats
Quelle est la limite de la corrélation tétrachorique ?
Les logiciels n’ont pas cette fonction, donc personne en fait. Je ne peux faire que fréquences et pourcentages
C’est quoi le bootstrapping ?
Lorsque les hypothèses paramétriques classiques ne sont pas respectées. P.ex : Échantillons de petite taille
Permet de rééchantillonner les réponses en créant un autre échantillon de réponse à partir de ceux que j’ai déjà.
Une façon de garder les données extrêmes tout en rendant la distribution normale à l’aide d’un plus grand nombre de réponses.
À quoi sert le bootstrapping avec des échelles nominales ?
Permet de générer des intervalles de confiance pour des statistiques comme les fréquences et pourcentages.
Définir une échelle ordinale
Classement avec un ordre : croissant ou décroissant.
Il n’y a pas d’absence du phénomène. P.ex. : niveau d’anxiété à zéro n’existe pas
Quelles sont les Opérations statistiques spécifiques aux échelles ordinales ?
fréquences, pourcentages, médiane, mode, corrélation de Spearman.
Donnez des exemples de variables ordinales
Niveaux d’anxiété (léger, modéré, sévère);
Échelles de Likert (fort. en désaccord à 5 = fort. en accord);
Évaluations des symptômes (faibles, modérés, graves).
Genre (masculin, féminin, autre) ; Le genre est ordinale, car il y a des échelles de masculinité, de féminité.
Qu’est ce qu’une corrélation polychorique ?
Sur la moyenne
Permet de mesurer les relations entre des variables ordinales, en supposant qu’une variable continue sous-jacente existe.
On peut faire des corrélations en respectant les distances entre les catégories/chiffres
Qu’est ce qu’une échelle à intervalle ?
Écarts égaux entre les valeurs ;
La valeur zéro existe, mais elle n’est pas absolue (ex. temp.)
Quelles sont les statistiques appropriées à l’échelle d’intervalle ?
Permet une gamme d’analyses statistiques plus larges :
moyenne, la variance, et l’écart-type
Nommez des exemples de variables d’intervalles
Scores de tests de QI ;
Scores d’évaluation de la performance cognitive (mémoire, etc.).
La température
Quel type de corrélation est utilisé avec des échelles d’intervalles ?
La corrélation classique ou de Person
Qu’est ce qu’une échelle de ratio (proportionnelle) ?
Le zéro est absolu ;
Écarts identiques entre les chiffres ;
Quelles opérations sont appliquées aux échelles de ratio ?
Opérations arithmétiques complètes
Donnez des exemples de variables ratio
Temps de réaction ;
Durée de sommeil ;
Nombre d’enfants.
Quelles corrélations seront appliquées aux échelles de ratio ?
Corrélation classique ou de Person
Que veux t’on dire par classification des échelles de mesures par convention ?
En fonction de leurs propriétés et du type de données à analyser, où chaque donnée a une signification précise.
Que veux t’on dire par classification des échelles de mesures par utilité ?
Basée sur des normes arbitraires ou des conventions sociales, où les valeurs ne sont pas nécessairement mesurables de manière précise.
Aujourd’hui, avec le développement de nouveaux logiciels, cette notion d’ « utilité » est fortement remise en question.
Quels sont les 2 types d’échantillons utilisés en psychométrie ?
un échantillon d’individus et un échantillon de contenu (items d’un test).
Quel est le problème de l’échantillonnage lié aux deux échantillons selon Bernier et Pietrulewicz ?
il est pratiquement impossible de gérer simultanément les deux échantillons.
Quelle est l’approche recommandée pour contrer le problème de l’échantillonnage lié aux deux échantillons ? (2 étapes)
1) utiliser un échantillon d’individus suffisamment large pour minimiser l’erreur d’échantillonnage et garantir une bonne représentativité de la population cible.
2) S’assurer de la représentativité des items du test.
À quoi servent les normes en psychométrie ?
Elles fournissent un contexte de comparaison en comparant la performance d’un individu à une population de référence.
Quels sont les types de normes en psychométrie ? (4)
Normes intra-groupe
Normes basées sur des critères (critériées)
Normes de développement
Normes ipsatives (inter-individuelles)
Décrivez les normes intra-groupe
Comparent les résultats d’un individu avec ceux d’un groupe de référence.
Exemples :
Percentiles
Scores z
Scores T
Quotient Intellectuel (QI)
Décrivez les normes basées sur les critères
Comparent les résultats d’un individu à un critère prédéfini plutôt qu’à un groupe.
Exemple : Un examen scolaire, des tests cliniques
Décrivez les normes de développement
Normes d’âge
Comparer la performance d’un individu en fonction de son âge ou de son niveau de développement.
Exemple :
Âge mental ;
Percentiles de croissance
Décrivez les normes ipsatives
Comparent la performance d’un individu à lui-même
Exemple : tests de personnalité, évaluation de progrès
À quoi sert la classification des échelles de mesures ?
Elle permet de structurer et d’interpréter les résultats en donnant une base standardisée de comparaison.
C’est quoi l’analyse d’item ?
Technique qui évalue la qualité des questions d’un test
Quelle est la méthode d’analyse la plus utilisée ?
CTT – Théorie classique des tests (80%)
En quoi consiste la théorie classique des tests ?
Corrélation point-bisériale (item-total)
Indice de difficulté (p-value)
Qu’est ce que la corrélation point-bisériale (item-total) ?
Elle mesure la relation entre un item et l’ensemble des autres items, permettant de vérifier si cet item est bien aligné avec l’ensemble du test ou dimension.
Comment on calcule et on interprète la Corrélation point-bisériale (item-total) ?
La corrélation entre 1 item et l’ENSEMBLE des autres items.
Une corrélation élevée : l’item est cohérent avec les autres
Si on retire un élément, on recommence car peut impacter la relation entre les autres items
Qu’est ce que l’indice de difficulté (p-value)?
Mesure la proportion de participants qui répondent correctement à un item, permettant de déterminer à quel point une question est facile ou difficile
Comment on calcule et on interprète l’Indice de difficulté (p-value) ?
On divise le nombre de réponses correctes par le nombre total de participants X / n
Une p-value proche de 1 indique = très facile, proche de 0 = très difficile.
Idéalement, on vise une p-value autour de 0,50
Quels sont les éléments complémentaires de la théorie classique des tests ? (4)
Statistiques de tendance centrale (Item Statistics);
Corrélations inter-item (Corrélation Matrix); item vs item
Analyses congénériques (Reliability Statistics);
Analyse parallèle ; Corrélation d’un item vs un autre en contrôlant les effets des autres variables ou items.
Qu’est ce qu’une analyse congénérique ?
mesure qui respecte l’importance de chaque item pour le construit. On calcul la moyenne des corrélations partielles de chaque item (p.ex. : Alpha de combac original, Omega de Mcdonald)
Combien d’items candidats devrait-il y avoir par rapport à la quantité d’items souhaités ?
entre 5 et 6x
Quels sont les critères d’élimination d’items selon la théorie classique des tests ? (5)
1) n’est pas bien associé au reste des items
2)Présentent des moyennes extrêmes, ou sans variabilité
3) Montrent très peu de variation ; les items mesurent la même chose ou presque
4) Sont fortement corrélés (> que 0,90 ou 0,95);
5) Sont faiblement ou négativement corrélés avec les autres items
Comment faisons nous l’analyse des données statistiques ? (calculs)
X x Y = xy
Calculer l’écart-type de X
Calculer l’écart-type de Y
Calculer la corrélation rxy
Calculer le coefficient de détermination
Comment calculer l’écart-type ?
ÉTx ou ÉTy = somme de x ou y au carré divisé par n puis faire la racine carré du total
Comment calculer la corrélation rxy ?
division de la somme des XY par N x ÉTx x ÉTy
Comment calculer le coefficient de détermination ?
(rxy x rxy) x100
Comment interpréter le coefficient de détermination ?
x% de la variabilité de x est expliquée par la variabilité de y et vice versa. Donc x% est expliqué par autre chose.
Comment interpréter l’analyse statistique d’item ? (4)
1) Force de la corrélation 0.4 = modéré, 0.65 = fort (change selon ce qui est évalué, mais à peu près),
2) le signe (+-),
3) la signification (oui ou non, si spécifiée),
4) taille de l’effet = le % de variance (coefficient de détermination)
Comment s’interprète le Scale statistics ou statistique d’échelle dans l’analyse d’items ?
1) l’écart-type sera plus petit que la moitié de la valeur de la moyenne et
2) la variance est plus grande que la valeur de la moyenne
Comment fonctionne le tableau Item-total statistics ?
permet d’évaluer l’impact de chaque item sur la cohérence globale de l’échelle.
Que mesure l’alpha de Cronbach ordinal ?
la consistance interne du test, c’est-à-dire à quel point les items du test mesurent le même concept.
Comment puis-je m’assurer que mes items concernent une seule dimension ?
L’analyse parallèle
Définir l’analyse parallèle
Permet de savoir combien de facteurs ces items mesurent, lors d’une analyse factorielle
Comment se calcule l’analyse parallèle ?
Elle compare les valeurs propres (eigenvalues) obtenues à partir des données réelles avec celles générées aléatoirement pour évaluer si les facteurs extraits des données réelles sont significatifs.
Comment interpréter le tableau de l’analyse parallèle ?
% de variance de mes données réelles (intrinsèque) doit être plus élevé que le % de variance randomisée et que la variance du 95e percentile
Qu’est ce que la fidélité ?
La cohérence et la constance temporelle
Le rapport entre la variance vraie et la variance totale du test.
Qu’est-ce que la variable observable ?
Item du questionnaire
Qu’est ce qu’un modèle non-identifié ?
les résultats d’un test ou d’un questionnaire ne permettent pas de tirer des conclusions fiables sur les capacités ou les traits mesurés.
L’inverse sera un modèle identifiable.
Qu’est-ce que la variance d’erreur ?
toute condition non pertinente à l’objectif d’un test
Qu’est ce qu’une corrélation colinéaire ?
Une corrélation supérieure à 0,95. Évident qu’on manipule les relations, on mesure la même chose avec des mots différents
Quels sont les niveaux de corrélations ? (5)
0.95 : colinéaires
0.75 : très élevé
0.55 : élevé
0.35 : modéré
0.15 : faible
Qu’est ce qu’un coefficient de fidélité ?
Varie entre 0 et 1
Mesure si un test donne des résultats cohérents et stables.
Quel est le coefficient de fidélité requis dans un contexte clinique ?
0.8 et plus
Quel est le coefficient de fidélité requis dans un contexte scientifique ?
0.7 et plus
Quelles sont les 5 types de fidélités ?
Fidélité par test-retest;
Fidélité par versions parallèles ;
Fidélité par bissection ;
Fidélité par homogénéité ;
Fidélité par équivalence inter-juges.
Qu’est ce que la fidélité par test-retest ?
administrer le même test à deux moments distincts aux mêmes sujets. Va déterminer la constance temporelle
Le coefficient de fidélité calculé (rtr) est la corrélation entre les scores obtenus par les mêmes individus lors des deux administrations du test.
Comment interpréter la fidélité test-retest ?
Plus la fidélité test-retest est élevée, moins les scores des sujets sont susceptibles d’être affectés par des sources d’erreurs liées au temps ou aux conditions de passation.
Quelles sont Les sources d’erreurs dans la fidélité test-retest ?
Les fluctuations aléatoires dues, en partie, à des conditions de test mal contrôlées, mais également à des changements internes chez le sujet entre les deux passations.
Quels sont les Avantages de la méthode test-retest ?
Évaluation directe de la stabilité temporelle
Appropriée pour les traits stables
Facile à interpréter
Quels sont les inconvénients de la méthode test-retest ? (5)
Effet de mémoire
Variations internes et externes entre les sessions
Difficulté à définir l’intervalle de temps optimal entre les tests
Temps et coûts supplémentaires : nécessite deux administrations du test
Pas toujours appropriée pour les traits de personnalité (Confiance en soi situationnelle) ou états émotionnels variables (anxiété)
Qu’est ce que la Fidélité par versions parallèles ?
deux versions différentes mais équivalentes à un même groupe de sujets.
Qui mesure le même construit de manière similaire, mais avec des items différents.
Le coefficient de fidélité est calculé en corrélant les scores obtenus lors des deux passations.
Comment interpréter la Fidélité par versions parallèles ?
Une forte corrélation indique que les versions sont cohérentes et mesurent de manière fiable le même concept, malgré les différences d’items.
Que veut-on dire par parallélisme rigoureux ?
Même contenu et structure équivalente, même si le nombre d’items diffère légèrement.
Le niveau de difficulté des items doit être statistiquement similaire (p < 0,05).
Les consignes, le temps alloué et le format doivent être identiques entre les versions.
Les interprétations des scores restent cohérentes et comparables entre les différentes versions
Qu’est ce qu’un construit ?
un concept mesuré
Quels sont les avantages de la fidélité par versions parallèles ? (4)
Évaluation de la constance du construit
Réduction de l’effet de mémoire
Utilisation dans des contextes variés : Utiles dans des contextes où le test est administré plusieurs fois, ou dans des études longitudinales.
Mesure de plusieurs facettes d’un même concept : Renforce la compréhension globale du construit et peut élargir l’utilité de l’instrument
Quels sont les inconvénients de la fidélité par versions parallèles ? (4)
Difficulté de créer des versions « vraiment équivalentes »
Coût en temps et en ressources
Complexité des analyses statistiques : nécessite souvent l’utilisation de méthodes comme l’analyse factorielle confirmatoire.
Biais potentiel si les versions ne sont pas vraiment parallèles
Qu’est ce que la Fidélité par bissection ?
diviser les items du même test en deux moitiés équivalentes et à calculer la corrélation entre les scores obtenus pour chaque moitié.
Permet de mesurer la cohérence interne du test, c’est-à-dire dans quelle mesure les deux moitiés évaluent la même caractéristique psychologique.
Formule de Spearman-Brown, surtout quand les items sont impairs
Si mon instrument est tridimensionnel, je dois avoir 3 sections du test
Quels sont les avantages de la Fidélité par bissection ? (4)
Facilité d’application : Une seule administration
Évaluation de la cohérence interne
Réduction de l’effet de fatigue
Utilisation efficace des données
Quels sont les inconvénients de la fidélité par bissection ? (3)
Problème de division : difficile de diviser le test en deux moitiés absolument équivalentes
Fiabilité sous-estimée
Sensibilité à la méthode de division : Le coefficient de fiabilité peut varier selon la façon dont le test est divisé
Qu’est ce que la Fidélité par homogénéité ?
Mesuré par des coefficients comme l’alpha ordinal, Omega
Faire la corrélation entre l’item 1 et l’item 2 en contrôlant les autres corrélations. Contrôlant ainsi l’effet des autres items (corrélation partielle)
Comment interpréter la fidélité par homogénéité ?
Des résultats élevés suggèrent que les items se corrèlent bien entre eux donc sont homogènes. Les indices mesurent la moyenne des corrélations partielles
Quels sont les avantages de la fidélité par homogénéité ? (4)
Facilité de calcul : une seule administration.
Évaluation directe de la cohésion
Adapté aux tests unidimensionnels
Économie de temps
Quels sont les inconvénients de la fidélité par homogénéité ? (3)
Ne détecte pas l’hétérogénéité : Si le test mesure plusieurs dimensions, la cohérence interne peut être trompeuse car elle n’évalue que la cohésion des items sans vérifier la validité multidimensionnelle.
Sensibilité à la longueur du test : augmente artificiellement la fidélité quand plusieurs items
Influencé par la redondance des items : items colinéaires augmente mon niveau de fidélité
Qu’est ce que la Fidélité par inter-correcteurs ?
mesure le degré d’accord entre deux ou plusieurs évaluateurs qui jugent indépendamment le même ensemble d’items.
Cette méthode est particulièrement utile lorsque les évaluations sont subjectives, comme des symptômes cliniques en psychologie.
Elle est souvent calculée à l’aide de mesures statistiques comme le coefficient de corrélation intra-classe (CCI), le kappa de Cohen, ou d’autres indices d’accord inter-juges comme le CVC (coefficient de validité de contenu).
Quels sont les avantages de la fidélité inter-juges (correcteurs) ? (4)
Évaluation de la subjectivité : Seule façon d’évaluer la subjectivité
Identification des biais d’évaluation
Application dans plusieurs domaines
Mesure de la cohérence entre les juges
Quels sont les inconvénients de la fidélité inter-juges ? (4)
Dépendance aux compétences des évaluateurs
Coûts en temps et en ressources
Variabilité dans les critères : critères légèrement différents d’interprétation.
Complexité des analyses
Qu’est-ce que la fidélité des tests de vitesse ?
Incluent des items généralement simples, que la plupart des individus peuvent accomplir.
Ce qui est mesuré, c’est la rapidité avec laquelle les tâches peuvent être terminées.
Souvent mesurée par des méthodes telles que la fidélité test-retest ou la méthode de bissection
Qu’est-ce que La fidélité des tests de puissance ?
Les items varient en difficulté et visent à évaluer le potentiel ou les capacités intellectuelles maximales d’une personne.
Il s’agit de réussir des tâches plus complexes.
Évaluée par des méthodes comme la cohérence interne
Pourquoi disons-nous que l’on doit éviter les scores parfait dans l’évaluation de la fidélité des tests de vitesse et puissance ? (2)
Discrimination psychométrique :
Un test qui permet des scores parfaits n’a plus de capacité de discrimination, car il ne différencie plus les participants en fonction de leurs aptitudes.
Problème d’un score parfait :
Un score parfait empêche d’évaluer les compétences réelles d’un individu.
Il devient impossible de savoir si la personne aurait pu obtenir un meilleur score avec des items plus difficiles ou un test plus long, créant ainsi une limite artificielle à l’évaluation.
Quel est l’inconvénient des scores parfaits des tests de vitesse ?
La performance est limitée par le temps et non la difficulté. Si un participant termine toutes les tâches, cela pourrait indiquer qu’il aurait pu en faire plus avec plus de temps.
Quel est l’inconvénient des scores parfaits des tests de puissance ?
Dans les tests de puissance, la difficulté varie. Si tous les participants réussissent a tous les items, il devient difficile de différencier les niveaux de compétence.
Qu’est-ce que L’erreur type de mesure ?
Décrit l’ampleur des erreurs aléatoires dans un test et aide à estimer dans quelle mesure un score observé peut diverger du vrai score.
De quoi est composé un score observé ?
Score vrai : Représente les capacités réelles de l’individu.
Erreur de mesure : Facteurs aléatoires qui influencent le score. Appelé variance vraie ou variance d’erreur
Quel est le calcul de l’erreur type de mesure ?
ETM= (o) écart type x la racine carrée de 1 - (r) coefficient de fidélité
Comment interpréter l’erreur type ?
Faible ETM : Moins de 5 % du score total de la personne. Cela indique que l’incertitude liée aux erreurs aléatoires est faible, ce qui signifie que le score observé est proche du score vrai.
ETM modérée : Entre 5 % et 10 %. Une ETM modérée montre une certaine incertitude. Le score observé peut s’écarter du score vrai, mais reste dans une marge acceptable.
ETM élevée : Supérieure à 10 %. Cela reflète une plus grande imprécision dans les résultats en raison d’une plus forte présence d’erreurs aléatoires.
plus le coefficient de fidélité sera élevé plus le sera l’erreur type ? vrai ou faux
Faux : Plus un test est fidèle (coefficient de fidélité élevé), plus l’ETM est faible.
Nommez une application concrète de l’erreur type de mesure (ETM)
Évaluer la précision des scores individuels : Calcul d’un intervalle de confiance autour d’un score.
Comparer la précision des tests
Prendre des décisions : Aide à estimer la marge d’erreur d’un score.
Donnez un exemple d’interprétation de l’erreur type de mesure
Environ 68% des individus se situent entre -1 et +1 écart-type. On peut donc conclure qu’environ 68% des scores de Marcos se regrouperont entre -1 et +1 ETM. En termes de probabilité, il y a environ deux chances sur trois (ou 68:32) que les réponses de Marcos se situeront dans cet intervalle (-1 et +1 ETM) autour de son QI réel.
15 multiplié par la racine carré de (1-0,89) = 15 x 0,33 = 5 (arrondi)
Mettre le bon résultat à la décimale (puis mettre «arrondi à X»)
Un intervalle de confiance autour d’un score observé peut être calculé avec l’ETM. Par exemple, si un individu obtient un score observé de 110 dans un test, et que l’ETM est de 5, un intervalle de confiance à 68 % se situera entre 105 et 115.
Quelle est la limite de l’erreur type de mesure (ETM)?
L’ETM ne prend en compte que les erreurs aléatoires