PSY2003 intra Flashcards
Qu’est-ce qui rend un test désuet ?
L’utilisation de théories qui sont désormais rejetées, qui reflètent des valeurs, normes, vocabulaires désuets.
Qu’est-ce qu’un test inadapté ?
Un test qui ne reflète pas la population visée.
Qu’est-ce que l’usage anticipée dans l’élaboration d’un test ?
La définition de l’objectif psychométrique.
V ou f ? La formulation ou révision des items doit absolument découler de théories ou recherches empiriques.
Vrai.
Quels sont les deux grands éléments à considérer lors de composition des items ?
La fidélité et la validité.
Pourquoi dit-on que la création d’un test est un processus itératif ?
Ce n’est pas linéaire, il est impossible d’avoir un test parfait et il est possible de retourner aux étapes antérieures.
V ou f ? La création de tests n’est pas linéaire.
Vrai.
Qui sont les acteurs dans l’utilisation d’un test ?
Le concepteur, le bénéficiaire, l’administrateur et l’utilisateur.
V ou f ? Le bénéficiaire est celui qui peut utiliser les résultats d’un test dans son étude.
Faux, c’est celui qui se fait évaluer.
Quel acteur interprète les résultats d’un test ?
L’utilisateur.
Qu’est-ce qu’une erreur aléatoire dans les résultats ?
Lorsque c’est une fluctuation qui ne peut nécessairement être contrôlée, qui n’a pas de patron d’apparition dans la population.
Qu’est-ce que la cotation globale analytique ?
Une cotation qui accorde un nombre de points par éléments de réponse (réponse logique, nombre d’éléments présents, etc.).
Quel type d’échelle permet de dire qu’il y a « 2 fois plus de […] » ?
L’échelle de proportion, de rapport, de ratio.
V ou f ? La température en calvin est une échelle de proportion, mais pas celle en celcius.
Vrai.
Qu’est-ce que la variance ?
La moyenne des distances entre la moyenne et chacun des scores.
L’écart-type est la racine carrée de quel concept statistique ?
La variance.
V ou f ? Si la p value est au-delà de 0,05, les résultats sont probablement dû au hasard.
Vrai.
V ou f ? Si un test n’est pas valide, cela veut dire qu’il n’est pas fidèle.
Faux, pas nécessairement.
Qu’est-ce qu’une erreur systématique ?
Une erreur qui affecte tous les scores de la même façon.
L’erreur de mesure est le rapport entre quels scores ?
La différence entre le score vrai et le score observé.
Que signifie un rapport de 1 entre le score vrai et le score observé ?
Qu’ils sont la même chose, qu’il n’y a pas d’erreur.
V ou f ? La version traduite peut être considérée comme une forme parallèle.
Vrai.
Un test de 24 items peut-il être une forme parallèle d’un test de 30 items ?
Non, ils doivent avoir le même nombre d’items.
Qu’est-ce que la corrélation par bissection ?
Ça mesure à quel point la première moitié du test donne un score similaire à la deuxième partie du test.
Comment estime-t-on le nombre d’items nécessaire pour augmenter la fidélité d’un test ?
Par la formule de la prophétie.
À quel indice de fidélité un test est considéré excellent ? Inacceptable ?
Un score de fidélité est excellent avec un score de plus de 0,90 et inacceptable à un score de moins de 0,60.
Quelle est la différence entre l’usage anticipé et l’usage recommandé ?
L’usage anticipé offre une définition globale du construit et de son but, en identifiant le construit, la population visée et les méthodes utilisées, par exemple. L’usage recommandé explique l’utilisation spécifique des résultats provenant de l’instrument et offre un guide pour l’administration et l’interprétation.
Pourquoi la covariance est difficile à interpréter ?
Elle n’est pas standardisée.
V ou f ? L’écart-type représente l’écart entre chaque score observé.
Faux, l’écart de chaque score et la moyenne.
Selon la théorie classique des tests, quelle est la différence entre le score vrai et le score observé ?
Le score observé est celui du test et le score vrai est le score obtenu s’il n’y avait pas d’erreur de mesure.
Selon la théorie classique des tests, quelle moyenne disparaît dans un grand ensemble de scores ?
L’erreur de mesure.
Pour que deux tests soient considérés comme deux tests parallèles, quels sont les éléments nécessaires ?
Avoir le même nombre d’items, la même méthode d’administration, la même moyenne et le même écart-type.
La fidélité interjuge utilise quel type de corrélation si on utilise des fréquences ?
La corrélation Kappa.
Quel type de corrélation est utilisée en fidélité interjuge, généralement ?
De Pearson.
S’il y a plus de 2 juges impliqués dans la correction (pour la fidélité interjuge), comment s’appelle ce type ?
La fidélité intra-classe.
Quelle est la limite de la corrélation par bissection ?
Elle ne mesure pas l’entièreté de la fidélité du test, mais pour la moitié du test. En coupant de moitié le nombre d’items, on baisse nécessairement la fidélité.
Comment remédier à la limite de la corrélation par bissection ?
Par la correction de Spearman-Brown.
V ou f ? Moins d’items correspond à une meilleure cohérence interne.
Faux, c’est l’inverse.
Quels types d’erreur demandent une méthode de stabilité temporelle ?
Des variations dans les procédures d’administration et celles dues aux personnes.
Qui suis-je ? Je quantifie la façon dont un test mesure réellement ce qu’il est censé mesurer.
La validité.
Qui suis-je ? Je suis le type de validité qui permet de prédire les valeurs que prennent actuellement des variables liées à des critères mesurés.
Validité concomitante.
Quelle est la différence entre la validité concomitante et la validité prédictive ?
La validité concomitante prédit la valeur actuelle des variables liées à des critères et la validité prédictive prédit la valeur que prendront des critères à l’avenir.
Quelles sont les limites de la validité de contenu ?
Il est difficile d’établir un domaine clair des items, il est difficile de savoir à quel point les items couvrent les spécifiques d’un domaine et cette validité ne fait aucune référence aux résultats du test.
Qu’est-ce que le critère réaliste externe ?
Un critère qui donne une définition réaliste du construit mesuré par l’instrument.
Comment s’exprime le critère réaliste externe ?
Par le coefficient de corrélation (ou par régression et erreur-type d’estimation).
Quels sont les deux types de validité critériée ?
La validité prédictive et concomitante.
Quelles sont les trois méthodes d’évaluation de la validité critériée ?
Le critère réaliste externe, les groupes contrastés et la corrélation avec d’autres tests.
Que sont les validités convergente et divergente ?
Le degré d’accord (convergente) et de désaccord (divergente) entre l’instrument évalué et l’instrument établi, mesurant le concept à l’étude.
Selon la matrice multitraits multiméthodes, la corrélation sera plus élevée à quel moment ?
Quand la corrélation couvre les mêmes traits et mêmes méthodes.
Comment le système hypothético-déductif prouve une validité ?
Quand les relations attendues dans les hypothèses sont toutes trouvées.
Qu’est-ce que l’effet d’atténuation ?
Le fait qu’une mauvaise fidélité atténue la validité d’un instrument testé.
Comment teste-t-on l’effet d’atténuation ?
En utilisant la stabilité temporelle de l’instrument.
V ou f ? Lors de la correction de l’effet d’atténuation, on obtient un nouveau coefficient de corrélation qui permet d’avoir une meilleure validité.
Faux, on obtient pas de nouveau coefficient de corrélation lors de la correction.
À quoi correspond le coefficient de validité désatténué ?
À la limite supérieure théorique de validité de l’instrument s’il n’y avait pas d’erreur de mesure.
Que mesure la valeur incrémentielle ?
Le degré avec lequel l’ajout d’une information permet d’ajouter à la compréhension d’un phénomène.
Qu’est-ce que l’alpha de Cronbach ?
Un coefficient de corrélation qui mesure à quel point les items d’un instrument sont corrélés entre eux.
Qu’est-ce qui est considéré comme une mini version de l’analyse factorielle ?
L’alpha de Cronbach.
Qu’est-ce que la saturation d’un instrument ?
La corrélation entre un item et un facteur.
La structure interne et l’analyse factorielle sont des méthodes d’analyse liées à quel élément important ?
À la validité de construit.