Semaine 4 Flashcards
Que cherche-t-on a évaluer lorsqu’on évalue la validité?
Si l’instrument mesure vraiment ce qu’il prétend ou devrait mesurer.
Que veut-on savoir sur l’échantillon d’items?
On veut savoir si l’échantillon d’items (i.e., les questions)de l’échelle représente bien le construit qu’on veut mesurer
Est-ce que le nombre de question d’une échelle a une influence sur la validité?
Non.
Que détermine le degré de validité?
Le degré de validité détermine les inférences que l’on peut faire à partir des scores d’une échelle
Est-ce que le titre d’une échelle est un indice fiable du construit mesuré?
Le nom d’un test ou d’une échelle ne constitue pas toujours un indice adéquat du construit mesuré
Quelle est la vrai question lorsqu’on test la validité d’un test?
«est-ce que ce test est une mesure valide de ce construit, pour cette population et dans cette application particulière»
On évalue la validité relativement à 3 choses. Que sont-elles?
Est-ce qu’il mesure bien le construit qu’il prétend mesure ?
Est-ce qu’il mesure bien ce construit pour la population ciblée (e.g., âge, niveau académique, groupe clinique particulier, etc.) ?
Est-ce qu’il mesure bien ce construit, pour cette population et pour une application particulière (e.g., classifier dans des groupes diagnostiques, donner une valeur quantitative, etc.) ?
Que sont les différents types de validités?
Vraisemblance (validité apparente; «face validity»)
pas une forme de validité en soit, mais est tout de même considérée importante par certains auteurs
Validité de contenu
Validité de construit
Validité de critère (ou pragmatique)
Qu’est-ce que la vraisemblance?
Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de ceux qui sont évalués (i.e., non-experts qui sont évalués, ou représentants cliniques ou légaux reliés à la population ciblée, etc.)
Comme sait-on qu’une mesure détient une bonne vraisemblance?
Une mesure détient une bonne vraisemblance lorsque ceux qui l’utilisent jugent qu’elle semble pertinente pour mesurer ce qui doit être mesuré
Avec quoi la vraisemblance est souvent confondu?
la validité de contenu
Pour le manque de vraisemblance peut devenir une menace à la validité?
Si l’instrument ne paraît pas valide ou vraisemblable pour ceux qui l’utilisent dans les situations concrètes d’évaluation, cela peut devenir une menace à la validité
Nommer des facteurs qui peuvent influencer la vraisemblance.
Contexte d’évaluation (incluant l’endroit physique de l’administration, les consignes, l’apparence physique de l’évaluateur, etc.)
Capacités cognitives des répondants
État psychologique et santé mentale des répondants
Personnalité des répondants
Motif de l’évaluation (désirabilité sociale [+ ou -])
etc.
Qu’est-ce que la validité de contenu?
Il s’agit de porter un jugement sur la représentativité des items (questions) utilisés pour mesurer un construit (c’est l’auteur qui porte le jugement)
Est-ce que cela mesure vraiment ce qu’on cherche à mesurer (ex. un test qui mesure la chaleur maternelle la mesure il vraiment?)
La validité de contenu est établit la plupart du temps de façon inductive.
La plupart du temps établie de façon déductive
Quelles questions peut-on se poser lorsqu’un évalue la validité de contenu?
Chaque item individuellement correspond au construit ?
Tous les items d’une échelle considérés dans l’ensemble constituent un échantillon représentatif de tous les domaines (ou sous-domaines) expliqués par le construit d’intérêt ?
Qu’est-ce qui est centrale lorsqu’on évalue la validité de contenu?
La représentativité est centrale:
Tous les sous-domaines représentés
Éviter la sur- ou sous-représentation d’items des différents sous-domaines du construit
Que faut-il faire avant de construire une échelle pour assurer la validité de contenu?
Avant de construire une échelle, il faut toujours décrire en détails et de la façon la plus compréhensive possible les différents domaines et sous-domaines du construit d’intérêt
Quels sont les domaines inclus?
Quelle est l’importance relative de chacun?
Y a-t-il des sous-domaines selon la théorie?
Quelle est leur importance relative?
Avec quels items peut-on bien représenter ces domaines et/ou sous-domaines?
À partir de quoi les chercheurs définissent un construit (et donc, son contenu) ?
Théories scientifiques
Recherches empiriques (recension des écrits)
Connaissances et expériences professionnelles
Expériences personnelles
Rappelez-vous de l’effet des théories implicites de l’évaluateur – s’applique aux chercheurs aussi!
Quels sont les deux types de validité de contenu?
Nominale et consensuelle (groupe de spécialistes indépendants qui n’ont pas participé à l’élaboration de l’instrument et qui sont reconnus dans le domaine (verbatim généralement))