Fidélité Flashcards
C’est quoi la fidélité?
Réfère à la précision de l’instrument peu importe
ce qu’il mesure
Pensez: est-ce qu’il me trompe parfois?
On considère une technique de mesure fidèle
lorsque son application entraîne toujours des
résultats semblables
Si elle mesure toujours le construit psychologique de
la même façon
Intelligence, personnalité, anxiété…
La fidélité d’une mesure dépend de l’absence
relative d’erreur de mesure
Des mesures constantes ou fidèles
peuvent ne pas être valides
Votre test d’intelligence peut donner à chaque
fois le même résultat chez une même
personne
Gage de fidélité, oui, mais ce n’est pas ce qui vous
confirme que le test mesure l’intelligence
Quels sont les trois types de fidélité?
Stabilité temporelle
Équivalence
Homogénéité
Définition de la stabilité temporelle?
Se détermine sur la base de la constance
des résultats obtenus à la suite
d’applications répétées de l’instrument
Habituellement, on a recours à 2
administrations de l’instrument
Cette technique s’appelle fidélité test
retest
Quand utiliser le test-retest?
Recommandé pour des construits qui
possèdent une stabilité temporelle
E.g., traits de personnalité, intelligence
Peu recommandé pour :
Des tests de type situationnel qui mesurent
un état passager
E.g., émotions, humeur
Des tests qui sont influencés par la mémoire
ou l’apprentissage
C’est quoi l’équivalence?
Consistance des résultats obtenus à la suite de
l’utilisation soit de différents instruments visant la
mesure de la même caractéristique (p. ex., 16PF
formes A et B) ou soit d’un même instrument où
l’observateur est une source possible d’erreurs
Si plusieurs observateurs sont impliqués, l’indice
d’équivalence peut être le pourcentage d’accord inter
juges (coefficient Kappa)
Si ce sont des questions de tests, l’indice
d’équivalence est un coefficient de corrélation entre
les réponses à des échantillons de questions des
deux instruments
C’est quoi l’homogénéité?
C’est le degré de consistance qu’offrent
les réponses d’un individu aux questions
variées d’un test
S’intéresse à la probabilité qu’un (des) item(s)
mesure(nt) autre chose que ce qui est prévu
Différents outils statistiques mesurent
l’homogénéité
C’est quoi l’alpha de Cronbach?
Une statistique fréquemment utilisée pour
mesurer la consistance interne d’instruments de
mesure
Approprié pour échelles type dichotomiques, Likert ou
mesures intervalle/rapport
Interprétation (DeVellis, 2003)
a < 0,60 → inacceptable
a entre → 0,60 et 0,65 indésirable
a entre → 0,65 et 0,70 minimalement acceptable
a entre → 0,70 et 0,80 respectable
a entre → 0,80 et 0,90 très bien
a > 0,90 → excellent
C’est quoi la Formule 20 de Kuder-Richardson
(K-R 20)?
Une statistique anciennement utilisée pour
mesurer la consistance interne
d’instruments de mesure où les items sont
dichotomiques (e.g., oui-non)
Cronbach a peut faire le travail aussi, étant
plus versatile
K-R 20 = désuet
Interprétation du coefficient (étendue 0.0 –
1.0) similaire à Cronbach
C’est quoi la Méthode moitié-moitié (split-half de Spearman-Brown)?
On divise en deux le test pour évaluer la
relation entre les deux moitiés
La corrélation r*xx’ nous dit ce que serait la
fidélité si le test était N fois plus long que
ses moitiés
N > 2: prédiction pour test plus long
N < 2: prédiction pour test plus court
C’est quoi la validité interne?
Est-ce que les données sont vraiment dues à ce
qu’on prétend (expérience) ou à ce qu’on
observe (étude)?
Alternativement, est-ce que les résultats ne
dépendent pas d’autres facteurs non contrôlés?
Haut degré de validité interne = empêcher que
des éléments étrangers ou variables parasites
ne contaminent la mise à l’épreuve de
l’hypothèse
Pensez aussi biais
Exemple Question de validité interne: Comment être certain
que l’augmentation de la curiosité intellectuelle ne
serait pas attribuable à l’évolution normale des
enfants et à la nature facilitatrice de leurs activités
préscolaires?
Réponse: groupe contrôle
Comment accroitre la validité interne?
La validité interne tient à la qualité ou à la
solidité du protocole expérimental utilisé et à
l’efficacité et à la rigueur des contrôles
effectués
7 sources d’invalidité à considérer
- Expérience vécue du participant
Événements qui surviennent pendant et entre les
prises de mesures et qui ne dépendent pas de la
manipulation expérimentale (e.g., divorce, perte
d’emploi, nouvelle relation, etc.) - La maturation
Les processus individuels qui se développent en fonction du
passage du temps, tels le vieillissement, la croissance,
l’expérience personnelle, etc.
Des modifications de cette nature se produisent souvent à
l’intérieur de périodes de temps très brèves
Étant donné que ce facteur joue dans toutes études, l’utilisation
d’un groupe témoin provenant de la même population précisera et
contrôlera les effets de la maturation - L’opération de mesure
Le seul fait de répéter un test risque d’influencer les résultats
Les différences observées entre la première mesure et sa
répétition peuvent dépendre simplement de l’opération de mesure
et non du traitement expérimental (naïf vs savant)
Un groupe témoin qui n’est pas exposé à la VI permettra de
préciser cet effet de l’opération de mesure - La constance de l’instrument
Il peut se produire des changements dans la calibration
d’instrument de mesure ou dans la manière dont
l’expérimentateur recueille ses données
E.g., l’emploi d’observateurs: ils peuvent se fatiguer, s’améliorer,
ou empirer!
Le changement observé entre les mesures du pré-test et du
post-test peut donc dépendre de l’instrument de mesure - La régression statistique
Phénomène qui se manifeste surtout quand on choisit des
groupes qui se situent aux extrémités d’une échelle de mesure
En faisant la sélection des participants, l’expérimentateur choisit
ceux-celles qui obtiennent un score très élevé ou très bas à un
moment précis, ce qui ne représente pas la position habituelle de
ces individus
Lors d’évaluations subséquentes, ils auront tendance en tant que
groupe à se rapprocher de la moyenne
S’applique aux construits variables
Les mesures stables moins susceptibles
6.La sélection des participants
Déformations systématiques dans la composition comparative
des groupes expérimentaux et témoins
E.g., étude sur le traitement de la peur des hauteurs. Groupe
expérimental est composé de personnes qui consultent un psy. et
groupe témoin qui provient de la population générale
Le fait que les participants proviennent d’une population différente
peut-être suffisant pour expliquer un changement éventuel
7.La perte de participants (mortalité ou attrition)
Si plusieurs participants d’un même groupe abandonnent, il peut
s’en suivre des effets spécifiques qui ne dépendent aucunement
de la variable expérimentale
Peut entraîner une diminution de la représentativité
Pourquoi un groupe a plus d’abandons qu’un autre?
C’est quoi la validité externe?
Se préoccupe de la possibilité de
généraliser les résultats de l’étude au-delà
de l’échantillon, des circonstances
9 de vos 10 amis vous disent aimer le kale…
devriez-vous investir dans le kale?
4 facteurs importants à considérer
En relation avec les biais
4 facteurs importants à considérer dans la validité externe?
1- La réaction à la mesure
La prise de mesure au cours d’un
pré-test peut contribuer à
augmenter ou diminuer la
sensibilité du participant à l’endroit
de la variable étudiée
Les individus qui savent qu’ils sont
observés vont agir différemment de
ceux qui ne sont pas avertis
Le seul fait de demander
d’observer ou d’enregistrer la
fréquence ou la durée d’un
comportement entraînera une
modification de ce comportement
E.g., Programme pour cesser de fumer
Au pré-test les sujets doivent compter
les cigarettes qu’ils fument ça peut
les sensibiliser au fait qu’ils fument trop
2- Les effets d’interaction d’un ou des
facteurs de validité interne avec VI
Se produit alors qu’un élément
de validité interne co-varie avec
une variable indépendante
E.g., mon ordinateur surchauffe(),
avec la conséquence que les
temps de réactions à ma tâche
sont surestimés plus la journée
avance
Or, malheureusement, une majorité de
participant-e-s du groupe contrôle sont
testé-e-s en après-midi, contrairement
au groupe expérimental
() Constance de l’instrument (due à problème de fidélité)
3- Effets spécifiques liés au
déroulement de l’expérience
Parfois, les particularités de la
démarche expérimentale sont telles
qu’elles incitent les sujets à donner telle
réponse plutôt que telle autre
E.g., un sondage sur l’anxiété liée à
prendre l’avion dont une partie des
répondants l’ont rempli après un
écrasement d’avion médiatisé
Les résultats ainsi obtenus limitent
grandement la portée des conclusions
ou les rendent invalides
4- L’interférence associée à un
traitement multiple
Lorsque plusieurs traitements
sont présentés simultanément, il
devient difficile d’évaluer le
poids relatif de chacun d’eux
E.g., programme pour diminuer le
bégaiement qui inclut la
relaxation, l’imagerie, l’exposition,
etc. Le traitement fonctionne, mais
on ne sait pas à quoi l’attribuer
À moins d’avoir un plan factoriel
C’est quoi la validité écologique?
Contexte dans lequel se déroule
la recherche, y compris les
tâches que les participants
effectueront
Similitude du contexte matériel et du
niveau psychologique avec
l’environnement réel?
E.g., casino en labo - similitude au
niveau du décor physique, mais pas au
plan psychologique
Signification que confère le sujet
à la situation dans laquelle le
chercheur le place ou l’étudie
Pertinence?
C’est quoi la validité de construit et ses 2 approches?
Est-ce que le test mesure bien le construit
tel qu’il est défini par son cadre théorique
de base?
Deux approches
Validité convergente
Validité divergente (ou discriminante)
Validité de construit convergente
Capacité d’une mesure de produire des
résultats semblables à ceux produits par
d’autres mesures qui sont reliées au
construit en question
Consiste à corréler un test avec un critère
approprié
E.g., deux questionnaires d’estime de soi
E.g., deux mesures d’anxiété (l’une par
questionnaire et l’autre par entrevue ou taux
de cortisol)
Validité de construit divergente
Consiste à démontrer que le test n’est pas
significativement corrélé avec des critères
non pertinents
E.g., l’échelle d’intelligence verbale ne corrèle
pas avec l’échelle de narcissisme dans notre
batterie intelligence-personnalité