fidelité, validité, contrôle Flashcards
fidelité (3)
précision de l’instrument peu importe ce qu’il mesure
son application entraîne toujours des résultats semblables
absence d’erreur de mesure
trois types de fidelité
- stabilité temporelle
- équivalence
- homogénéité
stabilité temporelle
Se détermine sur la base de la constance des résultats obtenus à la suite d’applications répétées de l’instrument
Habituellement, on a recours à 2 administrations de l’instrument Cette technique s’appelle fidélité testretest
quand utiliser le test-retest?
Recommandé pour des construits qui possèdent une stabilité temporelle
E.g., traits de personnalité, intelligence
Peu recommandé pour :
Des tests de type situationnel qui mesurent un état passager
E.g., émotions, humeur
Des tests qui sont influencés par la mémoire ou l’apprentissage
Équivalence
Consistance des résultats obtenus à la suite de l’utilisation soit de différents instruments visant la mesure de la même caractéristique (p. ex., 16PF formes A et B) ou soit d’un même instrument où l’observateur est une source possible d’erreurs
Si plusieurs observateurs sont impliqués, l’indice d’équivalence peut être le pourcentage d’accord interjuges (coefficient Kappa) Si ce sont des questions de tests, l’indice d’équivalence est un coefficient de corrélation entre les réponses à des échantillons de questions des deux instruments Acét
Homogénéité (ou consistance interne)
C’est le degré de consistance qu’offrent les réponses d’un individu aux questions variées d’un test
S’intéresse à la probabilité qu’un (des) item(s) mesure(nt) autre chose que ce qui est prévu
Différents outils statistiques mesurent l’homogénéité
alpha de cronbach
Une statistique fréquemment utilisée pour mesurer la consistance interne d’instruments de mesure
Interprétation de alpha de cronbach (6)
a < 0,60 → inacceptable
a entre → 0,60 et 0,65 indésirable
a entre → 0,65 et 0,70 minimalement acceptable
a entre → 0,70 et 0,80 respectable
a entre → 0,80 et 0,90 très bien
a > 0,90 → excellent
formule 20 de kuder-richardson (K-R 20)
Une statistique anciennement utilisée pour mesurer la consistance interne d’instruments de mesure où les items sont dichotomiques (e.g., oui-non)
Cronbach a peut faire le travail aussi, étant plus versatile
K-R 20 = désuet
K-R 20 = désuet
Interprétation du coéficient (étendue 0.0 1.0) similaire à Cronbach
Une statistique anciennement utilisée pour mesurer la consistance interne d’instruments de mesure où les items sont dichotomiques
Formule 20 de Kuder-Richardson (K-R 20)
Méthode moitié-moitié (split-half de Spearman-Brown)
On divise en deux le test pour évaluer la relation entre les deux moitiés
La corrélation nous dit ce que serait la fidélité si le test était N fois plus long que ses moitiés
N > 2: prédiction pour test plus long N < 2: prédiction pour test plus court
4 types de validité
- interne
- externe
- écologique
- de construit
validité interne
Est-ce que les données sont vraiment dues à ce qu’on prétend (expérience) ou à ce qu’on observe (étude)?
Alternativement, est-ce que les résultats ne dépendent pas d’autres facteurs non contrôlés?
Haut degré de validité interne = empêcher que des éléments étrangers ou variables parasites ne contaminent la mise à l’épreuve de l’hypothèse
Pensez aussi biais (cours 6)
la validité interne tient à (2)
la qualité ou à la solidité du protocole expérimental utilisé et à l’efficacité et à la rigueur des contrôles effectués
7 sources d’invalidité à considérer
- expérience vécue du participant
- la maturation
- l’opération de mesure
- la constance de l’instrument
- la régression statistique
- la sélection des participants
- la perte de participants
- Expérience vécue du participant
Événements qui surviennent pendant et entre les prises de mesures et qui ne dépendent pas de la manipulation expérimentale (e.g., divorce, perte d’emploi, nouvelle relation, etc.)
- La maturation
Les processus individuels qui se développent en fonction du passage du temps, tels le vieillissement, la croissance, l’expérience personnelle, etc.
Des modifications de cette nature se produisent souvent à l’intérieur de périodes de temps très brèves Étant donné que ce facteur joue dans toutes études, l’utilisation d’un groupe témoin provenant de la même population précisera et contrôlera les effets de la maturation
- L’opération de mesure
Le seul fait de répéter un test risque d’influencer les résultats
Les différences observées entre la première mesure et sa répétition peuvent dépendre simplement de l’opération de mesure et non du traitement expérimental (naïf vs savant) Un groupe témoin qui n’est pas exposé à la VI permettra de préciser cet effet de l’opération de mesure
- La constance de l’instrument
Il peut se produire des changements dans la calibration d’instrument de mesure ou dans la manière dont l’expérimentateur recueille ses données
E.g., l’emploi d’observateurs: ils peuvent se fatiguer, s’améliorer, ou empirer!
Le changement observé entre les mesures du pré-test et du post-test peut donc dépendre de l’instrument de mesure
- La régression statistique
Phénomène qui se manifeste surtout quand on choisit des groupes qui se situent aux extrémités d’une échelle de mesure
En faisant la sélection des participants, l’expérimentateur choisit ceux-celles qui obtiennent un score très élevé ou très bas à un moment précis, ce qui ne représente pas la position habituelle de ces individus
Lors d’évaluations subséquentes, ils auront tendance en tant que groupe à se rapprocher de la moyenne S’applique aux construits variables Les mesures stables moins susceptibles
- La sélection des participants
Déformations systématiques dans la composition comparative des groupes expérimentaux et témoins
E.g., étude sur le traitement de la peur des hauteurs. Groupe expérimental est composé de personnes qui consultent un psy. et groupe témoin qui provient de la population générale
Le fait que les participants proviennent d’une population différente peut-être suffisant pour expliquer un changement éventuel
- La perte de participants (mortalité ou attrition)
Si plusieurs participants d’un même groupe abandonnent, il peut s’en suivre des effets spécifiques qui ne dépendent aucunement de la variable expérimentale
Peut entraîner une diminution de la représentativité Pourquoi un groupe a plus d’abandons qu’un autre?
Validité externe
Se préoccupe de la possibilité de généraliser les résultats de l’étude au-delà de l’échantillon, des circonstances
9 de vos 10 amis vous disent aimer le kale… devriez-vous investir dans le kale?
4 facteurs importants à considérer validité externe
1- la réaction à la mesure
2- les effets d’interaction d’un ou des facteurs de validité interne avec VI
3- Effets spécifiques liés au déroulement de l’expérience
4- l’interférence associée à un traitement multiple