Stabilité Flashcards
La variance
Écart-type au carrée.
La moyenne des carrés des écarts à la moyenne du score de tous les individus.
Sert à déterminer la distance moyenne (au carré) des données par rapport à la moyenne.
La covariance
Mesure du degré d’association entre deux variables.
- À quel point une donnée occupe la même position dans deux distributions de variables différentes.
- À quel point les variables changent ensemble.
- Comment une variable évolue par rapport à l’autre
Difficile à interpréter car pas standardisé
La corrélation
Exprime la même chose que la covariance, mais par une métrique standardisée (le chiffre ne varie qu’entre -1,00 et +1,00)
- Covariance standardisée en corrélation
Objectifs de la stabilité dans modèle de la cible
- Vérifier la nature et l’ampleur de l’erreur
* Établir la stabilité interne et temporelle
Moyens utilisés pour vérifier la stabilité dans le modèle de la cible
- Erreur-type de mesure
- Analyses d’items
- Analyses corrélationnelles
- Approche hypothético-déductive
- Accord inter-juges
Erreur de mesure
- Les résultats que nous obtenons à l’aide de nos instruments s’accompagnent d’erreur de mesure
- La « vraie vérité » est donc mélangée avec « du bruit »
Grande échantillon diminue erreur de mesure
Trois moyens d’estimer l’erreur de mesure (aléatoire)
- Stabilité interne
- Cohérence interne
- Accord interjuges
Principe de base (stabilité)
Le phénomène que l’on veut mesurer est relativement stable dans le temps.
Stabilité temporelle
Si le phénomène est stable, deux mesures prises à l’intérieur d’un délai devraient se ressembler.
• Pas nécessairement identique mais similaire pour avoir consistance
Moyens mesurer stabilité temporelle
- Corrélation test-retest
* Corrélation test-retest avec formes parallèles
Corrélation test-retest
• La qualité de l’estimation dépend de l’intervalle de temps entre les deux passations et des changements survenus chez les participants durant cette période
o Une personne qui a beaucoup confiance en elle-même au temps 1 devrait avoir beaucoup confiance en elle-même au temps 2
o Une personne qui a peu confiance en elle-même au temps 1 devrait avoir peu confiance en elle-même au temps 2
• Délai trop court : effet de mémoire
• Délai adéquat : souvent plusieurs mois (pour effet de mémoire sois dissiper) mais dépend de ce qu’on cherche à mesurer
• Délai trop long : habituellement traits devrait être stables peut avoir changements traits si délai trop long
o Ex : test personnalité 10 ans plus tard peut avoir changements (erreur aléatoire ou du aux changements personnes ??)
Corrélation test-retest avec formes parallèles
• La corrélation test-retest avec formes parallèles est la manière d’estimer la stabilité temporelle sans l’effet « néfaste » de la mémoire
• La qualité de l’estimation dépend alors:
o De la qualité du parallélisme entre les deux versions
o De l’intervalle de temps entre les deux passations (p. ex. des changements sont survenus chez nos participants durant cette période)
2 versions en même temps ou temps différents
à Pas effet de mémoire car pas même version
Qualité du parallélisme
On considère parallèles les deux formes d’un même instrument lorsque:
• Les items sont très similaires (mais pas identiques) ;
• Le nombre d’items est le même ;
• La structure dimensionnelle est la même ;
• Les mêmes directives d’administration sont en vigueur ;
• Les deux formes génèrent des résultats avec des moyennes et écart-types équivalents.
Avantages vs inconvénients parallélismes
Avantages:
- Élimination effet mémoire
- 2 formes peuvent être administrés en même temps
Inconvénients:
- Rédiger 2x plus d’items
- Validation de 2 instruments
- Faut s’assurer que les 2 formes demeurent parallèles
Cohérence interne
- Postulat : si le construit existe de manière stable, il se manifestera de la même manière (stable) à travers toutes les réponses d’un participant
- Le terme « cohérence interne » fait référence à la logique sous-jacente à la manière dont les participants répondent aux items
Moyens utilisés pour mesurer la cohérence interne
- Corrélation « split-half »
* Alpha de Cronbach
La corrélation split-half
- On sépare le test en deux et on vérifie la corrélation entre les deux versions « artificielles »
- Il devrait y avoir une corrélation élevée entre les deux moitiés si les réponses des participants sont stables
- Peut parfois être utilisé comme mesure artificielle de fiabilité test-retest (mais pas recommandé)
• Division artificielle voir si 2 parties corrèlent ensemble
o Ex: nombre pair et impair
Éviter biais de fatigue (items vers la fin moins bien répondu par effet de fatigue)
La corrélation de split-half de spearman-brown
Correction permet enlever sous-estimation dû à moitié moins d’items.
Formule de la prophétie
• Cette formule permet d’estimer combien d’items il faudrait pour obtenir un « split-half » de X
La logique sous-jacente à la formule de prophétie suppose:
• Que les items qui sont ajoutés mesurent la même chose que les items initiaux
• Que la moyenne des intercorrélations entre les items initiaux soit égale à la moyenne des intercorrélations du total des items (soit les items ajoutés + les items initiaux)
• Prend pour acquis ajouter items similaires aux précédents (autant bon ou mauvais)
Alpha de Cronbach
• Indique dans quelle mesure les items du test mesurent une seule chose
• C’est un chiffre qui varie entre -∞ et 1 (la plupart du temps il varie entre 0 et 1);
o Si - = désastreux (pas interprétable (alpha))
• Plus il s’approche de 1, plus la fiabilité est bonne
• Ce n’est pas un indice de corrélation
o Permet seulement juger fidélité instrument
Plus il y a d’items et grande moyenne plus valeur alpha Cronbach va être élevé
Accord interjuges
Si le phénomène se manifeste avec régularité, tous les juges devraient donc observer le même phénomène
2 évaluateurs évaluent un test et compare les 2 évaluations
Moyens mesurer l’accord interjuges
- Corrélations effectuées sur des cotes
2. Kappas effectués sur la catégorisation ou la fréquence faite par les juges
Critères juger fiabilité
(Si +0,95 = suspect pour cohérence interne)
Excellente: 0,90 et +
Modérée: 0,80-0,89
Acceptable: 0,70-0,79
Inacceptable (parfois utilisé en recherche): 0,60-0,60
Inacceptable: - de 0,60
Erreur-type de mesure
- L’ETM montre l’effet de la fiabilité sur un score généré par l’instrument.
- Plus l’ETM est grand, plus il y a d’erreur dans le score observé
- Il est possible de calculer un intervalle de confiance autour du score observé
Intervalle de confiance
L’intervalle de confiance sert à estimer, en fonction de l’erreur-type de mesure, du score observé et d’un niveau de certitude désiré, dans quel intervalle se situe le score réel d’un participant.