cours 5: notion de mesure Flashcards
opérationalisation
L’opérationalisation consiste à rendre observable et mesurable le concept qu’on veut étudier.
- Choisir des représentations concrètes du concept
- De nombreuses variables sont difficiles à mesurer avec précision
- Si les variables ne sont pas mesurées avec précision, les résultats des recherches sont faussés!
qu’est-ce qu’une mesure ?
Technique par laquelle des valeurs sont assignées à des objets, à des événements ou à des observations (cité dans Vallerand et Hess, 2000).
niveaux de mesures
▪ Nominale
▪ Ordinale
▪ Intervalles
▪ Proportion
variables catégorielles
réfère à une caractéristique qui n’est pas quantifiable
variables continus
réfère à une caractéristique quantifiable dont les valeurs sont des nombres
mesure nominale
Reflètent des différences qualitatives entre les catégories qui ne peuvent être ordonnées entre elles.
- Simplement juxtaposées sans ordonnancement.
- Valeurs doivent être exhaustives (c.-à-d., couvrir toutes les possibilités)
et mutuellement exclusives (c.-à-d., ne se recoupent pas) - Traitements statistiques limités.
Il s’agit en quelque sorte d’identifier des personnes ou d’étiqueter des objets en leur attribuant une qualité. Cela consiste à catégoriser.
Ex:sexe,religion,languematernelle,oui/non
mesure ordinale
Les valeurs sont des qualités qui peuvent être ordonnées entre elles; hiérarchisées.
- Valeurs doivent être exhaustives et mutuellement exclusives.
- Il s’agit encore d’identifier des personnes ou d’étiqueter des objets en leur attribuant une qualité. Toutefois il est possible de classer les catégories selon qu’elles sont supérieures, égales ou inférieures aux autres valeurs.
EXEMPLES :
Niveau de scolarité :primaire ,secondaire ,collégiale ,universitaire. Le niveau « sécondaire » est supérieur que le « primaire »
Jugement ,appréciation: jamais ,rarement ,parfois ,souvent ,toujours « toujours » est supérieur que « souvent »
OPÉRATIONS
Les catégories peuvent être mises en ordre (système de rangs), mais on ne peut pas quantifier la différence entre ces catégories. On ne peut pas dire “X de plus de” ou “X fois plus de…”
EXEMPLE:
Dans un marathon, la distance entre le premier et le deuxième coureur peut être différente de la distance entre le deuxième et le troisième coureur.
mesures à intervalles
Mesure dont les intervalles entre les nombres sont considérés comme égaux.
- Ils peuvent être additionnés et soustraits.
- Les valeurs sont des nombres déterminés en fonction d’une unité de mesure conventionnelle située sur une échelle qui ne comporte pas de zéro absolu.
- Il est théoriquement possible de mesurer avec une précision infinie l’intervalle entre les valeurs de ce type de variable. Toutefois, il n’est pas possible d’établir un rapport entre les valeurs.
EXEMPLES :
Température, QI, total des scores sur une Échelle de Likert
OPÉR ATIONS
Les differences entre les categories sont les mêmes sur l’echelle. On peut les aditionner ou soustraire
mesures à proportions (rapport)
Les valeurs sont des nombres qui représentent la quantité réelle de la caractéristique mesurée.
- L’échelle a un zéro absolu qui a une signification empirique: indique l’absence de la dimension mesurée.
Il y a un zero naturel. - Il est théoriquement possible de mesurer avec une précision infinie l’intervalle entre les valeurs de ce type de mesure.
- Les nombres peuvent être soumis à toutes les opérations mathématiques.
EXEMPLE :
Salaire : Un salaire de 20,000 est le double d’un salaire de 10,000
Âge: Une persone âgée de 60 ans a le triple de l’âge d’une personne de 20 ans.
Nombre d’individus: Il y a 10 x plus d’individus au festival cette années que l’année passée.
Le poids ,le volume ,la durée ,la longueur
Comment on mesure un concept
Questionnaire auto- rapporté
* « Quel est votre niveau de stress? »
Observation du couple en conflit
* Compter le nombre de comportement indiquant le stress
Mesure physiologique
* Mesurer le niveau de cortisol dans le sang
type d’instrumentant
1) Appareils
* Recherche de corrélats physiologiques aux événements psychologiques (Outils
psychophysiologiques)
2) Entrevues
* Communication verbale entre un chercheur et des participants pour recueillir des données
3) Techniquesd’observation
* Observation systématique des comportements
4)
Tests et Questionnaires
✓ Tests
* Situations standardisées objectives (toujours administrées et corrigées de la même façon)
* Normalisées statistiquement (situe la performance de l’individu par rapport à celle d’un groupe d’individus comparables)
✓ Questionnaires
* Instruments permettant de recueillir, par écrit, de l’information factuelle sur des individus, des situations, ou
encoresurdesattitudes,descroyances,des intentions,etc.
* Standardisées, mais généralement non normalisées
qu’est-ce que permettent les mesures psychophysiologiques ?
Permettent d’établir une relation entre certains aspects de l’activité de l’organisme et un ou plusieurs processus psychologiques.
Complètent les mesures comportementales ou verbales
Offrent une information additionnelle, susceptibles de refléter certains processus internes qui
demeureraient autrement inaccessibles.
EXEMPLE:
Activité cardiovasculaire, électrodermale, musculaire, niveau de cortisol
les avantages des mesures psychophysiologique
Enregistrement des mesures automatique
Évite les manipulations de la part de l’expérimentateur donc peu affecté par le biais de l’expérimentateur et celui du sujet
les inconvénients des mesures psychophysiologique
Coût à l’achat et à l’entretien
Expertise spécialisée requise
Encombrant
Difficile à calibrer (s’assurer qu’on part toujours de la même mesure)
Défi: Est-ce que je mesure ce que je veux mesurer? EX: Polygraphe « détecteur de mensonges “
qu’est-ce qu’un entrevue
Communication verbale chercheur/participants pour recueillir des propos en lien avec les hypothèses de recherche.
Différentes approches (structurées, semi-structurées ou non-structurées)
Analyses de contenu (qualitatives ou quantitatives)
Différents formats
En personne, par téléphone, par visioconférence (ex.: Zoom, Teams) Individuelleouentrevuedegroupe(focusgroup)
* Prise de notes + enregistreuse
un entrevue structuré
- Serie de questions posées dans un ordre prédéterminé
- Participant choisi parmi les réponses proposées (ex.; echelle Likert)
un entrevue semi-structuré
- Série de questions prédéterminées, mais qui permet, à certains moments, d’approfondir un thème particulier
un entrevue non-structuré
- Entrevue sur un thème, mais peut suivre des pistes variables selon le jugement de l’évaluateur.trice.
- Questions surgissent au fil des échanges
les avantages des entrevues
Erreur d’interprétation plus facilement détectable
Conviennent à presque tous, peu importe le niveau de scolarisation
Plus efficaces pour les thèmes complexes et chargés d’émotion ainsi que de nouveaux thèmes
Si par téléphone ou visioconférence: moins coûteux qu’en personne, réponses obtenues
rapidement, fort taux de réponse, rejoint des gens dispersés géographiquement
les inconvénients des entrevues
Introduction potentielle de biais par le chercheur
Et par le participant aussi: Désirabilité sociale
Temps et coûts très élevés par rapport au questionnaire
Échantillon restreint
Analyse des données plus difficile, longue, fastidieuse.
qu’est-ce qu’un protocole à voix haute ?
Méthode qui consiste à demander aux participant.es de réfléchir à voix haute pendant la résolution d’une tâche ou la complétion d’un questionnaire.
Permet “d’avoir accès” aux pensées dès qu’elles se présentent à l’esprit du participant
Reduit le rappel biaisé de l’information
Il faut créer une grille de codification, qui est laborieux.
les techniques projectives
Méthode qui consiste à évaluer un état psychologique interne que la personne elle-même peut-être pas consciente.
L’individu projette ses propres perceptions et visions sur un objet donné.
Exemple:
Test de Rorschach
TAT (Thematic Apperception Test)
Interpretation subjective du chercheur/experimentateur
Problème pour la validité/fiabilité?
L’observation
Méthode de collecte utilisée pour étudier les comportements de manière systématique, objective et sans biais.
Consignation des observations par vidéo et/ou grille d’observation.
PRÉREQUIS
1. Le construit peut être observé et opérationnalisé en comportements
2. Le contexte doit permettre l’observation.
3. Avoir une compréhension suffisamment précise du construit qu’il faut examiner
les types d’observations
Structurée/non structurée avec ou sans grille d’observation comportant des catégories
d’éléments prédéterminés à observer.
Participante (le chercheur est actif) / non participante (le chercheur est passif) en fonction du rôle de l’observation.
Contexte
Laboratoire
Milieu naturel
Milieu semi-naturel
les avantages des techniques d’observation
- Permet de comparer ce que les répondants font et ce qu’ils disent qu’ils font
- Permet d’enregistrer des comportements au moment où ils se produisent.
- Permet d’enregistrer des comportements que les répondants n’auraient pas mentionnés en entrevue ou sur un questionnaire
les inconvénients des techniques d’observation
- Parfois difficile d’anticiper les évènements et d’être préparé à observer. Évènements de longue durée difficile à observer.
-Important biais de l’expérimentateur. Objectivité difficile à conserver avec l’observation participante
- Influence de la procédure sur les données enregistrées
-Certains comportements trop privés ou personnels pour être observés
-Données difficiles à analyser
la validité écologique de l’observation
Représente à quel point le contexte expérimental est représentatif du contexte d’intérêt
Correspondance entre les comportements observés pendant l’étude et ceux émis en milieu naturel.
EXEMPLE:
« Résolution de conflits chez les couples »
En quoi les contextes de laboratoire et la réalité sont-ils différents?
contexte de milieu naturel pour l’observation
Observation dans le contexte réel des comportements.
Avantage: Excellente validité écologique
Désavantages:
Aucune garantie que les comportements seront émis. N’est pas propice aux comportements rares.
Manque de contrôle sur la situation.
ex:
Enregistrer un couple chez eux et attendre qu’un conflit surgissent naturellement.
contexte de milieu semi-naturel pour l’observation
Création d’une situation artificielle, mais à l’intérieur du milieu habituel ou qui tend à répliquer le milieu naturel.
Avantage:
Relativement bonne validité écologique.
Permet de provoquer l’apparition de comportements rares. Contrôle possible sur les paramètres de l’expérience.
Désavantages: Exige des efforts supplémentaires
ex: Observer un couple chez eux et leur demander de discuter d’un sujet de conflit récurent pour eux.
contexte de milieu contrôlé/laboratoire pour l’observation
Création d’une situation artificielle à l’intérieur d’un milieu controlé, soit le laboratoire.
Avantage: Contrôle possible sur les paramètres de l’expérience.
Désavantages: Faible validité écologique
ex:
Inviter un couple au laboratoire et leur demander de discuter d’un sujet.
type de modalité de l’observation
Observation directe
Les participant.es savent qu’ils sont observe.es et peuvent réagir à cette présence.
Solution : Faire durer les observations pour que le participant s’habitue.
Observation indirecte
Les participant.es ne savent pas qu’ils sont observé.es.
Il faut obtenir leur consentement après (utilisation de duperie).
les types d’encodages de l’observation
Encodage continue
L’encodage se déroule sans interruption du début à la fin de la séquence d’observation.
Avantage: Beaucoup de données
Désavantages:
Beaucoup de données… gestion difficile
Si on n’enregistre pas, l’encodage en temps reel demande de l’effort.
Encodage par échantillonnage
L’encodage se déroule selon un intervalle de temps dont la durée et la fréquence sont déterminées à l’avance.
L’intervalle peut être appliqué à l’intérieur même d’une période d’observation et/ou sur une période plus longue.
Permet l’obtention d’un portrait statistique du comportement moyen.
Encodage discontinu
Fournit une estimation de l’occurrence du comportement en l’échantillonnant à des intervalles prédéterminés.
Noter si le comportement en question s’est produit au moins une fois au cours de chaque intervalle.
L’observateur note un “oui” ou un “non” pour chaque intervalle, indiquant si le comportement a été observé ou non.
les étapes de conception d’un questionnaire
- Délimitation de l’information pertinente à recueillir
- Formulation des questions
- Séquençage des questions et format du questionnaire
- Rédaction de l’introduction et des directives
- Révision de l’ébauche du questionnaire
- Pré-test du questionnaire
- Modifications au besoin
- Validation
principe généraux pour la formulation des questions
✓ Ne retenir que les questions nécessaires
✓ S’assurer de tout couvrir. Par exemple, faire un tableau de correspondance entre les questions du questionnaire et les questions/hypothèses de recherche.
✓ S’assurer que les répondants ont l’information nécessaire pour répondre
✓ N’adresser qu’un sujet par question
*
Phrases courtes, claires et faciles à comprendre
✓ À éviter:
o Formulations ambigües, confuses et vagues, des mots portant à interprétation
o Double négation ex: êtes-vous en désaccord avec ceux qui ne veulent pas…
o Argot, jargon, termes techniques, abréviations non développées
Langage neutre, impersonnel
✓ À éviter:
Fausses prémisses: Questions biaisées, tendancieuses, suggérant des réponses (p.ex., que pensez-vous des améliorations apportées à la formation?)
séquençage de question pour les questionnaires
- Du plus général au plus spécifique
- Ne pas changer l’ordre des questions en cours d’étude; l’ordre peut influencer les réponses
- Commencer par les questions suscitant l’intérêt
La 1re peut influencer le taux de réponse! - Regrouper les questions par thématique
- Questions ouvertes à la fin des sections thématiques
- Penser à l’effet résiduel!
les questions ouvertes
Réponses «libres» sans choix prédéterminés
Particulièrement utiles en recherche exploratoire pour des questions complexes
Ex: À votre avis, quelles sont les caractéristiques d’une vie épanouie?
les avantages des questions ouvertes
- Stimulent la pensée libre
- Favorisent l’exploration en profondeur
- Permettent de découvrir des résultats non anticipés
les inconvénients des questions ouvertes
- Désavantagent les personnes moins articulées
- Prennent plus de temps à répondre * Plus difficiles à analyser
- Plus volumineuses
les questions fermés
Choix de réponses prédéfinis
À utiliser lorsque l’étendue des réponses est connue et limitée
Principes:
Exhaustivité
Exclusivité mutuelle
Courtes
Dans un ordre logique
les types de questions fermés
Question dichotomique: Choix d’une réponse parmi deux choix.
EXEMPLE: Avez-vous déjà eu des consultations ou reçu des soins en psychothérapie? □Oui□Non
Question à choix multiples: Choix d’une réponse parmi plusieurs choix. EXEMPLE: Quelle est votre langue maternelle? (1 seul choix)
□ Français □ Anglais □ Espagnol □ Autre
Question à réponses multiples: Choix de plusieurs réponses parmi plusieurs choix
EXEMPLE: À quel(s) service(s) avez-vous déjà eu recours? (Cochez toutes les réponses qui s’appliquent)
Question à réponses multiples hiérarchisées : Hiérarchisation des choix de réponses.
EXEMPLE: Pour vous, quels sont les éléments les plus importants dans la vie d’un couple? Classez par ordre
d’importance les items suivants (1 étant le plus important et 5 le moins important)
qu’est-ce qu’un échelle ?
Index du construit psychologique que l’on désire mesurer
Différents types d’échelle
Thurstone
Différentiateur sémantique
Analogie visuelle
Likert
L’échelle de Thurstone
Propositions (items) ordonnées sur un continuum allant de l’attitude la plus favorable à la plus défavorable. Élaboration d’une échelle de Thurstone:
1. Élaborationd’énoncés
2. Classementpardesjuges
3. Déterminer la position de chaque énoncé
4. Sélectionner les meilleurs énoncés pour chaque position
1- Commencer par élaborer une grande quantité d’énoncés face à un même thème
Ex. Le divorce est scandaleux; une personne devrait avoir le droit de se marier ou de divorcer aussi
souvent qu’elle le voudrait).
2- Demander à plusieurs juges de classer individuellement chaque énoncé sur un continuum de 11 points
1 = Propositions acceptées par les personnes les plus défavorables au divorce 2 = Propositions acceptées par les personnes les plus en faveur au divorce
3-
* Sélectionner 2 énoncés pour chacune des 11 positions du continuum (Total de 22 énoncés).
* Calculer le score du répondant en additionnant les valeurs (1 à 11) des énoncées avec
lesquels il est en accord.
L’échelle d’Osgood
Permet de situer l’opinion d’un participant sur un continuum dont les extrémités sont définies par des adjectifs antagonistes défavorables.
EXEMPLE:
Pour chacune des échelles, faites un X au niveau qui correspond le mieux à votre opinion par rapport à l’énoncé suivant “Naviguer sur Internet c’est:”
- de ennuyeux à passionnant
échelle avec analogie visuelle
Positionnement sur un continuum représentant différents degrés d’une attitude
EXEMPLE: Quelle importance représente l’apparence physique dans votre décision de fréquenter quelqu’un? (Faites un X au niveau qui correspond le mieux à votre opinion)
- de important à pas important
échelle de Likert
Mesurer l’attitude en demandant au participant d’indiquer son niveau d’accord avec une série d’énoncés. L’échelle la plus utilisée en psychologie.
PROCÉDURE
Un effort laborieux doit être mis en oeuvre afin de créer et valider les énoncés. Le score est calculé en examinant le niveau d’accord moyen.
L’erreur de mesure
La différence entre la valeur donnée par la mesure et la valeur exacte
Exemple: La valeure indiquée par une balance vs le poids réel de la personne
Valeur observée = valeur réelle + erreur
une erreur non-systématique ou aléatoire
- Elle ne se contrôle pas!
- Caractéristiques des participant.es
(motivation, personnalité, …) - Le hasard
une erreur systématique
Elle se contrôle et il faut la corriger!
* Liée aux caractéristiques de la mesure
* Questions mal formulées, calcul des scores
On veut alors contrôler le plus possible l’erreur de mesure systématique
On veut que les valeurs rapportées par l’Instrument soit le plus proche possible de la réalité.
Une bonne mesure est valide et fiable= VALIDITÉ EXTERNE
les qualités d’un bon instrument
Chaque instrument peut être évalué sur deux dimensions:
Fiabilité
* Précision de l’instrument peu importe ce qu’il mesure.
* Produit-il une mesure constante si les conditions sont les mêmes?
Validité
* Est-ce que l’instrument mesure ce qu’il doit mesurer?
la fiabilité sans la validité
Exemple: la règle
La règle est une mesure fiable, mais elle n’est valide que pour mesurer une longueur.
ex: ne peut pas mesurer la quantité d’eau dans un verre
les 3 différents types de fiabilité:
Fiabilité temporelle (test-retest): stabilité temporelle de la mesure
Fiabilité interne (consistance ou cohérence interne): homogénéité des énoncés
Fiabilité interjuges: Accord entre deux juges (ou plus)
la fiabilité temporelle (test-retest)
Corrélation entre les résultats de deux passations espacées dans le temps.
La qualité de l’estimation dépend de la quantité de changements survenus chez nos participants
entre les deux passations.
Exemple :
Mesure de l’estime de soi.
Administration de l’échelle de Rosenberg à deux reprises
- juste pertinent pour les principes où la stabilité temporelle est importante ex: Ex: Trait personnalité, estime de soi.
Pas récommendé: émotions, humeur
la fiabilité inter-juges
Mesure de l’accord entre plusieurs juges différents. Corrélation entre les résultats des juges.
Exemple: 3 juges experts doivent évaluer un comportement en utilisant une échelle de pertinence 1 à 10 de type Likert.
On réfère au kappa de cohen, qui est une méthode statistique pour évaluer le niveau d’accord entre deux juges.
la fiabilité interne
- Utilisé afin de déterminer à quel point les items d’une échelle mesurent la même dimension sous- jacente.
- Degré d’homogénéité des énoncés du test ou d’une section du test - corrélation entre les items. * Le coefficient Alpha de Cronbach est le meilleur indice de consistance interne.
L’Alpha de Cronbach est un chiffre qui varie la plupart du temps entre 0 et 1; plus il s’approche de 1, plus la consistance interne est bonne.
<0,60 = inacceptable
0,60-0,65 = indésirable
0,65-0,70 = minimum acceptable 0,70-0,80 = respectable
0,80-0,90 = très bons
>0,90 = Les items sont peut-être redondants; on peut penser à réduire le nombre d’items.
la validité de la mesure
La validité d’un test a pour objectif de préciser ce que le test mesure et avec quel degré d’exactitude il le fait.
3 grands types de validité qui peuvent contenir eux-mêmes des subdivisions
Validité de contenu: liée à la représentativité de l’échantillon d’items du test.
Validité de critère: liée à la relation du test avec un ou des critères externes
Validité de construit: liée à la cohérence du test avec la théorie entourant le construit
la validité de contenue
Réfère à la représentativité des items échantillonnés (retenus dans le test) pour mesurer un construit (concept, thème) donné.
Est généralement examinée lors de la construction du test (choix approprié d’items).
Est généralement estimée par la méthode des “juges experts” (analyse qualitative).
Contrairement aux autres types de validité, la validité de contenu n’est pas basée sur les réponses des sujets au test.
la validité de critère
Efficacité empirique d’un test à prédire la performance d’un individu sur un critère concret d’intérêt, critère extérieur au test et indépendant du score au test.
Exemple:
- Est-ce que le Female Sexual Function Index (FSDI) permet de distinguer les femmes ayant des dysfonctions sexuelles de celles qui n’en ont pas.
la validité de critère, les types de critères
Actuel: critère qui existe actuellement; qui sera mesuré en même temps (validité concomitante)
Exemple: Évaluer au même moment la motivation et le nombre d’heure d’étude
Futur: critère qui, sans exister actuellement, existera dans le futur de l’individu examiné (validité
prédictive)
Exemple: mesurer la motivation scolaire (Échelle motivation en éducation) dans un moment et les notes des étudiants trois mois après. Si les deux résultats sont corrélés, on pourrait dire que la motivation scolaire prédit les notes scolaires.
La validité de construit
La validité de construit vise à répondre à la question suivante: Est-ce que les résultats qui découlent de mon questionnaire décrivent clairement les phénomènes d’intérêt?
La validité de construit d’un test sera plus facilement réalisable si la théorie sous-jacente est bien définie et bien explicite.
La validité de construit peut être évaluée par l’analyse factorielle, la cohérence interne, la validité de convergence et la validité discriminante.
la validité convergente
On s’attend à une corrélation élevée entre le test à valider et un autre test qui mesure le
même construit.
On s’attend à une corrélation modérée/élevée entre le test à valider et un test mesurant un construit proche (théoriquement relié).
Validité discriminante
On s’attend à ce qu’il n’y ait pas de corrélation entre le test à valider et un autre test
mesurant un construit différent (non relié théoriquement).
la qualité d’un bon instrument
La validité et la fiabilité sont deux concepts différents, mais étroitement liés.
Une mesure peut être fiable sans être valide, mais elle ne peut difficilement être
valide sans être fiable.
La fiabilité d’un test limite sa validité
le choix de l’instrument
1) Conception théorique (validité et fiabilité)
2) Types de sujets abordés (ex: les sujets délicats)
3) Caractéristiques de la population cible (ex: habiletés à lire et écrire)
4) Réputation; fait-elle “consensus” dans la littérature scientifique?
5) Ressources humaines, financières et de temps
6)
7)
Coût/disponibilité
Objectifs de recherche et niveau de connaissances:
Niveau exploratoire-descriptif: observations, entrevues non ou semi-structurées, questionnaires semi-structurés, etc. Niveau explicatif : questionnaires, entrevues structurées
Niveau prédictif : méthodes plus structurées, appareils, tests normalisé