Séance 13 : La corrélation Flashcards
Quel est le point commun entre les tests effectuées jusqu’à présent?
Nous nous intéressons toujours aux différences de moyennes. On manipule toujours une variable indépendante et on regarde l’effet sur la variable dépendante.
Sur quoi on va s’attarder à partir de maintenant (corrélation et régression)?
Sur les RELATIONS qui peuvent exister entre les variables :
- Observation du lien entre 2 phénomènes (aucune manipulation expérimentale -> pas de manipulation de la VI requise (parfois m pas de participants))
- Ne permet pas d’établir de relation causale (on ne peut pas dire que x a causé y ou vice versa… seulement si relation entre les 2)
Exemples de variables sans lien causal dont on peut observer le lien entre
ex: comparer réponses entre choix de réponses et développement
ex: comparer la taille et le poids (pas un qui cause l’autre, sont réciproques, mais liés)
Qu’est-ce que la corrélation?
Statistique qui permet d’estimer le degré de
relation entre 2 variables (généralement mesurée sur les
mêmes individus*).
- Pas toujours les mêmes individus (p. ex., relation entre la prise de poids
chez la mère pendant la grossesse et le poids du bébé à la naissance).
Que sont les deux caractéristiques de la relation qu’on estime?
Estime la direction (ou sens) (positive ou négative) et la force (faible, modérée, forte) de la relation
entre 2 variables.
Par quoi on peut remplacer les termes VI et VD?
par « variables corrélées » ou
« corrélats », ce qui diminue le risque
d’interprétations erronées
Qu’est-ce que le postulat de causalité?
Pour déterminer qu’un phénomène en cause un
autre (lien causal), il faut respecter trois conditions
logiques:
- Variable X et variable Y doivent être interreliées (condition de relation).
- La cause doit précéder l’effet (condition
d’antécédence temporelle).
3.La relation entre X et Y ne doit pas être
expliquée par une troisième variable confondante (AUSSI APPELÉE MÉDIATRICE)
(condition d’absence d’explications alternatives).
=> je dois m’assurer que la seule chose qui change soit le traitement (ex: notes entre lingu et psuy… seule diff doit être le programme d’étude … RARE)
Donne 3 exemples de situations où une variable médiatrice intervient (x peut pas être expliqué à cause de y et vice versa)
ex: lien entre vente
de crèmes glacées
et noyades…
variable médiatrice = température (qd il fait beau, gens fréquentent plus les piscines et la plage et mangent + de crème glacée)
ex: lien entre nbr bars et d’églises
var. méd : nbr d’habitants
ex: lien entre nbr nids de cigognes et
le nbr de naissances dans une ville
var.med: milieu de vie (ds milieux ruraux, nbr naissance plus élevés, mais aussi plus nature donc plus cigognes)
Lesquelles conditions sont remplies par la corrélation? Cela veut dire quoi?
La seule condition remplie par la
corrélation est la condition 1
- pas respectée, car desfois diff a voir laquelle vient avant (ex: motivation et notes scolaires…) est-ce sa motivation influence sa performance ou sa performance sa motivation?
- pas toujours respectée non plus (voir autre question des exemples)
Qu’exprime la corrélation?
La corrélation exprime de façon quantitative la force d’une
relation linéaire entre deux variables mesurées sur un
même groupe d’individus.
La corrélation est une mesure descriptive ou inférentielle?
Les deux, la corrélation est d’abord une mesure descriptive (nous informe à propos de la relation dans l’échantillon
seulement (direction et force))., mais
elle peut également être utilisée comme statistique
inférentielle (lorsqu’on veut savoir est-ce que cette corrélation reflète une relation réelle
dans la population ou si elle provient du hasard ? => est-elle généralisable)
Exemples de corrélations.
Lien entre la taille et la pointure de souliers (monte, monte)
Lien entre le nombre d’heures d’étude et le score à l’examen (monte, monte)
Comment représente-t-on le lien entre 2 variables?
La façon dont 2 variables sont reliées entre elles peut être représentée à l’aide d’un diagramme de
dispersion (aussi appelé nuage de points; scatterplot en anglais).
Le diagramme est composé des
variables X et Y.
Chaque individu est représenté par
un point dont la position cartésienne
est représentée par (Xi, Yi).
Quand y a t’il corrélation parfaite?
Quand tous les points sont alignés sur une droite
Qu’est-ce que la corrélation sur le nuage?
degré de rapprochement entre données et droite (plus regroupées près de la droite, plus la corrélation est élevée)
Quel est le problème quand on compare la grosseur du cerveau et le QI?
Il y a une variable médiatrice : la taille du corps. Il faut la contrôler et en tenir compte. Les animaux les plus intelligents sont ceux qui ont une grosse tête p/r à leur corps (dauphin, requin)
V ou F : Il n’existe que la relation linéaire.
Il existe plusieurs types de relations entre les variables
et on peut les identifier par la forme du diagramme de dispersion.
Par contre, La corrélation permet de détecter seulement les
relations linéaires (c’est un de ses postulats).
Donne 3 types de relations.
Linéaire : droite, 0 changement de direction
Quadratique :1 seul changement de direction, monte puis redescend… ou inverse
Cubique: W ou N, 2 changements de direction
Donne un exemple de relation quadratique
Le niveau de stress et la performance.
Pas assez : Ennui
Juste assez : performance
trop : épuisement,
Qu’est-ce qu’une corrélation positive?
Les valeurs les plus élevées de X sont associées aux
valeurs les plus élevées de Y. « Quand X augmente, Y augmente.
Qu’est-ce qu’une corrélation négative?
Les valeurs les plus élevées de X sont associées aux
valeurs les moins élevées de Y. « Quand X augmente, Y diminue
V ou F : Plus une relation est forte, plus les points seront groupés
suivant une relation linéaire.
Vrai