Cours 10 - Corrélation Flashcards
Définition d’une corrélation
Statistique qui permet d’estimer le degré de relation entre 2 variables (généralement mesurée sur les mêmes individus)
Que peut estimer la corrélation?
La direction et la force de la relation
Quelle est la condition pour avoir une corrélation?
Variable X et variable Y doivent être intereliées
La corrélation est une mesure de quel ordre?
Mesure descriptive mais aussi inférentielle
Quelle forme de relation peut-on détecter avec la corrélation?
Linéaire
2 types de directions de corrélation
Corrélation POSITIVE: quand X augmente, Y augmente
Corrélation NÉGATIVE: quand X augmente, Y descend
Types de forces de corrélation
Corrélation NULLE: aucune relation entre les deux variables.
Corrélation PARFAITE: relation parfaitement linéaire entre les deux variables
Valeur numérique indiquant le coefficient de corrélation
-1 et 1 = relation linéaire parfaite
0 = absence de relation parfaite
Manière de calculer le coefficient de corrélation pour des échelles d’intervalle et de ratio
r de Pearson
Définition du coefficient de corrélation
Mesure standardisée de la covariance entre deux variables
r = degré auquel les deux variables varient ensemble / degré auquel les deux variables varient séparément
Définition de la covariance
Dans quelle mesure les variations d’une variable sont associées aux variations de l’autre variable
2 façons d’interpréter la valeur du coefficient
- Barèmes
- % de variance commune exprimé par le coefficient de détermination (r au carré)
Barème de Cohen
0.10 à 0.29 = Faible
0.30 à 0.49 = Modérée
0.50 et + = Forte
Définition du coefficient de détermination
r au carré
% de variance commune entre les 2 variables (pour corrélation)
Portion de la variabilité de Y qui peut être expliquée par X (pour régression)
Postulats de la corrélation
- Relation linéaire entre X et Y
moins de chance d’observer une corrélation si la relation est linéaire - Variables sur une échelle d’intervalle ou de ratio
- Les deux variables doivent se distribuer normalement
- Homogénéité des variances
- Taille de l’échantillon; les petits échantillons sont moins variables, et donc tendent à sous-estimer la corrélation réelle. Les barèmes varient, mais plusieurs auteurs suggèrent un n minimal de 20.