Cours 10 - Corrélation Flashcards
Définition d’une corrélation
Statistique qui permet d’estimer le degré de relation entre 2 variables (généralement mesurée sur les mêmes individus)
Que peut estimer la corrélation?
La direction et la force de la relation
Quelle est la condition pour avoir une corrélation?
Variable X et variable Y doivent être intereliées
La corrélation est une mesure de quel ordre?
Mesure descriptive mais aussi inférentielle
Quelle forme de relation peut-on détecter avec la corrélation?
Linéaire
2 types de directions de corrélation
Corrélation POSITIVE: quand X augmente, Y augmente
Corrélation NÉGATIVE: quand X augmente, Y descend
Types de forces de corrélation
Corrélation NULLE: aucune relation entre les deux variables.
Corrélation PARFAITE: relation parfaitement linéaire entre les deux variables
Valeur numérique indiquant le coefficient de corrélation
-1 et 1 = relation linéaire parfaite
0 = absence de relation parfaite
Manière de calculer le coefficient de corrélation pour des échelles d’intervalle et de ratio
r de Pearson
Définition du coefficient de corrélation
Mesure standardisée de la covariance entre deux variables
r = degré auquel les deux variables varient ensemble / degré auquel les deux variables varient séparément
Définition de la covariance
Dans quelle mesure les variations d’une variable sont associées aux variations de l’autre variable
2 façons d’interpréter la valeur du coefficient
- Barèmes
- % de variance commune exprimé par le coefficient de détermination (r au carré)
Barème de Cohen
0.10 à 0.29 = Faible
0.30 à 0.49 = Modérée
0.50 et + = Forte
Définition du coefficient de détermination
r au carré
% de variance commune entre les 2 variables (pour corrélation)
Portion de la variabilité de Y qui peut être expliquée par X (pour régression)
Postulats de la corrélation
- Relation linéaire entre X et Y
moins de chance d’observer une corrélation si la relation est linéaire - Variables sur une échelle d’intervalle ou de ratio
- Les deux variables doivent se distribuer normalement
- Homogénéité des variances
- Taille de l’échantillon; les petits échantillons sont moins variables, et donc tendent à sous-estimer la corrélation réelle. Les barèmes varient, mais plusieurs auteurs suggèrent un n minimal de 20.
Facteurs qui influencent la corrélation
- Données extrêmes
Corrélation tient compte de toutes les données.
Résultats extrêmes influencent fortement la variabilité et le coefficient de corrélation - L’étendue des données
+ l’étendue est petite, - les données tendent à varier
Restriction de l’étendue tend à diminuer la corrélation
Comment optimiser l’interprétation du coefficient de corrélation?
Faire inspection visuelle des données recueillies
- vérifier si les postulats sont respectés
- détecter la présence de données extrêmes
- évaluer l’étendue des données
Qu’est-ce que le test inférentiel permet de déterminer ?
Si le coefficient de corrélation dans la population est différent de 0 ou supérieur/inférieur à 0
Démarche inférentielle pour la corrélation de pearson
- Ho et Hi
- alpha = et bilatéral/unilatéral
- a) Choix du test utilisé: Corrélation de Pearson
b) Conditions d’utilisation- n est suffisamment grand (n>20)
- 2 variables sont sur une échelle intervalle ou ratio
- relation linéaire entre les 2 variables
- homogénéité des variances
- variables sont distribuées normalement
c) Distribution d’échantillonnage du t de Student avec dl (n-2)
d) Calculs : t obs =
- t obs (dl) = > t crit (dl) .
- Conclusion avec contexte
Particularité avec hypothèse unilatérale SPSS
Si l’hypothèse est unilatérale et le test SPSS est bilatéral, on divise le p par 2
Si l’hypothèse est bilatérale et le test SPSS est unilatéral, on multiplie le p par 2