Corrélation Flashcards
Qu’est-ce qu’une série statistique double?
Analyse simultanée de deux variables mesurées sur le même élément.
Qu’est-ce que la covariance? Et comment peut-on la calculer?
Mesure de la force et de la directions de l’association entre deux variables.
On fait la sommation des (valeurs en x- la moyenne en x) X (valeurs de y- la moyenne en y) / n-1
Pourquoi est-il complexe de travailler avec la covariance?
Car elle s’exprime dans les unités de X*Y
Qu’est ce que le coefficient de corrélation de Pearson et comment se calcule-t-il?
C’est la covariance standardisée par les écart-type. C’est une mesure dépendance linéaire
On divis la covariance par les écart-types
à partir de quelle valeur a-t-on une corrélation faible? Moyenne? forte?
Autour de 0.1, 0.3 et 0.5
Quelle est la différence entre une corrélation et une régression?
La corrélation quantifie à quelle point Y varie avec X mais pas combien Y varie selon X.
Que faire si nous ajoutons des données à une études dont nous avons déjà calculé la corrélation?
Il faut recalculer cette dernière puisqu’elle risque fortement de changer.
Quels sont les conditions d’application pour une corrélation?
- L’échantillonnage est indépendant et aléatoire
- Les mesures (X et Y) suivent une distribution normale bivariée:
- a. La rela-on entre X et Y est linéaire
- b. Les valeurs de X et Y (séparément) sont distribuées normalement.
Quels indice peuvent nous faire soupçonner que les condition d’application ne sont pas respectés?
- Une relation non linéaire entre X et Y
- La présence de valeurs extrêmes
- Un nuage de point en “entonnoir
Que faire si les conditions d’application ne sont pas respectés?
1-Ignorer (la corrélation est robuste)
2- Transformation (on est pas obliger de transformer les deux variable)
3-Corrélation des rang des Spearman
Comment calculer le r de Spearman?
On donne un rang à chaque valeur, puis on fait 1-6x la sommation des (rang-rang moyen)^2 divisé par le nombre d’observation au cube - le nb d’observation.
Puis on le compare avec un r de la table, 0.05 et nb d’observation.
Comment peut-on tester s’il y a une corrélation?
On calcule une statistique de test
t=r/SE SE=(1-r^2/n-2)^1/2
Le dI pour obtenir le t critique est de n-2
Comment obtenir le t critique pour le comparer à un t?
On utilise alpha=0.05 et dI=n-2
Comment tester la corrélation pour Spearman?
Si n est plus petit que 100: On utilise la table de Spearman
Si n est plus grand que 100: Même chose que pour Pearson mais avec rs
Comment peut-on démontrer une relation de cause à effet?
Il faut pouvoir:
- Manipuler la cause
– Mesurer les effets
– Contrôler les autres variables *** (IMPORTANT)