Corrélations et mesures d'associations Flashcards
Pour quelles variables utilisons-nous une corrélation?
Les variables quantitatives discrètes ou continues
Qu’est-ce qu’une corrélation?
-chercher un chiffre qui résume la relation entre 2 variables
==> c’est une covariance standardisée entre -1 et 1
Qu’est-ce qu’une corrélation linéaire (de Pearson)?
Mesure de la force de la relation linéaire entre 2 variables quantitatives continues ou discrètes
r: statistique estimée grâce à l’échantillon–> estimation biaisée de rho–> dépend du nombre d’ind. dans l’échantillon
-paramètre de la population
forte corrélation linéaire positive: 1
0: pas de corrélation linéaire
forte corrélation linéaire négative: -1
Qu’est-ce que la covariance?
Même info que la corrélation mais pas limité dans sa valeur, donc pas standardisée
Pourquoi ajuster la corrélation?
+ échantillon petit, + estimation de la corrélation sera biaisé–> on doit l’ajuster
==> besoin de la corrélation ajustée qui est une estimation relativement non biaisée de rho
–> formule: r ajusté: racine (1-corrélation)x n-1 / n-2
Dans quelles conditions utiliser la corrélation de Pearson?
-Quand on a des variables quantitatives
- quand veut savoir si la corrélation est différente de 0 seulement!
==> elle ne dit rien sur la causalité des variables
Que faire si on veut comparer une corrélation a un autre chiffre que 0?
doit faire une transformation Fisher’s r to z
1. trouver r: r= 1/2ln (1+r)/1-r
2. trouver rho: rho= 1/2ln(1+rho)/1-rho
3. trouver n
4. trouver z: z= r(1)-rho(2)/ racine 1/n-3
==> score z: trouve p-valeur dans tableau!
Quel est le but de comparer deux corrélations entre elles?
Voir si r1 et r2 sont différents pour voir si viennent de deux échantillons différents
pour calculer:
1. fisher’s r to z pour chaque variables puis
z: r1-r2/racine 1/n1-3 + 1/n2-3
Quand utiliser la corrélation de Spearman?
-quand les données représentent des rangs
-si les conditions de Pearson sont violées
==> on fait le même calcul mais sur les rangs
Conditions d’application de Spearman?
-1, rSp, 1
-on mesure la relation monotone entre deux variables (=constamment croissante ou décroissante sur un intervalle)
-données qualitatives ordinales ou quantitatives
= même chose que Pearson
Peut être un estimateur robuste de la corrélation de Pearson
Qu’est-ce que le Tau de Kendall?
Mesure d’association basée sur le nb de discordance et de discordances
- ->mesure pour des données de rangs
concordance: tau de K élevé
discordance: tau de K faible - > valeur comprise entre -1 et 1
Comment calculer le tau de Kendall?
formule: R= c-d/c+d
Ou plutôt pour les calculs: r: c-d/n(n-1)/2 = 1- 2d/n(n-1)/2
Exemple concret de tau de Kendall: mesurer l’accord des juges
si que lignes droites: concordances absolue
Nombre de discordances: nombre de croisements qui existent entre les droites
Interprétation du tau de K: si t=0.08–> on a un accord des juges de 0.008
Kendall ou spearman?
Kendall est mieux–> + robuste, donne meilleure estimation que Spearman
Des coefficients de corrélation calculés comme r de Pearson?
- la corrélation bisériale de points
- coefficient d’association Phi