CHAPITRE 6 - Corrélation Flashcards
À quoi sert la corrélation?
À mesurer les relations entre deux variables continues (chiffres)
Qu’est-ce qui caractérise les variables continues?
Elles sont plus précises que les variables définies. Ex: revenu (faible, élevé, moyen vs le chiffre… ou réussite échec vs note)
Qu’est-ce qui caractérise le nuage de points?
Il existait avant que la corrélation n’existe.
Quelles sont les caractéristiques de la covariance (2)?
(1) elle est inutile, c’est seulement une étape, (2) elle est problématique car elle est influencée/affectée par les unités de mesure
Qu’est-ce qui caractérise le coefficient de corrélation de Pearson?
C’est une covariance standardisée (donc elle n’est pas affectée par les unités de mesure, ex: km vs miles)
Quelles sont les mesures non-paramétriques et à quoi servent-elles (2)6
(1) Rho de Spearman et (2) Tau de Kendall qui servent à transformer nos données en rangs
Qu’est-ce qui caractérise l’interprétation des corrélations?
Le problème de la causalité: corrélation n’égale pas causalité… ce qui nous en rapproche le plus, c’est la séquence temporelle: si l’un précède l’autre, on va avoir tendance à parler de causalité
Qu’est-ce qu’une corrélation (2)?
(1) Une manière de mesurer jusqu’à quel point deux variables sont reliées (quand une variable varie, l’autre varie), (2) on mesure l’association des réponses à deux variables (quand x varie, est-ce que y aussi?)
Qu’est-ce qui caractérise une très petite relation (3)?
(1) on a souvent une corrélation très petite/faible: 0,10, (2) les points ne sont relativement centrés autour de la moyenne, (3) quand la relation est faible, on est plus près de la grande moyenne, donc on se rapproche d’une faible corrélation, donc faible signifiance
Qu’est -ce qui caractérise une relation positive (3)?
(1) Plus la corrélation est forte, moins il y aura de données qui dévient et donc qui ne seraient pas expliquées par la variance, (2) une forte corrélation nous permet de mieux prédire les données, (3) plus la corrélation est forte, plus elle a tendance à prédire si y va arriver en réponse à x (plus proche de 1)
Qu’est-ce qui caractérise la relation négative (3)?
(1)
Quelles sont les caractéristiques de la corrélation (3)?
(1) +1 = corrélation positive parfaite, -1 = corrélation négative parfaite, (2) 0.1 = faible (1% de la variance), 0.3 = modérée (9% de la variance), 0.5 = forte (25% de la variance) 1 = parfaite (100% de la variance). On prend la corrélation au carrée multipliée par 100 pour avoir la variance. Ça nous donne le pourcentage de la variance expliquée par x?), (3) pour rapporter un résultat: on indique le degré de force de la relation (forte/moyenne/faible) et la nature (positive/négative) entre les deux moyennes
À quoi ça sert de mesurer les relations (2)?
(1) Évaluer si quand une variable augmente ou diminue, l’autre variable augmente, diminue ou ne change pas. (2) possible par la covariance
Comment peut-on mesurer les relations par la covariance (2)?
(1) On fait une évaluation de comment chaque variable dévie de la moyenne, (2) si les deux variables s’écartent de la moyennent simultanément, alors probablement qu’il y a une relation
Qu’est-ce que la variance (3)?
(1) la variance nous dit de combien les résultats dévient de la moyenne pour une variable, (2) elle est liée à la somme des carrés, (3) la covariance est similaire, elle nous dit comment deux variables dévient de leur moyennes respectives: covariance = est-ce que la variance des deux variables varient ensemble?
Comment peut on calculer la covariance (5)?
(1) calculer l’erreur entre la moyenne et le score de chaque sujet pour la première variable (x), (2) calculer l’erreur entre la moyenne et le score de chaque sujet pour la deuxième variable (y), (3) multiplier les erreurs entre elles, (4) faire la somme des produits, (5) la covariance est la moyenne des produits
Quels sont les problèmes avec la covariance (3)?
(1) La covariance dépend des unités de mesures: la covariance de deux variables mesurées en miles peut être de 4.25, mais en convertissant en KM on obtient une covariance de 11, ce qui est bcp plus important que 4.25…, (2) La meilleure solution est de faire une standardisation: en divisant par l’écart type de chaque variable, (3) Le coefficient de corrélation est la version standardisée de la covariance: moins affectée par les unités de mesure
Que peut-on dire à propos de la corrélation (3)?
(1) Elle varie entre -1 et +1: 0= pas d’effet, (2) c’est une mesure d’effet: 0.1=petit effet, 0.3= effet moyen, 0.5 = effet large, (3) il y a un coefficient de détermination r2: en mettant r au carré, on obtient la proportion de variance expliquée par l’autre variable
Que signifie la 3e variable?
Dans chaque corrélation, la causalité entre 2 variables ne peut pas être assumée parce que d’autres variables (mesurées ou non) peuvent affecter les résultats
Que signifie la direction de la causalité?
Les coefficients ne disent rien à propos des variables qui entraînent le changement chez l’autre
Qu’est-ce qui est le plus important à retenir entre la corrélation et la causalité?
L’absence de manipulation expérimentale lors de plan de recherche expérimentaux
Quelles sont les caractéristiques des plans expérimentaux (3)?
(1) on fait de la manipulation de variables, (2) on fait une assignation aléatoire, (3) on est plus près de la causalité
Quelles sont les caractéristiques des plans non expérimentaux (3)?
(1) on fait de la manipulation de variables, (2) on fait une assignation non-aléatoire, (3) on est plus près de la causalité
Quelle est la caractéristique des plans corrélationnels?
Il n’y a aucune manipulation
Quelles sont les méthodes de corrélation non-paramétriques (2)?
(1) Rho de spearman: corrélation de Pearson mais avec des rangs, (2) Kendall’s tau: meilleure pour des petits échantillons