CHAPITRE 6 - Corrélation Flashcards
À quoi sert la corrélation?
À mesurer les relations entre deux variables continues (chiffres)
Qu’est-ce qui caractérise les variables continues?
Elles sont plus précises que les variables définies. Ex: revenu (faible, élevé, moyen vs le chiffre… ou réussite échec vs note)
Qu’est-ce qui caractérise le nuage de points?
Il existait avant que la corrélation n’existe.
Quelles sont les caractéristiques de la covariance (2)?
(1) elle est inutile, c’est seulement une étape, (2) elle est problématique car elle est influencée/affectée par les unités de mesure
Qu’est-ce qui caractérise le coefficient de corrélation de Pearson?
C’est une covariance standardisée (donc elle n’est pas affectée par les unités de mesure, ex: km vs miles)
Quelles sont les mesures non-paramétriques et à quoi servent-elles (2)6
(1) Rho de Spearman et (2) Tau de Kendall qui servent à transformer nos données en rangs
Qu’est-ce qui caractérise l’interprétation des corrélations?
Le problème de la causalité: corrélation n’égale pas causalité… ce qui nous en rapproche le plus, c’est la séquence temporelle: si l’un précède l’autre, on va avoir tendance à parler de causalité
Qu’est-ce qu’une corrélation (2)?
(1) Une manière de mesurer jusqu’à quel point deux variables sont reliées (quand une variable varie, l’autre varie), (2) on mesure l’association des réponses à deux variables (quand x varie, est-ce que y aussi?)
Qu’est-ce qui caractérise une très petite relation (3)?
(1) on a souvent une corrélation très petite/faible: 0,10, (2) les points ne sont relativement centrés autour de la moyenne, (3) quand la relation est faible, on est plus près de la grande moyenne, donc on se rapproche d’une faible corrélation, donc faible signifiance
Qu’est -ce qui caractérise une relation positive (3)?
(1) Plus la corrélation est forte, moins il y aura de données qui dévient et donc qui ne seraient pas expliquées par la variance, (2) une forte corrélation nous permet de mieux prédire les données, (3) plus la corrélation est forte, plus elle a tendance à prédire si y va arriver en réponse à x (plus proche de 1)
Qu’est-ce qui caractérise la relation négative (3)?
(1)
Quelles sont les caractéristiques de la corrélation (3)?
(1) +1 = corrélation positive parfaite, -1 = corrélation négative parfaite, (2) 0.1 = faible (1% de la variance), 0.3 = modérée (9% de la variance), 0.5 = forte (25% de la variance) 1 = parfaite (100% de la variance). On prend la corrélation au carrée multipliée par 100 pour avoir la variance. Ça nous donne le pourcentage de la variance expliquée par x?), (3) pour rapporter un résultat: on indique le degré de force de la relation (forte/moyenne/faible) et la nature (positive/négative) entre les deux moyennes
À quoi ça sert de mesurer les relations (2)?
(1) Évaluer si quand une variable augmente ou diminue, l’autre variable augmente, diminue ou ne change pas. (2) possible par la covariance
Comment peut-on mesurer les relations par la covariance (2)?
(1) On fait une évaluation de comment chaque variable dévie de la moyenne, (2) si les deux variables s’écartent de la moyennent simultanément, alors probablement qu’il y a une relation
Qu’est-ce que la variance (3)?
(1) la variance nous dit de combien les résultats dévient de la moyenne pour une variable, (2) elle est liée à la somme des carrés, (3) la covariance est similaire, elle nous dit comment deux variables dévient de leur moyennes respectives: covariance = est-ce que la variance des deux variables varient ensemble?