Corrélation linéaire Flashcards
Quelle est la différence principale entre la corrélation de Pearson et celle de Spearman ?
Pearson mesure une relation linéaire entre deux variables continues, tandis que Spearman mesure une relation monotone entre deux variables au moins ordinales.
Dans quel cas faut-il utiliser Spearman plutôt que Pearson ?
Lorsque les variables ne sont pas normales, que la relation est non linéaire ou que les données sont ordinales.
Que signifie un coefficient de corrélation r = 0.87 ?
Il existe une forte relation positive entre les deux variables.
Peut-on avoir une corrélation parfaite négative ?
Oui, si r = -1, cela signifie qu’il y a une relation inverse parfaite.
Quels sont les postulats pour utiliser la corrélation de Pearson ?
Normalité des deux variables, linéarité de la relation, absence de valeurs extrêmes influentes.
Comment vérifier la linéarité entre deux variables continues ?
Avec un scatterplot (nuage de points).
Que signifie une p-value > .05 dans une corrélation ?
Il n’y a pas de lien significatif entre les deux variables.
Est-ce qu’une corrélation signifie qu’une variable cause l’autre ?
Non, la corrélation n’implique jamais une causalité.
Que permet d’observer un graphique Q-Q dans une analyse de corrélation ?
Il permet de vérifier la normalité des variables.
Quel est le danger d’un outlier dans une analyse de corrélation de Pearson ?
Il peut fortement fausser le coefficient de corrélation.
Qu’est-ce qu’une corrélation partielle ?
Une corrélation entre deux variables en contrôlant l’effet d’une ou plusieurs autres variables.
Quelle est la corrélation attendue entre deux mesures parfaitement indépendantes ?
r ≈ 0
Peut-on faire une corrélation entre une variable continue et une variable dichotomique ?
Oui, avec une corrélation point bisériale.
Quelle est la différence entre une relation linéaire et une relation monotone ?
Linéaire : les données suivent une droite. Monotone : elles vont toutes dans une seule direction, sans nécessairement être linéaires.
Que faire si la relation entre les variables est curvilinéaire ?
Utiliser une autre forme de relation (ex. polynomiale) ou transformer les variables.
Qu’est-ce qu’un nuage de points en forme de “U” indique ?
Une relation non linéaire (curvilinéaire).
Quelle est la corrélation attendue entre une variable et elle-même ?
r = 1 (corrélation parfaite).
À quoi sert la transformation z avant de calculer une corrélation ?
À standardiser les variables, surtout lorsqu’on compare plusieurs corrélations.
Quel est l’effet d’un manque de variance sur la corrélation ?
Il réduit artificiellement le coefficient de corrélation.
Peut-on comparer deux coefficients de corrélation entre deux groupes différents ?
Oui, avec un test de comparaison de corrélations (ex. test de Fisher r-to-z).
Qu’est-ce que le coefficient de détermination (r²) ?
La proportion de variance partagée entre les deux variables.
Quand faut-il privilégier Kendall plutôt que Spearman ?
Quand il y a de nombreux ex aequo (ties) dans les rangs.
Pourquoi faut-il éviter de faire une corrélation avec des variables très asymétriques ?
Car cela viole le postulat de normalité de Pearson.
Comment détecter une corrélation de suppression ?
Lorsqu’une relation apparaît uniquement après avoir contrôlé une troisième variable.