Chapitre 6 : La corrélation Flashcards
Qu’est-ce que la corrélation?
Sur le plan inférentiel, il s’agit de savoir si le lien ou l’association entre la distribution de deux variables existe (H1) ou s’il n’existe pas (H0, variation aléatoire)
En d’autres mots, vérifier s’il existe une relation entre deux variables (pour corrélation bivariée)
Donnez quelques caractéristiques de la corrélation
- Ne se calcule qu’à partir de 2 variables, qui ici sont identifiées par x et y
- Exige que chaque observation produise une valeur sur x et une sur y (impo à calculer s’il manque une valeur)
- Il existe plusieurs types de corrélation mais la plus fréquente est Pearson
- *Doit respecter règles de courbe normale et d’équations para
Quel est le principal avantage de la corrélation?
Elle réduit l’incertitude : la connaissance de x nous fournit de l’information sur y
Qu’est-ce que l’interprétation d’une corrélation peut nous indiquer?
- La taille, qui nous permet de savoir si la relation est forte ou faible
- La direction de la relation (positive ou négative)
Sur quoi nous renseigne la taille corrélation?
- Une corrélation peut être forte, modérée ou faible
- Plus une corrélation est forte, plus la connaissance de x nous renseigne y
Que nous indique la direction d’une corrélation?
- Une corrélation négative ne signifie pas qu’elle est faible
- Positive : nous indique que les variables évoluent dans la même direction
- Négative : nous indique que les variables évoluent dans des directions opposées
Qu’est-ce qu’implique une corrélation entre deux variables?
L’observation d’une corrélation implique que les unités d’analyse tendent à produire des valeurs “similaires” (relation +) ou des valeurs inversées (relation -) sur deux variables.
Un fort coefficient signifie que soit les valeurs sont similaires (même unité de mesure) ou bien les valeurs étalon des deux variables sont similaires pour chaque observations (pas même unité)
Que signifie une distribution standardisée?
Cela signifie qu’une corrélation de même taille veut dire exactement la même chose peu importe les variables. Les corrélations peuvent être comparées entre elles.
Quelle est la définition officielle du coefficient de Pearson?
Le coefficient est le degré moyen standardisé avec lequel les observations occupent une position similaire (ou inversée) sur x et y
Que signifie le terme corrélation “parfaite”?
La corrélation est parfaite lorsque toutes les observations sont à la même position (z) sur x et y (valeur numérique de la corrélation = 1)
Que signifie un coefficient < 1 ?
Cela signifie qu’il y a au moins une observation qui n’est pas à la même position (z) sur x et y
Que signifie un coefficient proche 0?
La corrélation est “faible” lorsque les observations ne sont pas situées (z) de manière similaire sur x et y (valeur numérique près de 0)
Quelles sont les limites du calcul du coefficient de Pearson?
- Ne peut être calculé que pour 2 variables à la fois
- Exige que nous ayons pour chaque observation (x et y) 2 valeur (calcul impo pour l’observation s’il manque une valeur)
- Nous indique la relation entre variables mais non entre observations
- Doit avoir min 3 observations
Quels sont les postulats pour la corrélation de Pearson (conditions pour réaliser l’analyse)?
- x et y sont des mesures à intervalles/de rapport (doit faire moyenne)
- Raisonnable de croire que les concepts x et y sont distribués normalement
- La relation xy est linéaire
Qu’est-ce qui influence la taille des coefficients?
- Le degré de relation entre x et y qui existe en réalité
- La linéarité de la relation x et y
- Le niveau de variance de x et de y (homogénéité des variances ou variances homogènes vs variance restreinte)
- Les observations situées loin de la moyenne de x ou y (valeurs extrêmes)