cours 6 Flashcards
Qu’est ce que l’association?
exemple d’association :
- Plus la température est basse (froide), plus les gens portent de couches de vêtements (association/corrélation négative)
- Plus l’âge d’un individu avance, plus il est susceptible de répondre positivement à un questionnaire de satisfaction (association/corrélation positive)
Qu’est ce qu’une corrélation?
La corrélation est une mesure statistique qui quantifie l’association entre deux entités (variables X et Y).
- Synonymes = covariance, relation, lien, liaison
Quelle est l’importance de la corrélation?
Elle réduit l’incertitude : la connaissance de x nous fournit de l’information sur y.
ex : En observant que les passants portent un manteau (x), nous sommes « plus » enclin à croire qu’il fait froid (y) prédiction
Qu’est ce qu’une corrélation positive et négative?
Un r « positive » : des valeurs élevées sur x sont associées à des valeurs élevées sur y et vice-versa.
Un r « négative » : des valeurs élevées sur x sont associées à des valeurs faibles sur y et vice-versa.
Quelle est la taille d’une corrélation?
c’est la force d’une corrélation
Vrai ou faux, plus élevée est la corrélation (taille / force), plus la connaissance de x nous renseigne sur y.
vrai
Vrai ou faux, une corrélation négative et de forte amplitude (forte) indique une relation inversée entre l’évolution des deux variables : plus une variable grandit, plus l’autre diminue. C’est une corrélation importante à observer.
Vrai
Qu’est ce que la corrélation de Pearson?
Pour Pearson, l’association est le degré avec lequel un groupe d’observations maintient la même position relative sur deux variables. (x et y)
La corrélation de Pearson est donc la similitude moyenne entre les valeurs Z respectivement obtenues sur deux variables par chaque observation.
Qu’est ce que le r de Pearson?
C’est le degré moyen standardisé avec lequel les observations occupent une position similaire (ou inversée) sur x et y.
Position similaire = position des observations par rapport aux 𝛸 des variables.
r positive (similaire) : les observations situées au-dessus de X sont aussi situés au-dessus de Y et vice-versa.
r négative (similaire, mais inversée) : les observations situées au-dessus de X sont situés en dessous de Y et vice-versa.
Que signifie standardisé?
C’est lorsqu’une corrélation de même taille veut dire exactement la même chose, peu importe les variables, les corrélations peuvent être comparées entre elles.
Rxy = 0,5 ; Rab = 0,5 : l’association entre les variables x et y est aussi forte que l’association entre les variables a et b (les comparaisons peuvent n’avoir aucun rapport entre elles, mais nous pouvons les comparer)
Vrai ou faux, la corrélation est parfaite lorsque toutes les observations sont a la même position (z) sur
x et y (valeur numérique de la corrélation = 1,0)
Vrai
Comment calcule-t-on le r de Pearson?
- Convertir chaque observation en score-z
- Calculer le produit zx * zy pour chaque observation
- Calculer la somme de ces produits (zx * zy)
- Calculer la moyenne (en divisant par n - 1)
Quelles sont les limites du calcul d’un r de Pearson
- Ne peut être calculé que pour deux variables à la fois
- Exige que nous ayons pour chaque observation (x et y) deux valeurs : une sur x, l’autre sur y (impossible de calculer pour cette observation s’il y a une des deux valeurs manquantes).
- La corrélation nous indique la relation entre les variables et non la relation entre les observations.
- Il faut un minimum de trois observations pour la calculer. (comme pour l’ensemble des statistiques paramétriques, un n d’au moins 30 est souhaitable)
Qu’est ce qui influence la taille (force) d’une corrélation (r)?
Les postulats, dont :
1 - Le degré de relation entre x et y qui existe en réalité (est-ce pertinent ?).
2 - La « linéarité » de la relation x et y.
3 - Le niveau de variance de x et de y (homogénéité des variances ou variances homogènes VS variance restreinte).
4 - Les observations situées loin de la moyenne 𝛸x et/ou 𝛸y (valeurs extrêmes) donc = normalité.
Le premier postulat est de se demander : Est-ce que le lien est pertinent ? Élabore.
C’est donc de se dire si la force entre les deux variable est élevée et si elle est plus susceptible de représenter une vrai réalité.
Ex de corrélations faibles (proche de zéro) :
- Les notes aux examens et la longueur du pouce.
- La consommation de marijuana et la consommation de crack.
Ex de corrélations fortes (proche de ±1) :
- Les notes aux examens et les heures d’études.
- Consommation de cannabis et appétit (r positive)
- Exercice physique et gras corporel (r négative).