cours 6 Flashcards

1
Q

Qu’est ce que l’association?

A

exemple d’association :
- Plus la température est basse (froide), plus les gens portent de couches de vêtements (association/corrélation négative)
- Plus l’âge d’un individu avance, plus il est susceptible de répondre positivement à un questionnaire de satisfaction (association/corrélation positive)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est ce qu’une corrélation?

A

La corrélation est une mesure statistique qui quantifie l’association entre deux entités (variables X et Y).

  • Synonymes = covariance, relation, lien, liaison
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est l’importance de la corrélation?

A

Elle réduit l’incertitude : la connaissance de x nous fournit de l’information sur y.

ex : En observant que les passants portent un manteau (x), nous sommes « plus » enclin à croire qu’il fait froid (y) prédiction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est ce qu’une corrélation positive et négative?

A

Un r « positive » : des valeurs élevées sur x sont associées à des valeurs élevées sur y et vice-versa.

Un r « négative » : des valeurs élevées sur x sont associées à des valeurs faibles sur y et vice-versa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelle est la taille d’une corrélation?

A

c’est la force d’une corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux, plus élevée est la corrélation (taille / force), plus la connaissance de x nous renseigne sur y.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou faux, une corrélation négative et de forte amplitude (forte) indique une relation inversée entre l’évolution des deux variables : plus une variable grandit, plus l’autre diminue. C’est une corrélation importante à observer.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce que la corrélation de Pearson?

A

Pour Pearson, l’association est le degré avec lequel un groupe d’observations maintient la même position relative sur deux variables. (x et y)
La corrélation de Pearson est donc la similitude moyenne entre les valeurs Z respectivement obtenues sur deux variables par chaque observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce que le r de Pearson?

A

C’est le degré moyen standardisé avec lequel les observations occupent une position similaire (ou inversée) sur x et y.

Position similaire = position des observations par rapport aux 𝛸 des variables.

r positive (similaire) : les observations situées au-dessus de X sont aussi situés au-dessus de Y et vice-versa.

r négative (similaire, mais inversée) : les observations situées au-dessus de X sont situés en dessous de Y et vice-versa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que signifie standardisé?

A

C’est lorsqu’une corrélation de même taille veut dire exactement la même chose, peu importe les variables, les corrélations peuvent être comparées entre elles.
Rxy = 0,5 ; Rab = 0,5 : l’association entre les variables x et y est aussi forte que l’association entre les variables a et b (les comparaisons peuvent n’avoir aucun rapport entre elles, mais nous pouvons les comparer)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vrai ou faux, la corrélation est parfaite lorsque toutes les observations sont a la même position (z) sur
x et y (valeur numérique de la corrélation = 1,0)

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment calcule-t-on le r de Pearson?

A
  1. Convertir chaque observation en score-z
  2. Calculer le produit zx * zy pour chaque observation
  3. Calculer la somme de ces produits (zx * zy)
  4. Calculer la moyenne (en divisant par n - 1)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelles sont les limites du calcul d’un r de Pearson

A
  1. Ne peut être calculé que pour deux variables à la fois
  2. Exige que nous ayons pour chaque observation (x et y) deux valeurs : une sur x, l’autre sur y (impossible de calculer pour cette observation s’il y a une des deux valeurs manquantes).
  3. La corrélation nous indique la relation entre les variables et non la relation entre les observations.
  4. Il faut un minimum de trois observations pour la calculer. (comme pour l’ensemble des statistiques paramétriques, un n d’au moins 30 est souhaitable)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est ce qui influence la taille (force) d’une corrélation (r)?

A

Les postulats, dont :
1 - Le degré de relation entre x et y qui existe en réalité (est-ce pertinent ?).
2 - La « linéarité » de la relation x et y.
3 - Le niveau de variance de x et de y (homogénéité des variances ou variances homogènes VS variance restreinte).
4 - Les observations situées loin de la moyenne 𝛸x et/ou 𝛸y (valeurs extrêmes) donc = normalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Le premier postulat est de se demander : Est-ce que le lien est pertinent ? Élabore.

A

C’est donc de se dire si la force entre les deux variable est élevée et si elle est plus susceptible de représenter une vrai réalité.
Ex de corrélations faibles (proche de zéro) :
- Les notes aux examens et la longueur du pouce.
- La consommation de marijuana et la consommation de crack.

Ex de corrélations fortes (proche de ±1) :
- Les notes aux examens et les heures d’études.
- Consommation de cannabis et appétit (r positive)
- Exercice physique et gras corporel (r négative).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Le 2e postulat est la « linéarité » de la relation x et y. Élabore.

A

Le coefficient de corrélation de Pearson (r) indique le degré de relation linéaire entre x et y. Si la relation r n’est pas linéaire, on peut toujours calculer le coefficient de Pearson mais il sous-estimera le degré de relation qui existe véritablement entre les variables.
Avant d’utiliser la corrélation, il faut donc se questionner si nos deux variables ont réellement une relation linéaire ou non et ce, en vérifiant le graphique pour voir si la relation r est constante pour chaque valeur de x ( si X augm de 10, Y augm de 10 = linéaire sinon, non-linéaire)

17
Q

Vrai ou faux, le r de Pearson ne mesure que les relations linéaires. Si la relation est non linéaire le r de Pearson sous-estimera la relation.

A

vrai

18
Q

Qu’est ce qu’une relation curvilinéaire?

A

Sur un graphique c’est l’effet d’un A (V à l’envers). Lorsque la relation est curvilinéaire, la corrélation de Pearson approchera zéro. Dans un tel cas, cela ne

19
Q

Le 3e postulat correspond à la variance de x et / ou y (homogénéité). Élabore.

A

C’est lorsque que x (ou y) n’a pas de variance (comme dans l’exemple de la relation entre le nombre de cigarettes fumées et le nombre de nez). Le score-z de chaque observation est Zx = 0 . Toute valeur multiplié par 0 = 0. Donc r sera toujours 0.

20
Q

Y-a-t-il quelque chose qui impact la corrélation? Quelle en sont les 2 causes?

A
  1. La restriction de la variance : lorsque une ou les variables on beaucoup ou presque pas de variance. (les nez)
    causes :
  2. Les observations sont très homogènes.
  3. La variable est incapable de distinguer entre les observations.

Exemple: r temps d’étude (x) et notes a l’examen (y)= faible. Sois :
- Les étudiants sont tous doués.
- L’examen est trop facile.

Alors, lorsque la variance est restreinte il est peu probable d’obtenir une corrélation même si elle existe
2. Les observations situées loin de la moyenne ont plus d’impact sur la correlation. Les valeurs extrêmes biaisent les statistiques qui utilisent la moyenne

21
Q

Vrai ou faux,
r = ± 0,10 = faible.
r = ± 0,30 = modérée.
r = ± 0,50 ou + = forte.

A

vrai

22
Q

Qu’est ce que la taille de l’effet?

A

C’est une mesure de l’ampleur de l’effet observé d’une variable sur une autre qui se mesure par le D de Cohen. On la vérifie à l’aide de deux moyennes.
Si X1= 79 et X2= 76 donc petite taille de l’effet.

23
Q

Qu’est ce que le coefficient de détermination?

A
  • Ça indique jusqu’à quel point une corrélation viendra réduire notre incertitude quant à la relation entre X et Y. Donc s’il y a un autre raison / facteur qui influence cette corrélation.
  • Le coefficient de détermination = r²
  • Ça nous informe à propos de la proportion de variance commune à deux variables = variance commune (ex. 31% de chance que années d’études influence le salaire, le reste peut être dû à une autre variable) donc si variance commune est faible, il existe plusieurs autres variables qui explique la variable y
24
Q

Qu’est ce que le coefficient de non-détermination?

A

Ça nous indique le degré avec lequel l’incertitude n’est pas réduite (l’incertitude restante)
Coefficient de non détermination = 1- r²