Cours 5 Flashcards

1
Q

Def. association

A

Coïncidence qui se répète de manière stable et qui a du sens dans la vie de tous les jours et en sciences

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lorsqu’il y a une association entre deux variables est-ce qu’on parle d’une hypothèse alternative (H1) ou nulle (H0)?

A

H1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vrai ou faux: la corrélation simple / linéaire / bivariée peut se faire avec n’importe quel nombre de variables

A

Faux. Elle se fait entre 2 variables seulement. Si on a plus de deux variables, une matrice de corrélation devra être développée -> on évaluera la corrélation entre chaque combinaison de 2 variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment se nomme la corrélation la + fréquente et quel est son symbole?

A

Corrélation de Pearson
r et se note rxy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou faux: pour que la corrélation puisse être calculer, l’observation ne doit pas nécessairement produire une valeur sur x et une valeur sur y. Une des deux valeurs peut être manquante.

A

Faux. Chaque observation doit produire une valeur sur x et une valeur sur y pour voir calculer une corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est l’importance de la corrélation?

A
  • Elle réduit l’incertitude (la connaissance de x nous fournit des informations sur y)
  • En connaissant x il est possible d’estimer y et vice-versa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pourquoi peut-on dire que la corrélation est bivariée?

A

Parce qu’une variable peut influencer l’autre variable et VICE-VERSA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que la taille d’une corrélation nous permet de savoir?

A

Si la corrélation entre 2 variables est forte ou faible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Est-ce que le fait qu’une corrélation soit de grande taille augmente ou réduit l’incertitude de y par rapport à la connaissance de x

A

Réduit l’incertitude. Plus une corrélation est élevée, plus la connaissance de x nous renseigne sur y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la direction d’une corrélation nous permet de savoir?

A

Si la corrélation est positive ou négative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment les données varient lors d’une corrélation positive

A

-> Les variables varient dans le même sens
- Plus une variable augmente, plus l’autre augmente aussi
- Plus une variable diminue, plus l’autre diminue aussi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment les données varient lors d’une corrélation négative

A

-> Les variables varient dans le sens opposé
- Plus une variable augmente, plus l’autre diminue
- Plus une variable diminue, plus l’autre augmente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux: une corrélation négative ne veut pas dire que la corrélation est faible

A

Vrai, elle est juste inversée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Est-ce que la taille et la direction sont dépendantes l’une de l’autre?

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Est-ce que la taille et la direction indique nécessairement si X cause Y?

A

Non, même si la taille est élevée ça ne veut pas dire que X cause Y, ça veut seulement dire que les variables sont grandement liées entre elles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment peut-on savoir, en regardant les observations si la corrélation est élevée, dans le cas d’une corrélation positive?

A

La position des observations est identique sur x et sur y. C’est-à-dire que si une valeur est en 1e position dans les x, elle sera aussi en 1e position dans les y.
- Les scores les + forts sur une variable sont associés aux scores les + forts sur l’autre variable
- Une observation sur x qui est au-dessus de la moyenne de x devrait être associée à une observation sur y qui est au-dessus de la moyenne de y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment peut-on savoir, en regardant les observations si la corrélation est élevée, dans le cas d’une corrélation négative?

A

La position des observations est inversée sur x et sur y. C’est-à-dire que si une valeur est en 1e position dans les x, elle sera aussi en dernière position dans les y.
- Les scores les + forts sur une variable sont associés aux scores les + faibles sur l’autre variable
- Une observation sur x qui est au-dessus de la moyenne de x devrait être associée à une observation sur y qui est en-dessous de la moyenne de y (ou vice-versa)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Définition conceptuelle du r de Pearson

A

Le degré moyen avec lequel les observations occupent une position similaire (ou inversée) sur x et y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment on fait pour savoir la position d’une observation, pour savoir si une observation sur x est similaire à une observation sur y?

A

-C’est la position des observations par rapport aux moyennes des variables
- On regarde si l’observation est au-dessus ou en-dessous de la moyenne de la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quelle est la direction de la corrélation si les scores-z sur x et y sont:
- Similaires
- Inversés
- Aléatoires

A
  • Positive
  • Négative
  • Aucune corrélation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Étapes pour calculer la corrélation r

A
  1. Transformer chaque observation en score-z
  2. Calculer le produit zx * zy pour chaque observation
  3. Additionner tous les produits des différentes observations
  4. Calculer la moyenne en divisant par n-1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrai ou faux: la corrélation est un indice standardisé de la relation entre x et y

A

Vrai, car il faut être capable de comparer x et y, même si leur moyenne est différente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quelle est l’importance d’avoir standardisé les distributions des variables de corrélation à l’aide de z?

A

Différentes corrélations pourront être comparées entre elles, même si les variables et les observations sont différentes.
-> Si la corrélation entre les variables a-b = 0,5
Et la corrélation entre les variables x-y = 0,5
Les corrélations sont aussi fortes

24
Q

Définition finale du r de Pearson

A

Le degré moyen STANDARDISÉ avec lequel les observations occupent une position similaire (ou inversée) sur x et y

25
Q

Quels sont les valeurs maximales et minimales des corrélations et qu’est-ce que ça indique sur la position des observations sur x et y?

A

Max supérieur = 1 -> observations sur x et y = identiques
Max inférieur = -1 -> observations sur x et y = inversées
Min = 0 (corrélation nulle) -> observations sur x et y = aléatoire

26
Q

Comment les z de la variable x et de la variable y seront-ils exprimés lorsqu’une corrélation est parfaite?

A

Les z de la variable x seront identiques (ou inverses) aux z de la variable y. C’est-à-dire que la distance entre chaque observation de x et la moyenne de x sera identique à la distance entre chaque observation de y et la moyenne de y.

27
Q

En regardant les observations de la variable x et de la variable y, comment sait-on que la corrélation entre ces deux variables n’est pas parfaite?

A

Au moins une observation ne sera pas à la même position (z) sur x et y. Ex. une observation pourrait être à la 1e position sur x et à la 2e position sur y.

28
Q

En regardant les observations de la variable x et de la variable y, comment sait-on que la corrélation entre ces deux variables est faible?

A

Lorsque les observations ne sont pas situées (z) de manière similaire sur x et y. Les positions sont toutes mélangées.

29
Q

Qu’arrive-t’il au score-z et à la direction de la corrélation lorsque:
a) Les valeurs des z de x et des z de y sont du même signe (avant de faire la multiplication et l’addition)
b) Les valeurs des z de x et des z de y sont de signe opposé (même parenthèse qu’au a)
c) Les valeurs des z de x et des z de y sont parfois du même signe et parfois de signes opposés

A

a) le score-z final, obtenu avoir faire la multiplication de tous les zx et de tous les zy et les avoir tous additionnés sera positif. La corrélation sera positive.
b) le score-z final sera négatif. La corrélation sera négative.
c) le score-z final se rapprochera de zéro et la corrélation sera moins significative (les z s’annulent)

30
Q

Limites pour le calcul d’un r de Pearson (4)

A
  1. Corrélation peut slm être calculée pour 2 variables à la fois (si + de 2 variables = développement d’une matrice de corrélation / la corrélation sera calculée pour chaque combinaison de 2 variables)
  2. On doit avoir une valeur de x et une valeur de y pour chaque observation (impossible de calculer si une des valeurs est manquante)
  3. La corrélation indique la relation entre les VARIABLES et non les observations
  4. Il faut un minimum de 3 observations pour chacune de nos 2 variables
31
Q

Postulats à respecter pour pouvoir calculer la corrélation de Pearson (3)

A
  1. x et y doivent être des mesures à INTERVALLES ou DE RAPPORT, car on doit pouvoir faire une moyenne
  2. La distribution de x et de y (les populations desquelles nous avons extrait les échantillons) doivent être NORMALES = pas de valeurs extrêmes et on doit avoir une variance homogène
  3. La relation xy doit être LINÉAIRE
32
Q

Si la relation r n’est pas linéaire, qu’arrive-t’il lorsqu’on calcule le coefficient de Pearson?

A
  • Le coefficient de Pearson sous estimera le degré de relation qui existe réellement entre les variables, car les variables peuvent avoir une corrélation forte, même si leur relation n’est pas linéaire, mais le coefficient de Pearson ne permet pas de bien le calculer.
  • Avant d’utiliser la corrélation, il faut donc s’assurer que l relation entre les variables étudiées est linéaire
33
Q

Qu’est-ce qu’on doit faire pour calculer la corrélation d’une relation non-linéaire entre 2 variables?

A

On doit utiliser une autre méthode que le coefficient de Pearson pour la trouver

34
Q

De quelle façon est-ce que le coefficient de Pearson sous estimera le degré de relation non-linéaire existant entre 2 variables

A

La première portion de la courbe quadratique annulera la deuxième portion (on aura une corrélation positive qui viendra annuler la corrélation négative)

35
Q

Qu’arrive-t’il si une de nos 2 variables n’est pas une variable, mais une constante (comme le nombre de nez)?

A
  • La corrélation sera égale à zéro, car z=0 (donne ça, car toutes les valeurs de la distribution sont égales à la moyenne) multiplié par n’importe quel chiffre donnera toujours 0.
  • La position des observations sur x ne sera pas similaire à celle des observations sur y = corrélation s’approche de zéro
36
Q

Nomme les 2 causes principales de la restriction des variances

A
  1. Les observations sont très homogènes
  2. La variable est incapable de distinguer entre les observations
37
Q

Quel est l’impact des valeurs extrêmes (outliers) sur la corrélation?

A
  • Observations situées + loin de la moyenne ont + d’impact sur la corrélation que celles qui sont situées proches
  • Biaisent les statistiques
  • Puisqu’elles sont + loins de la moyenne, la valeur de z est plus élevée et puisque la corrélation est déterminée par la multiplication de la valeur de z de chaque variable, la corrélation sera aussi plus élevée
38
Q

Quelles sont les conditions pour qu’il y ait de la causalité? (4)

A
  1. x et y doivent avoir de la variance
  2. Il doit y avoir une corrélation parfaite entre x et y
  3. La cause doit précéder l’effet (peut pas être réversible)
  4. Il doit exister un délai entre la cause et l’effet
39
Q

Est-ce que la présence d’une corrélation parfaite indique nécessairement la présence de causalité?

A

Non, car 3 autres critères doivent être respectés

40
Q

Est-ce que l’absence d’une corrélation parfaite indique nécessairement l’absence de causalité?

A

OUI! Car 1 des 4 critères n’est pas respecté

41
Q

Vrai ou faux : corrélation = causalité

A

NON lol

42
Q

Que signifient H1 et H0 en terme de corrélation?

A
  • H1 = il y a une relation significative entre les 2 variables et donc il y a une corrélation entre elles
  • H0 = il n’y a pas de relation significative entre les 2 variables et donc il n’y a aucune corrélation entre elles
43
Q

Sur quoi est-ce que le seuil de signification p nous informe?

A

Sur la probabilité de commettre une erreur alpha (faux positif) -> conclure que r existe alors que r = 0

44
Q

Le seuil de signification p en norme en psycho est 0,05. Qu’arrive-t’il si (en lien avec H1, H0 et la corrélation):
a) p > 0,05
b) p <= 0,05

A

a) Accepte H0 / Rejette H1 = aucune corrélation
b) Rejette H0 / Accepte H1 = corrélation -> on doit l’interpréter

45
Q

En psycho, quels sont les r pour une taille de corrélation:
a) Faible
b) Modérée
c) Forte

A

a) +/- 0,10
b) +/- 0,30
c) +/- 0,50 +

46
Q

Vrai ou faux: lorsque le seuil de signification p est supérieur à 0,05 on ne peut pas interpréter sa taille et sa direction

A

Vrai

47
Q

Qu’est-ce qui explique qu’une corrélation entre 2 variables n’est pas parfaite?

A

D’autres variables (parasites) expliquent aussi le phénomène
Ex. la corrélation entre le niveau de scolarité et le salaire est de 0,56 -> pas parfaite, car le salaire n’est pas slm expliqué par le niveau de scolarité, d’autres variables permettent aussi de l’expliquer

48
Q

Def. coefficient de détermination

A
  • Il indique jusqu’à quel point une corrélation viendra réduire notre incertitude quant à la relation entre x et y.
  • Il indique le % de réduction de l’incertitude
  • Lorsqu’il arrive tel phénomène à la variable x, à quel point on est capable de prédire ce qu’il arrivera à y.
49
Q

Quelle est la réduction de l’incertitude lorsque:
a) La corrélation est nulle
b) La corrélation est parfaite

A

a) Réduction de l’incertitude est de 0%
b) Réduction de l’incertitude est de 100%

50
Q

Comment on trouve le coefficient de détermination?

A

On met la corrélation entre nos 2 variables au carré. On peut le mettre en % pour avoir le % de réduction de l’incertitude.

51
Q

Qu’est-ce que nous indique le coefficient de non détermination? Comment fait-on pour le trouver?

A

Le degré avec lequel l’incertitude n’est pas réduite (l’incertitude restante)
1 - coefficient de détermination

52
Q

Def. variance commune

A

Lorsque 2 variables ont une corrélation: proportion de la variance qui est expliquée par l’autre variable
-> Ex. à quel point le salaire est expliqué par le niveau de scolarité

53
Q

Lorsque la variance commune est faible qu’arrive-t’il à:
a) Nb de variables autres qui peuvent expliquer ce phénomène
b) Corrélation entre les 2 variables
c) Pourcentage de réduction de l’incertitude

A

a) Plusieurs autres variables peuvent être en cause de ce phénomène
b) La corrélation entre les 2 variables est faible
c) Le pourcentage de réduction de l’incertitude est faible (il reste encore bcp d’incertitudes sur les causes de la variable)

54
Q

Vrai ou faux: lorsqu’une relation n’est pas significative, on doit considérer que sa corrélation est de 0

A

Vrai. Il ne faut donc pas en tenir compte.

55
Q

REMARQUE

A

Fait attention aux questions:
regarde si c’est causal ou si c’est juste corrélationnel (fait attention si ça dit quelque chose cause quelque chose)