Séance 13 : La corrélation Flashcards

1
Q

Quel est le point commun entre les tests effectuées jusqu’à présent?

A

Nous nous intéressons toujours aux différences de moyennes. On manipule toujours une variable indépendante et on regarde l’effet sur la variable dépendante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Sur quoi on va s’attarder à partir de maintenant (corrélation et régression)?

A

Sur les RELATIONS qui peuvent exister entre les variables :

  • Observation du lien entre 2 phénomènes (aucune manipulation expérimentale -> pas de manipulation de la VI requise (parfois m pas de participants))
  • Ne permet pas d’établir de relation causale (on ne peut pas dire que x a causé y ou vice versa… seulement si relation entre les 2)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Exemples de variables sans lien causal dont on peut observer le lien entre

A

ex: comparer réponses entre choix de réponses et développement
ex: comparer la taille et le poids (pas un qui cause l’autre, sont réciproques, mais liés)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que la corrélation?

A

Statistique qui permet d’estimer le degré de
relation entre 2 variables (généralement mesurée sur les
mêmes individus*).

  • Pas toujours les mêmes individus (p. ex., relation entre la prise de poids
    chez la mère pendant la grossesse et le poids du bébé à la naissance).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que sont les deux caractéristiques de la relation qu’on estime?

A

Estime la direction (ou sens) (positive ou négative) et la force (faible, modérée, forte) de la relation
entre 2 variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Par quoi on peut remplacer les termes VI et VD?

A

par « variables corrélées » ou
« corrélats », ce qui diminue le risque
d’interprétations erronées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que le postulat de causalité?

A

Pour déterminer qu’un phénomène en cause un
autre (lien causal), il faut respecter trois conditions
logiques:

  1. Variable X et variable Y doivent être interreliées (condition de relation).
  2. La cause doit précéder l’effet (condition
    d’antécédence temporelle).

3.La relation entre X et Y ne doit pas être
expliquée par une troisième variable confondante (AUSSI APPELÉE MÉDIATRICE)
(condition d’absence d’explications alternatives).
=> je dois m’assurer que la seule chose qui change soit le traitement (ex: notes entre lingu et psuy… seule diff doit être le programme d’étude … RARE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Donne 3 exemples de situations où une variable médiatrice intervient (x peut pas être expliqué à cause de y et vice versa)

A

ex: lien entre vente
de crèmes glacées
et noyades…

variable
médiatrice = température (qd
il fait beau, gens fréquentent 
plus les piscines et la plage
et mangent + de crème glacée)

ex: lien entre nbr bars et d’églises
var. méd : nbr d’habitants

ex: lien entre nbr nids de cigognes et
le nbr de naissances dans une ville

var.med: milieu de vie (ds milieux ruraux, nbr naissance plus élevés, mais aussi plus nature donc plus cigognes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Lesquelles conditions sont remplies par la corrélation? Cela veut dire quoi?

A

La seule condition remplie par la
corrélation est la condition 1

  1. pas respectée, car desfois diff a voir laquelle vient avant (ex: motivation et notes scolaires…) est-ce sa motivation influence sa performance ou sa performance sa motivation?
  2. pas toujours respectée non plus (voir autre question des exemples)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’exprime la corrélation?

A

La corrélation exprime de façon quantitative la force d’une
relation linéaire entre deux variables mesurées sur un
même groupe d’individus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La corrélation est une mesure descriptive ou inférentielle?

A

Les deux, la corrélation est d’abord une mesure descriptive (nous informe à propos de la relation dans l’échantillon
seulement (direction et force))., mais
elle peut également être utilisée comme statistique
inférentielle (lorsqu’on veut savoir est-ce que cette corrélation reflète une relation réelle
dans la population ou si elle provient du hasard ? => est-elle généralisable)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Exemples de corrélations.

A

Lien entre la taille et la pointure de souliers (monte, monte)

Lien entre le nombre d’heures d’étude et le score à l’examen (monte, monte)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment représente-t-on le lien entre 2 variables?

A

La façon dont 2 variables sont reliées entre elles peut être représentée à l’aide d’un diagramme de
dispersion (aussi appelé nuage de points; scatterplot en anglais).

Le diagramme est composé des
variables X et Y.

Chaque individu est représenté par
un point dont la position cartésienne
est représentée par (Xi, Yi).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quand y a t’il corrélation parfaite?

A

Quand tous les points sont alignés sur une droite

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la corrélation sur le nuage?

A

degré de rapprochement entre données et droite (plus regroupées près de la droite, plus la corrélation est élevée)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel est le problème quand on compare la grosseur du cerveau et le QI?

A

Il y a une variable médiatrice : la taille du corps. Il faut la contrôler et en tenir compte. Les animaux les plus intelligents sont ceux qui ont une grosse tête p/r à leur corps (dauphin, requin)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

V ou F : Il n’existe que la relation linéaire.

A

Il existe plusieurs types de relations entre les variables
et on peut les identifier par la forme du diagramme de dispersion.

Par contre, La corrélation permet de détecter seulement les
relations linéaires (c’est un de ses postulats).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Donne 3 types de relations.

A

Linéaire : droite, 0 changement de direction

Quadratique :1 seul changement de direction, monte puis redescend… ou inverse

Cubique: W ou N, 2 changements de direction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Donne un exemple de relation quadratique

A

Le niveau de stress et la performance.

Pas assez : Ennui
Juste assez : performance
trop : épuisement,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce qu’une corrélation positive?

A

Les valeurs les plus élevées de X sont associées aux

valeurs les plus élevées de Y. « Quand X augmente, Y augmente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce qu’une corrélation négative?

A

Les valeurs les plus élevées de X sont associées aux

valeurs les moins élevées de Y. « Quand X augmente, Y diminue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

V ou F : Plus une relation est forte, plus les points seront groupés
suivant une relation linéaire.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Qu’est-ce qu’une corrélation nulle? Donne un ex.

A

Aucune corrélation entre les deux variables. Deux valeurs similaires
sur X peuvent être associées à deux valeurs opposées sur Y (nuage de points épars)

ex: entre pointure
de souliers et score
à l’examen

24
Q

Qu’est-ce qu’une corrélation parfaite? Donne un ex.

A

Il y a une relation parfaitement linéaire (points parfaitement alignés) entre les deux variables. Un
changement sur X est associé à un changement proportionnel sur Y (si j’augmente de 3 sur x, j’augmente de 3 sur y).

ex: relation entre nbr d’années depuis naissance
et âge… mais pas mal le m concept

25
Q

Qu’est-ce que le coefficient de corrélation?

A

Est une estimation de la direction et de la force de la
relation linéaire entre 2 variables

Est une valeur qui varie entre -1 et 1.

26
Q

Qu’indique le signe du CC?

A

signe indique la direction de la relation:
• (+) = relation positive;
• (-) = relation négative

27
Q

Qu’indice la valeur numérique du CC?

A

La valeur numérique indique la force de la relation:
• -1 et 1 = relation linéaire parfaite;
• 0 = absence de relation linéaire

28
Q

V ou F : Le CC est calculé toujours de la même façon.

A

Faux,

Le coefficient de corrélation est calculé différemment selon l’échelle de mesure:
• Échelles intervalle ou ratio = r de Pearson;

  • Échelle ordinale = r de Spearman ou tau de Kendall;
  • Échelle nominale = Phi de Cramer.
29
Q

Quel est le CC utilisé et ses caractéristiques?

A

Le r de Pearson. Le plus simple à interpréter (et le plus puissant: permet plus facilement de déterminer une diff significative et donc un lien entre les variables)

Autres = utilisées quand on respecte pas le postulat

30
Q

Qu’est-ce que le CC p/r à la covariance?

A

r

Coefficient de corrélation: Mesure standardisée de la
covariance entre deux variables.

Covariance: Dans quelle mesure les variations d’une
variable sont associées aux variations de l’autre
variable.

31
Q

Comment vérifier la covariance dans un nuage de points?

A

Il faut avoir un patron constant.

Pour vérifier, prendre 2 paires de points et regarder s,Ils suivent la m tendance (ex: 1 monte x, autre aussi et 1 monte y, autre aussi (x2)) + regarder la FORME du nuage de points

32
Q

Diff entre covariance et variance?

A

Formule de covariance permet voir a quel point les variables varient ensemble (ex: score à l’examen et heures d’étude), mais variance juste pour un échantillon (ex; variabilité des scores des étudiants à l’examen)

33
Q

Comment on calcule le r?

A

Covariance de X et de Y divisée par le produit de leurs écarts-types respectifs.

r = Degré auquel les deux variables varient ensemble /
Degré auquel les deux variables varient séparément

34
Q

Comment on interprète r?

A

On dit sa direction et sa force (avec le barème ou le coefficient de détermination r^2

ex: relation linéaire positive forte significative

35
Q

Quel est la barème de Cohen?

A

0,50 et + : Forte
0,30 à 0,49 : Moyenne
0,10 à 0,29 : Faible

36
Q

Comment on interprète le coefficient de détermination r^2?

A

% de variance commune entre les 2 variables (pour
corrélation); => représente la zone de chevauchement

Ex: Exemple: Vous désirez connaître la force de la relation
entre la taille (X) et le poids (Y) chez les athlètes.
• r = .78
• r2 = .61
• Il y a 61% de variance commune entre la taille et le poids;

37
Q

Quand utilise t’on r et quand r^2 ?

A

si trouver la force selon barème = r (de corrélation)

si trouver % variance partagée = r^2 (de détermination)

38
Q

Quels sont les postulats de la corrélation (et de la régression)?

A
  1. Relation linéaire entre X et Y;

• Moins de chance d’observer une corrélation si la relation
n’est pas linéaire
.
2. Variables sur une échelle d’intervalles ou de ratio;

  1. Les deux variables doivent se distribuer normalement;
  2. Homogénéité des variances;
  3. Taille de l’échantillon: Les petits échantillons sont moins
    variables et, donc, tendent à sous-estimer la corrélation
    réelle. Les barèmes varient, mais plusieurs auteurs
    suggèrent un n minimal de 20.
39
Q

Comment on examine les postulats?

A

Avec le diagramme de dispersion.

  1. Homogénéité : les points doivent suivre une même tendance tout le long
  2. Linéarité : suit une ligne, mouvement du haut vers le bas (ou vice versa), une seule direction
  3. Normalité : doivent être à même distance de la droite (symétrie)
40
Q

V ou F : les données n’influencent pas la corrélation.

A

Faux, Les résultats extrêmes influencent fortement la
variabilité et, conséquemment, le coefficient de
corrélation.

41
Q

Quels sont les facteurs influencant la corrélation?

A
  1. données extrêmes

2. étendue des données

42
Q

Comment l’étendue influence la corrélation?

A

+ l’étendue est petite, - les données tendent à varier, donc plus la corrélation est petite

+étendue grand
+corrélation grande

43
Q

Donc, que permet l’inspection visuelle du diagramme de dispersion?

A
  • Vérifier si les postulats sont respectés (homogénéité, normalité, linéarité);
  • Détecter la présence de données extrêmes;
  • Évaluer l’étendue des données.

=> On ne peut pas juste se fier au coefficient de corrélation.

44
Q

Que permet le test inférentiel sur la corrélation?

A

permet de
déterminer si ρ (rhô; coefficient de corrélation dans la
population) est:

  • Différent de 0 (bilatéral); => si c’est une linéaire significative ou non
  • Supérieur ou inférieur à 0 (unilatéral).
45
Q

Quelle distribution d’échantillonnage utilise-t-on?

A

Utilisation de la distribution d’échantillonnage du t de

Student avec n – 2 dl

46
Q

V ou F : Le test est le même que pour test t sur éch.

A

Faux, t = r x racine(n-2) / racine(1-r^2)

47
Q

Étape 1 à la main

A

Identifier les hypothèses statistiques (H0 et H1)

UNILATÉRAL

H0 : ρ ≤ 0
(il n’y a pas de relation linéaire positive entre les
variables dans la population)

H1 : ρ > 0
(il y a une relation linéaire positive entre les 2 variables
dans la population)

BILATÉRAL

  • H0 : ρ = 0 (il n’y a pas de relation linéaire dans la pop)
  • H1 : ρ ≠ 0 (il y a une relation linéaire dans la pop)
48
Q

Étape 2 à la main

A

alpha uni ou bi

49
Q

Étape 3 à la main

A

a. choix du test : test de corrélation de pearson
b. conditions d’utilisation:
- n suffisamment grand (>20)
- 2 variables sur échelle intervalle ou ratio
- relation linéaire entre les 2 variables
- homogénéité des variances
- variables distribuées normalement
c) distribution d’échantillonnage du T de student avec n-2 dl
d) calculs : tobs(8) = donné

50
Q

Étape 4 à la main

A

Tcrit : dans la table du T avec alpha et dl

Décision statistique
tobs(18)= 3,90 > t crit(18) = 2,55

*faire attention avec signes

51
Q

Étape 5 à la main

A

Conclusion selon le contexte

On conclut qu’il y a une relation linéaire positive
significative (tout ça) entre le niveau d’anxiété et le montant
dépensé en cadeaux de Noël.

Dans un texte scientifique, on pourrait également
décrire la force de la relation: Une corrélation de .677
est typiquement décrite comme forte, et on peut dire
aussi qu’il y a 46% de variance commune entre le
montant dépensé pour Noël et le score d’anxiété.

52
Q

Première chose à regarder dans SPSS

A

Si sig sorti est unilatéral ou bilateral

53
Q

Que faire si la première chose à regarder diffère de l’hypothèse?

A

Si l’hypothèse est unilatérale et le test
SPSS est bilatéral, on divise le p par 2

Si l’hypothèse est bilatérale et le test SPSS
est unilatéral, on multiplie le p par 2

54
Q

Étape 4 avec spss

A

r(18) = 0,001 < alpha = 0,01. On rejette H0.

  • on rapporte r et sur papier t
  • vérifier si différence dans m direction que hypothèse

seule diff sauf calcul spss

55
Q

Que faire quand on demande le pourcentage de variance commune à partir de sortie SPSS ?

A

Mettre corrélation de pearson à la 2 et faire x100