Cours 5 - Corrélations: Diverses méthodes Flashcards

1
Q

Qu’a-t-on généralement lorsqu’on fait une corrélation de Pearson qui étudie une différence entre des moyennes?

A
  • Une variable indépendante catégorielle (avec ou sans) qui a peu de niveaux
    Ex: groupe traitement et groupe contrôle
  • Une variable dépendante continue qui a de nombreux niveaux
    Ex: score d’anxiété sur une échelle de 0 à 144
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’a-t-on généralement lorsqu’on fait une corrélation de Pearson qui étudie des relations entre des variables ?

A

Deux variables qui ont beaucoup de niveaux possibles
Le chercheur cherche à démontrer que l’une variable varie en fonction de l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une régression et une corrélation en statistique ?

A

Régression
VI: les niveaux sont prédéterminés par le chercheur
VD: variable aléatoire

Corrélation
Les deux variables VI et VD sont aléatoires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une régression et une corrélation dans la pratique ?

A

Régression:
Lorsque le chercheur souhaite prédire la VD à l’aide de la VI

Corrélation:
Lorsque le chercheur souhaite simplement quantifier le degré de relations entre deux variables (fortement reliées ou pas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que représente UN point du diagramme de dispersion ?

A

Chaque point représente un individu, une paire de score (x,y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que fait la droite de régression ?

A

C’est la ligne la mieux ajustée aux données
C’est la valeur de y prédite pour toute valeur de x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que représente le r ?

A

-Le degré auquel les pts se resserrent autour de la droite de régression
-Le degré de correspondance entre les valeurs réelles (Y) et les valeurs prédites (Y barre au dessus) pour les valeurs de X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui est nécessaire pour que la corrélation de Pearson fonctionne bien ?

A

Il faut que la relation entre les variables soit linéaire, ou du moins partiellement linéaire.
Si elle est curvilinéaire, ça ne fonctionnne pas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est la formule de la corrélation r ?

A

r = COVxy / SxSy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est ce que la covariance et quelle est la différence avec la variance ?

A

Degré auquel 2 variables varient ensemble
Idées similaire à la variance, mais pour 2 variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la formule de la covariance ?

A

Diapo 37

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Si la covariance est positive, on observe quoi ?

A

Une valeur de X plus élevée que moyenne x(x barre) sera associée à une valeur y plus élevée que moyenne y
(et inversement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Si la covariance est négative, on observe quoi ?

A

Une valeur de X plus élevée que moyenne X sera associée à une valeur y moins élevée que moyenne y (et inversement)
Voir les diapos 38 à 40

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pourquoi on pondère par les écarts-types de x et y dans la formule du r ?

A

Dans des données ou les écarts-types sont grands, la covariance sera plus grande en termes absolus,
Dans des données ou les écarts-types sont petits, la covariance sera plus petite en termes absolus
En divisant par l’écart-type, on tient compte de cela

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Le test d’hypothèses de la corrélation de Pearson se fait comment ? Pour tester le niveau de signification ?

A

À partir de la distribution t de Student
Formule diapo 42

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Après avoir testé le niveau de signification de la corrélation de Pearson, que faut-il faire en plus de rapporter la valeur de p ?

A

Il faut rapporter une taille d’effet
r en est une
r2 en est aussi une

17
Q

Comment Cohen interprète-t-il les tailles d’effet ?

A

Petite: r= 0.1 et r2= 0.01 (1% de variance expliquée)
Moyenne: r=0.3 et r2 = 0.09 (9% de variance expliqué)
Grande: r=0.5 et r2= 0.25
Mais ne pas s’y fier à la lettre

18
Q

Quel test effectuer pour la corrélation entre deux variables continues ?

A

Corrélation de Pearson (r)

19
Q

Quel test effectuer pour la corrélation entre une variable dichotomique et une variable continue ?

A

Corrélation bisérielle de point (rpb)
**dichotomique = 2 variables possibles (ex: traitement ou pas traitement)

20
Q

Quel test effectuer pour la corrélation entre 2 variables dichotomiques ?

A

Coefficient phi

21
Q

Quels tests effectuer pour la corrélation entre 2 variables rangées ?

A

Coefficient de corrélation de Spearman pour les données rangées (rs) –> Si données ordinales
Coefficient tau de Kendall (T)

22
Q

Quelle formule utilise-t-on pour la corrélation bisérielle de point (rbp)?

A

La formule du r de Pearson

23
Q

Comment teste-t-on le niveau de signification de la rbp ?

A

à partir de la distribution t de Student (même que pearson) voir diapo 56 à 60

24
Q

Quelle est la relation entre rpb et t (student) ?

A

r2pb= t2/ (t2+dl)
Permet de les transformer l’un en l’autre

t s’obtient à partir de différences de moyennes, et rpb s’obtient par une corrélation
On peut alors transformer l’un en l’autre, ils ne sont pas si différents

25
Q

Formule à utiliser pour trouver le coefficient phi:

A

formule standard du r de pearson
diapo 67

26
Q

Comment teste-t-on le niveau de signification du coefficient phi ?

A

Trouver valeur p (khi carré)
VOIR DIAPO 69

27
Q

Quelle est la relation entre phi et khi 2 ?

A

On peut calculer le même phi en faisait un test du khi carré, puis en utilisant la formule
phi= racine carrée de (khi2/N)

28
Q

Comment calcule-t-on le coefficient de corrélation de Spearman pour données rangées ?

A

formule du r de pearson
diapo 78 à …

29
Q

Quel est le problème avec rho de Spearman (rs) ?

A

Il n’existe aucune manière acceptée par tous de calculer l’erreur standard lors de petits échantillons
Les corrélations pour données rangées sont souvent utilisées dans des contextes ou l’utilisation de petits échantillons est plus pratique

30
Q

Coefficient de Kendall (tau): sur quoi est basé le calcul ?

A

Le concept d’inversion de rang
t(tau) = (1- (2*nb d’inversions)) / nb de paires d’objets possibles

Nb de paires d’objets possibles
(N(N-1))/2=

31
Q

Comment compter les inversions pour le coefficient de Kendall ?

A

Pour chaque ligne, compter le nb de lignes plus basses qui ont un rang plus petit
Voir diapo 81-82

32
Q

Quels sont les avantages du coefficient de kendall par rapport au rho de spearman ?

A

Il existe une manière de calculer erreur standard
tau est ditribué de manière normale pour N> ou égal à 10
On peut donc approximer la distribution de tau à l’aide de la distribution normale Z et obtenir une valeur p à partir de la distribution Z pour faire un test d’hypothèse