Cours 5 corrélation Flashcards

1
Q

Qui suis-je?

Je suis l’indice d’ajustement entre 2 variables

A

Le coefficient de corrélation r

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que le r (mathématiquement parlant)?

A

C’est la covariance entre 2 variables divisé par le produit des écart types

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la covariance?

A

C’est la variance des variable ensemble.

Contrairement à la variance qui est la variance de la variable avec elle même

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux

Dans la formule du r, la covariance ne peut pas être plus grande que le produit des écarts-type?

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que représente le r-carré?

A

Le pourcentage de variance expliquée d’une variable par l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Le coefficient de corrélation est … des échelles de mesure

A

Le coefficient de corrélation est indépendant des échelles de mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que tient compte le coefficient de corrélation ajusté (radj)? Et pourquoi?

A

Il tient compte de N et corrige ce biais. Car lorsque l’échantillon est petit, le coefficient de corrélation d’un échantillon (r) est un estimateur biaisé du coefficient de corrélation de la population (p).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Le coefficient de corrélation est un indice …

A

Standardisé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vrai ou faux

La commande SPSS CORRELATION fournit à corrélation ajustée.

A

FAUX

La commande SPSS CORRELATION ne fournit pas la corrélation ajustée, mais il est facile d’obtenir un r-carré ajusté avec la commande REGRESSION

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vrai ou faux

La corrélation ajusté est toujours plus petite

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qui suis-je?

Je suis le meilleur prédicteur linéaire

A

La droite de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

À quoi sert la droite de régression?

A

Permet de faire des prédictions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux

Il y a autant de point dessus et sous la droite de régression?

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans ^Y = (0.783x) + 73.89, que signifie 0.783?

A

Donc quand je change une unité de x, ^Y change de 0.783 unité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans la corrélation, dequoi dépend la puissance?

A

Comme pour le test t, la puissance du r dépend de la taille d’effet (d) et de la taille de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dans le cas du coefficient de corrélation, comment estimons nous la taille d’effet?

A

La taille d’effet = corrélation : d = p (corrélation attendue (soit la corrélation de la population))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment calculer la puissance?

A

Comme pour le test t, on utilise une table de puissance et calculons delta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qu’est-ce que la puissance?

A

C’est la probabilité de démontrer ce qu’ont veut démontrer. On peut l’estimer avec la statistique delta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelle est la différence entre les différentes corrélation?

A

En fait, le calcul du r est le même. Tout ce qui va changer c’est comment on fait le test d’inférence

20
Q

Quelles sont les 3 caractéristiques nécessaire afin que le coefficient de corrélation de Pearson fonctionne bien?

A
  1. La relation entre les variables doit être linéaire
  2. Les variables ont des échelles continues
  3. Les données respectent les postulats : D’homogénéité des variance et de normalité de distribution d’échantillonnage.
21
Q

Qui suis-je?

Je suis la mesure de corrélation la plus utilisée

A

Le coefficient de corrélation de Pearson

22
Q

Qu’est-ce que la mesure de corrélation?

A

C’est un indice du lien entre deux variables représentant au moins des niveau ordonnés de la mesure.

Variable ordinale : Ex échelle de likert

Ex : Score de dépression 40 est plus gros que 20

23
Q

Qu’est-ce que la mesure d’association?

A

Elle s’applique même si différentes valeurs de la variable ne représentent pas une diminution ou une augmentation ordonnée d’une certaine quantité.

Variable catégorielle : Ex : Échec/réussite, Libérale/conservateur. Données non ordinales

24
Q

Quelles sont les conditions d’utilisation de la corrélation bisérielle de point rpb?

A
  1. Variables dichotomique. En fait, le coefficient de corrélation bisérielle de point concerne la situation dans laquelle une des deux variables est dichotomique
  2. Non respect de la distribution normale (car détient seulement 2 valeurs)
  3. Variables continue
  4. S’utilise partout où les corrélations de r de Pearson sont utilisés
25
Q

Que représente a) la pente de la droit de régression et b) l’O,O dans rpb?

A

a) La pente c’est la différence entre les moyennes des 2 groupes
b) Ex : Y moyen du groupe 0. (ex: Le poid moyen des hommes)

26
Q

Qu’est-ce qui nous permet de transformer la corrélation bisérielle en t?

A

Il y a une relation importante en rpb et t.

27
Q

Dans la formule du rpb-carré, que représente le t?

A

t est la valeur du test-t de la différence entre les moyenne pour deux échantillons indépendants de tailles inégales (dl - n1+n2-2 ou N-2)

28
Q

Avec rpb, comment calculer la taille d’effet?

A
  1. À partir des différences de moyennes

2. À partir de la valeur du coefficient de corrélation rpb car il existe une relation directe entre t et rpb

29
Q

Quelles sont les conditions d’utilisation de la corrélation phi?

A
  1. La corrélation entre DEUX variables dichotomiques ex: Relation entre le sexe (hommes/femmes) et l’emploi (avec ou sans emploi)
  2. Test khi carré plutôt que test t (car données catégorielles)
  3. On calcule r de la même façon que corrélation de Pearson
30
Q

Vrai ou faux

Le test khi carré avec phi est le même khi carré que pour les tables de contingence?

A

Vrai

31
Q

Qu’est-ce que la corrélation bisérielle et tétrachorique?

A

Ex: Les gens sont victimes de divers niveau d’abus sexuels, et même si tout abus est négatif, certains actes sont plus grave que d’autres. Donc, il y a abus/ non abus, mais il est a des catégories entre.

Donc, ces corrélations prennent en compte cette continuité sous-jacente, ce qui permet d’estimer ce que la corrélation aurait été si la variable avait été normalement distribuée plutôt qu’une dichotomie

32
Q

Vrai ou faux

Le test associé à la corrélation bisérielle et tétrachorique sont généralement moins puissant que les tests des corrélations bisérielle en point rpb et phi

A

FAUX

Généralement plus puissance

33
Q

Décrivez les données rangées.

A

Ranger : Associer un rang à des données qui sont en ordre croissant où la plus petit valeur a le rang un et la plus grande valeur le rang n

Consiste à ranger des ensembles de données de mesure lorsqu’on a de sérieuses réserves quant à la nature de l’Échelle de mesure sous-jacente. Dans ce cas, on remplace les scores bruts par des rangs

34
Q

Quelles sont les conditions d’utilisation du rho de Spearman (rs) et le tau de Kendal (T) pour données rangées (données ordinales)?

A
  1. Le rho de Spearman repose sur le même principe que pour le r de Pearson. On utilise rho sur données ordinales
  2. Le tau de Kendal (T) est un indice similaire au rho, mais il est basé sur le nombre d’inversion de rang lorsque l’on range les données en considérant 2 variables
35
Q

Comment estimé rho et tau?

A

Des calculs permettent des estimés non paramétriques et conservateur de ces coefficients et l’obtention d’un niveau de signification - ces tests sont moins puissants que les autres tests pour les corrélations, ils s’obtiennent avec la commande NONPAR CORR de SPSS

36
Q

Que permet de calculer le coefficient de concordance de Kendall (W)?

A

Permet de calculer des accords interjuges lorsqu’il y a plus de deux juges

37
Q

Vrai ou faux?

Les variables dichotomiques peuvent être utilisées dans le calcul des coefficients de corrélation

A

Vrai

38
Q

Que faire lorsque la relation étudiée porte sur deux variables dichotomiques?

A

Un test khi carré

39
Q

Donner un exemple de corrélation bisérielle de point rpb.

A

Nous cherchons à savoir si le sexe d’un individu influence/prédit son poids (poids en fonction du sexe)

40
Q

Quel test utilise la corrélation bisérielle de point rpb? dl?

A

Le test t avec N-2 dl

41
Q

Qu’est-ce que la corrélation bisérielle?

A

C’Est l’équivalent directe de la corrélation bisérielle de point, sauf que, la corrélation bisérielle suppose qu’une distribution normale sous tend la variable dichotomique

42
Q

Qu’est-ce que la corrélation tétrachorique?

A

L’équivalent directe de phi, mais on suppose qu’une distribution normale sous-tend les deux variables

43
Q

Donner un exemple de corrélation pour donné rangées.

A

On pourrait demander à des juges de classer des objets par ordre de préférence sous deux conditions différentes et vouloir connaître la corrélation entre es deux ensemble de rangs.

44
Q

Rangez les données suivantes : 5.8.9.12.12.15.16.16.16.17

A

On donne le rang 1 à la plus petite valeur (5). Les deux valeur suivante (8 et 9) se voient assigner les rangs 2 et 3. On a ensuite deux valeurs égales (12) qui doivent être classées. Si elles n’étaient pas égales, on leur attribuerait les rangs 4 et 5 ; on divise donc la différence pour leur assigner à toutes les deux le rang 4.5. Le sixième nombre (15) reçoit le rang 6. Les trois valeurs suivantes (16) sont égales et correspondent aux rangs 7.8.9 ; comme la moyenne de ces rangs est 8, elles reçoivent toutes les trois le rang 8. La dernière valeur (17) se voit attribuer le rang 10.

45
Q

Quels coefficient de corrélation utilise-t-on pour les données rangées?

A

Le coefficient de corrélation de spearman (rs)

46
Q

Quelle est la différence entre le coefficient de spearman et le coefficient de kendall?

A

Spearman considère les rangs comme des scores et calcule la corrélation entre deux ensembles de rangs, kendall base sa statistique sur le nombre d’inversions constatées dans les classements