Cours 5 Flashcards

1
Q

Qu’est-ce qu’un coefficient de corrélation r (de Pearson)?

A

Un indice de l’ajustement entre deux variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

VRAI ou FAUX

Le coefficient de corrélation r de Pearson peut-être positif ou négatif suivant la relation entre les variables

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Le coefficient de corrélation r de Pearson varie de […] à […]

A

Le coefficient de corrélation r de Pearson varie de -1 à 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La valeur […] et […] présent une relation parfaite alors que […] est une absence de relation

A

La valeur -1 et 1 présent une relation parfaite alors que 0 est une absence de relation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Avec le coefficient de corrélation r de Pearson, plus la corrélation est forte, plus les points sur le diagramme de dispersion sont resserrés […] de la droite de régression

A

Avec le coefficient de corrélation r de Pearson, plus la corrélation est forte, plus les points sur le diagramme de dispersion sont resserrés autour de la droite de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est la différence entre la valeur r et la valeur R?

A

r: Corrélation simple, Coefficient de corrélation
R: Corrélation multiple -> Corrélation entre deux ensembles de variables ou une variable et un ensemble de variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

R et r sont des estimés sur des […]

A

R et r sont des estimés sur des échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Chacun des points sur un diagramme de dispersion représentent une […].

A

Chacun des points sur un diagramme de dispersion représentent une unité d’observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

La corrélation (simple ou multiple) va nous dire dans quel mesure les […] sont alignés par rapport à notre droite de […]

A

La corrélation (simple ou multiple) va nous dire dans quel mesure les points sont alignés par rapport à notre droite de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi utilise-t-on une droite de régression?

A

La droite de régression nous permet de prédire la valeur de y en fonction de x.
-> Elle est placée en plein centre des unités d’observation pour permettre d’estimer l’emplacement des points

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pourquoi les points (unités d’observation) dans un diagramme de dispersion ont tendance à faire des nuages?

A

Car ils correspondent majoritairement à la courbe normal, et donc plus concentrés au milieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans un diagramme de dispersion, s’il n’y avait aucune corrélation entre les variables, le nuage de point sera […]! On ne pourra pas placer une […] qui permettra d’estimer l’emplacement des points

A

Dans un diagramme de dispersion, s’il n’y avait aucune corrélation entre les variables, le nuage de point sera circulaire! On ne pourra pas placer une droite de régression qui permettra d’estimer l’emplacement des points

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la variance?

A

Indice de dispersion de la distribution

-> Différence entre la valeur observée - la moyenne / N - 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la moyenne?

A

Indice de localisation de la distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la covariance?

A

Dans quel mesure les données ont des variances conjointes à ceux de l’autre distribution?
-> À la place de calculer les écarts par rapport à une variable, maintenant on calcule pour 2. Pu de différence au carré car on multiplie les deux différences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Avec le coefficient de corrélation de Pearson (r), on fait la […] de la […] pour obtenir un écart-type

A

Avec le coefficient de corrélation de Pearson (r), on fait la racine carré de la variance pour obtenir un écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

VRAI ou FAUX

Pour obtenir la variance à partir de la covariance, on peut faire la racine carré de la covariance

A

FAUX

Il est impossible de faire la racine carré de la covariance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Avec le coefficient de corrélation de Pearson (r), lorsqu’on utilise SPSS la “sig. bilatéral” est quoi?

A

La probabilité d’observer cette corrélation si H0 est vraie (si la différence est dû au hasard) est de …

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelles sont les caractéristiques particulières du coefficient de corrélation de Pearson (r)? (3)

A

1) Le coefficient de corrélation est indépendant des échelles de mesure
2) C’est un indice standardisé
3) Le coefficient de corrélation d’un échantillon (r) est un estimateur biaisé du coefficient de corrélation de la population (r) lorsque l’échantillon est petit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Le coefficient de corrélation au carré (r2 ou R2) - le r-carré - représente quoi?

A

Le coefficient de corrélation au carré (r2 ou R2) - le r-carré - représente le pourcentage de variance expliquée d’une variable par l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Le coefficient de corrélation […] tient compte de N et corrige le biais.

A

Le coefficient de corrélation ajusté tient compte de N et corrige le biais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Que veut-on dire par standardisé lorsqu’on parle du coefficient de corrélation de Pearson (r)?

A

Peu importe les variables utilisées, lorsqu’on parle de coefficient de corrélation, ce sera tjrs entre -1 et 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Pourquoi utilise-t-on le coefficient de corrélation de Pearson au carré (r2)?

A

Les valeurs négatives disparaissent. Ça devient aussi un pourcentage de variance expliquée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Pourquoi utilise-t-on le coefficient de corrélation de Pearson au carré (R2)?

A

Quand on a plusieurs variables, il est difficile de dessiner un nuage de points et de se l’imaginer (plusieurs ensemble de variable et donc graphique sur plusieurs dimensions) donc le pourcentage de variance expliquée nous aide à imager les résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Le r au carré ajusté ajuste quoi?

A

L’ajustement est seulement pour les petits échantillons. On vient tenir compte du fait que r est un estimateur un peu biaisé dans les petits échantillons

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

La commande SPSS CORRELATION ne fournit pas la corrélation ajustée, mais il est facile de l’obtenir un r2 ajusté avec la commande […]

A

La commande SPSS CORRELATION ne fournit pas la corrélation ajustée, mais il est facile de l’obtenir un r2 ajusté avec la commande REGRESSION

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Pour la puissance du r de Pearson, comme pour le test-t, dépend de la taille de […] (d) et de la taille de

A

Pour la puissance du r de Pearson, comme pour le test-t, dépend de la taille de l’effet (d) et de la taille de l’échantillon (n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Dans le cas du coefficient de corrélation r de Pearson, nous estimons que la taille d’effet attendue […] la corrélation attendue : d = p1 , la corrélation attendue

A

Dans le cas du coefficient de corrélation, nous estimons que la taille d’effet attendue égale la corrélation attendue : d = p1 , la corrélation attendue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Pour la puissance du r de Pearson, comme pour le test-t, nous calculons une valeur […]et utilisons une table de […] pour estimer la puissance

A

Pour la puissance du r de Pearson, comme pour le test-t, nous calculons une valeur d et utilisons une table de puissance pour estimer la puissance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Donnez un exemple de la façon d’énoncer le calcul de puissance pour le r de Pearson

A

Si nous voulons une puissance de X.XX, en regardant dans la table, nous voyons qu’il faut d(delta) = X.X
Nous avons: [Calcul]

Pour avoir une puissance de X.XX, avec une corrélation attendue de X.XX, il nous faut XX participants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Quelles sont les conditions d’utilisation du coefficient de corrélation de Pearson (r)? (3)

A

1) La relation entre les variables est linéaire
2) Les variables ont des échelles (plutôt) continues
a) Peut inclure l’échelle de Likert (Fonctionne un peu moins bien lorsque les variables sont dichotomiques, mais certains tests permettent quand même l’utilisation de la corrélation de Pearson)
3) Respecte les postulats
a) Homogénéité des variances
b) Normalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Le […] est la mesure de corrélation la plus utilisée

A

Le coefficient de corrélation de Pearson (r) est la mesure de corrélation la plus utilisée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

VRAI ou FAUX

Si les variances ne sont pas très similaires, il est impossible de faire la corrélation de Pearson

A

FAUX.
Il faut que les variances soient à peu près similaires.
-> Si elles ne le sont pas, il y a des calculs qui nous permettent de modifier la corrélation de Pearson pour avoir des données/corrélation qui fonctionnent

34
Q

Qu’est-ce qu’une mesure de corrélation?

A

Indice du lien entre deux variables représentant au moins des niveaux (rang) ordonnés de la mesure
-> Il y a une augmentation de “moins” à “plus” d’une quantité avec les valeurs des deux variables

35
Q

Qu’est-ce qu’une mesure d’association?

A

S’applique même si différentes valeurs de la variable ne représentent pas une diminution ou une augmentation ordonnée d’une certaine quantité
-> Ex: Aux États-Unis, l’association entre le sexe ou la race et les intentions de vote (républicains/démocrates)

36
Q

Qu’est-ce que la dichotomie?

A

Variable pouvant prendre deux valeurs

  • > P.e. Groupe expérimental/groupe témoin, réussite/échec, marié/non marié, etc
  • > Il y a toujours une valeur qui ressemble à un genre d’intervalle/rapport
37
Q

Les données dichotomiques ne respectent pas la distribution […] (l’inférence statistique est plus difficile)

A

Les données dichotomiques ne respectent pas la distribution normale (l’inférence statistique est plus difficile)

  • > Peut prendre n’importe quelles valeurs (0,1), (1,2) (7,12) …
  • > Généralement on choisi (0,1), car cela facilite les calculs
38
Q

Quelle est la différence entre les inférence statistiques la corrélation bisérielle de point r pb

A

L’inférence statistique (tester les hypothèses) va être un peu plus compliqué avec des valeurs dichotomiques! On peut faire le Khi carrée
Pour la corrélation bisérielle de point, on peut utiliser des variables dichotomiques

39
Q

Qu’est-ce que la corrélation bisérielle de point r pb

A

Un calcul entre une variable dichotomique et une variable continue
-> Le calcul et l’interprétation est la même qu’avec le test de Pearson, mais les tests d’hypothèses seront légèrement différents et peut présenter des difficultés d’inférence (test d’hypothèse)

40
Q

Où s’utilise la corrélation bisérielle de point r pb?

A

S’utilise partout où les corrélations r de Pearson sont utilisées - p.e. régressions, analyses factorielles

41
Q

r pb = […]

A

r pb = r

42
Q

Qu’est-ce qu’on observe par rapport au diagramme de dispersion dans les cas de corrélation bisérielle de point (r pb)?

A

Notre variabilité peut seulement prendre 2 valeurs (Seulement 2 types de X).
-> Pas de variabilité sur l’axe des X, seulement sur l’axe des Y

43
Q

VRAI ou FAUX

Il est impossible de mettre en place une droite dans le diagramme de dispersion d’une corrélation bisérielle de point

A

La droite du diagramme de dispersion d’une corrélation bisérielle de point passera par la moyenne des deux variables X et sera placer afin de réduire la variabilité de la droite de régression (minimiser la distance entre chaque point et la droite)

44
Q

Dans le cas d’un diagramme de dispersion d’une corrélation bisérielle, la pente de la droite de régression est la […] entre les […]

A

Dans le cas d’un diagramme de dispersion d’une corrélation bisérielle, la pente de la droite de régression est la différence entre les groupes
-> (Pentes * variable) + ordonnée à l’origine [moyenne du 1er groupe]

45
Q

Décrivez la création d’une droite de régression dans un diagramme de dispersion d’une corrélation bisérielle

A

1) Nous pouvons tracer une droite de régression entre X(dichotomie) et X
2) La droite de régression passe par les moyennes de chaque groupe X(dichotomie 1) = … , X (dichotomie 2) = …
3) Il y a une corrélation r = X.XXX entre les deux variables
4) Le signe négatif du r est arbitraire, car il dépend des valeurs utilisées pour la variable X (dichotomique)
5) Le ra = X.XX c’est-à-dire la variable X (dichotomique) explique XX% de la variance de la variable X (non dichotomique)
6) L’équation de régression est […]

46
Q

Dans une équation de régression, l’ordonnée à l’origine - la constante b- est XXX, la moyenne de la variable (dichotomique 1 ou 2) car ce groupe a la valeur […]

A

Dans une équation de régression, l’ordonnée à l’origine - la constante b- est XXX, la moyenne de la variable (dichotomique 1 ou 2) car ce groupe a la valeur 0

47
Q

La pente de la droite de régression - la constante a - représente une diminution de XX unité de … lorsque l’on passe de la catégorie X (variable dichotomique 1) à la catégorie X (variable dichotomique 2) - C’est la différence entre les […] des deux groupes

A

La pente de la droite de régression - la constante a - représente une diminution de XX unité de … lorsque l’on passe de la catégorie X (variable dichotomique 1) à la catégorie X (variable dichotomique 2) - C’est la différence entre les moyennes des deux groupes

48
Q

Qu’est-ce que le r2 ajusté?

A

Ajusté pour la grandeur de l’échantillon

49
Q

Il y a une relation importante entre rpb et […]

A

Il y a une relation importante entre rpb et t
-> où t est la valeur du test-t de la différence entre les moyennes

Si on connaît la valeur du test t, on peut faire une corrélation r pb. Quand j’ai une corrélation r pb, je peux la convertir en t et vice-versa

50
Q

La difficulté avec les variables dichotomiques, c’est les […]!

A

La difficulté avec les variables dichotomiques, c’est les hypothèses inférentielles

51
Q

Pourquoi utilise-t-on la corrélation bisérielle de point au lieu du test t des moyennes de deux variables indépendantes?

A

Le test T nous dit seulement la différence entre les moyennes. Une différence de moyenne est difficile à visualiser seule comme effet. La corrélation est beaucoup plus facile à comprendre pour nous et à visualiser

-> MAIS il est facile d’utiliser un test t pour tester la signification de r pb. Il s’agit du même test que pour le r de Pearson

52
Q

Quel est le calcul du degré de liberté pour le test de signification de r pb?

A

N - 2

53
Q

Pour la corrélation bisérielle de point, nous pourrions calculer une taille d’effet à partir de quoi

A

Pour la corrélation bisérielle de point, nous pourrions calculer une taille d’effet à partir des différences de moyennes entre les deux groupes

54
Q

La valeur de taille d’effet de la corrélation bisérielle peut aussi être calculée à partir de quoi?

A

La valeur de taille d’effet de la corrélation bisérielle peut aussi être calculée à partir de la valeur du coefficient de corrélation rpb car il existe une relation mathématique directe entre t et rpb

55
Q

Qu’est-ce que la corrélation bisérielle de points?

A

C’est une corrélation de Pearson avec une valeur dichotomique
-> Pour tester si c’est significatif, on fait simplement un test-t

56
Q

Qu’est-ce que le coefficient de phi (o/o de Cramér)?

A

Corrélation entre deux variables dichotomiques

-> Ex: Relation entre le sexe (homme/femme) et l’emploi (au travail/sans-emploi)

57
Q

Le coefficient de phi est en fait un simple […], il se calcule de la même façon

A

Le coefficient de phi est en fait un simple r, il se calcule de la même façon

58
Q

Qu’est-ce qui est différent entre une corrélation typique et un coefficient de phi?

A

Lorsqu’il s’agit de o/o (de Cramér), le test de signification est différent (c’est pourquoi la statistique porte un nom différent du r de Pearson) – il s’agit d’un X2 (khi-carré) plutôt que d’un test-t

59
Q

Quels sont les hypothèses du phi de Cramér?

A

H0 : o/o (de Cramér) = 0

H 1: o/o (de Cramér) =/= 0

60
Q

Le test du phi de Cramér suit une distribution […] avec 1 degré de liberté (X2 = N * o/o2)

A

Le test du phi de Cramér suit une distribution khi carré avec 1 degré de liberté (X2 = N * o/o2)

61
Q

Le test de phi de Cramér est le même […] que pour les tables de contingence

A

Le test de phi de Cramér est le même khi carré que pour les tables de contingence

62
Q

Qu’est-ce que le tableau de contingence et le khi carré permettent?

A

Tableau de contingence: De nous faire une idée visuelle de nos variable
Khi-carré: De voir si mes 2 variables dichotomiques sont liées

63
Q

Le phi de Cramér est une corrélation de […] pour des tables […] et des corrélations […] (multidimensionnelles)

A

Le phi de Cramér est une corrélation de Pearson pour des tables multinomiales (plusieurs variables), pour des corrélation canoniques (multidimensionnelles)
-> Très rarement utilisé

64
Q

La corrélation bisérielle et tétrachorique est différente de la corrélation de […]
-> Elles sont […] utilisées

A

La corrélation bisérielle et tétrachorique est différente de la corrélation de Pearson
-> Elles sont rarement utilisées

65
Q

Le coefficient de corrélation bisérielle/tétrachorique fonctionne avec des variables […] lorsque celles-ci sont dérivées de variables qui respectent une distribution […]

A

Le coefficient de corrélation bisérielle/tétrachorique fonctionne avec des variables dichotomiques lorsque celles-ci sont dérivées de variables qui respectent une distribution normale
-> Ex: En utilisant une variable continue pour créer des catégories - bas, haut)

66
Q

Le test associé aux coefficients de corrélation bisérielle et tétrachorique est généralement […] puissant que les tests des corrélations bisérielles en point (r pb) et phi de Cramér

A

Le test associé aux coefficients de corrélation bisérielle et tétrachorique est généralement plus puissant que les tests des corrélations bisérielles en point (r pb) et phi de Cramér

67
Q

En quoi consiste les données rangées ou données en rang ou données ordinales (rank-ordre data)?

A

Associer un rang à des données qui sont en ordre croissant

  • > La plus petite valeur a le rang 1
  • > La plus grande valeur a le rang n (nombre d’observation)
  • > Si deux (ou plusieurs) valeurs ont le même rang, on leur donne chacune le rang moyen
68
Q

Donnez un exemple de données rangées.

A

X: 5 8 9 12 12 15
Rangs: 1 2 3 4.5 4.5 6

69
Q

Le rho de Spearman repose sur le même principe que pour le r de […]

A

Le rho de Spearman repose sur le même principe que pour le r de Pearson

70
Q

Le test-t ou le khi carré ne fonctionne pas (!) pour des données […] - surtout pour N < […]

A

Le test-t ou le khi carré ne fonctionne pas (!) pour des données […] - surtout pour N < 30

71
Q

Le tau de […] (t) est un indice similaire au rho de Spearman, mais il est basé sur le nombre « d’inversions de rang » lorsque l’on range les données en considérant deux variables

A

Le tau de Kendal (t) est un indice similaire au rho de Spearman, mais il est basé sur le nombre « d’inversions de rang » lorsque l’on range les données en considérant deux variables

72
Q

Le rho de Spearman (r s) et le tau de Kendal (t):
Des calculs permettent des estimés « […] » (et conservateur) de ces coefficients et l’obtention d’un niveau de signification

A

Des calculs permettent des estimés « non paramétriques » (et conservateur) de ces coefficients et l’obtention d’un niveau de signification

73
Q

Le rho de Spearman (r s) et le tau de Kendal (t):

Ces tests sont […] puissants que les autres tests pour les corrélations

A

Le rho de Spearman (r s) et le tau de Kendal (t):

Ces tests sont moins puissants que les autres tests pour les corrélations

74
Q

Le rho de Spearman (r s) et le tau de Kendal (t):

Les calculs s’obtiennent avec la commande […] de SPSS

A

Le rho de Spearman (r s) et le tau de Kendal (t):

Les calculs s’obtiennent avec la commande NONPAR CORR de SPSS

75
Q

Le rho de Spearman (r s) et le tau de Kendal (t):

Du moment qu’on a un échantillon le moindrement […] , ça ne change pas grand chose!

A

Le rho de Spearman (r s) et le tau de Kendal (t):

Du moment qu’on a un échantillon le moindrement grand, ça ne change pas grand chose!

76
Q

Le coefficient de concordance de Kendall (W) permet de calculer des accords […] lorsqu’il y a plus de deux […]

A

Le coefficient de concordance de Kendall (W) permet de calculer des accords interjuges lorsqu’il y a plus de deux juges

77
Q

Le coefficient de concordance de Kendall (W) est […] courante et puissante. Elle s’obtient par la commande SPSS […]

A

Le coefficient de concordance de Kendall (W) est peu courante et puissante. Elle s’obtient par la commande SPSS CROSSTAB

78
Q

VRAI ou FAUX

Les variables dichotomiques peuvent être utilisées dans le calcul des coefficients de corrélation

A

VRAI

79
Q

Les variables dichotomiques peuvent être incluses dans les et dans la plupart des analyses […] et des analyses en composantes principales

A

Les variables dichotomiques peuvent être incluses dans les régressions (simples ou multiples) et dans la plupart des analyses factorielles et des analyses en composantes principales

80
Q

Lorsque la relation étudiée porte sur deux variables
dichotomiques, un test […] remplace le test-t de
signification, la corrélation s’appelle alors un coefficient
[…]

A

Lorsque la relation étudiée porte sur deux variables
dichotomiques, un test khi carré remplace le test-t de
signification, la corrélation s’appelle alors un coefficient
phi de Cramér

81
Q

Le calcul des corrélations avec des données rangées (rank order) est […] problématique, car elle fait appel à des approches […] conservatrices et nettement […] puissantes

A

Le calcul des corrélations avec des données rangées (rank order) est plus problématique, car elle fait appel à des approches non paramétriques conservatrices et nettement moins puissantes

82
Q

IMPORTANT
Les tests de corrélation sont les mêmes que la corrélation de […], du moment qu’on a un échantillon un peu […].
-> Seulement le test […] change

A

IMPORTANT
Les tests de corrélation sont les mêmes que la corrélation de Pearson, du moment qu’on a un échantillon un peu grand.
-> Seulement le test inférentiel change