Cours 5 corrélation Flashcards

Question 1

Q

Qui suis-je?

Je suis l’indice d’ajustement entre 2 variables

Answer

A

Le coefficient de corrélation r

Question 2

Q

Qu’est-ce que le r (mathématiquement parlant)?

Answer

A

C’est la covariance entre 2 variables divisé par le produit des écart types

Question 3

Q

Qu’est-ce que la covariance?

Answer

A

C’est la variance des variable ensemble.

Contrairement à la variance qui est la variance de la variable avec elle même

Question 4

Q

Vrai ou faux

Dans la formule du r, la covariance ne peut pas être plus grande que le produit des écarts-type?

Question 5

Q

Que représente le r-carré?

Answer

A

Le pourcentage de variance expliquée d’une variable par l’autre

Question 6

Q

Le coefficient de corrélation est … des échelles de mesure

Answer

A

Le coefficient de corrélation est indépendant des échelles de mesure

Question 7

Q

Que tient compte le coefficient de corrélation ajusté (radj)? Et pourquoi?

Answer

A

Il tient compte de N et corrige ce biais. Car lorsque l’échantillon est petit, le coefficient de corrélation d’un échantillon (r) est un estimateur biaisé du coefficient de corrélation de la population (p).

Question 8

Q

Le coefficient de corrélation est un indice …

Answer

A

Standardisé.

Question 9

Q

Vrai ou faux

La commande SPSS CORRELATION fournit à corrélation ajustée.

Answer

A

FAUX

La commande SPSS CORRELATION ne fournit pas la corrélation ajustée, mais il est facile d’obtenir un r-carré ajusté avec la commande REGRESSION

Question 10

Q

Vrai ou faux

La corrélation ajusté est toujours plus petite

Question 11

Q

Qui suis-je?

Je suis le meilleur prédicteur linéaire

Answer

A

La droite de régression

Question 12

Q

À quoi sert la droite de régression?

Answer

A

Permet de faire des prédictions

Question 13

Q

Vrai ou faux

Il y a autant de point dessus et sous la droite de régression?

Question 14

Q

Dans ^Y = (0.783x) + 73.89, que signifie 0.783?

Answer

A

Donc quand je change une unité de x, ^Y change de 0.783 unité

Question 15

Q

Dans la corrélation, dequoi dépend la puissance?

Answer

A

Comme pour le test t, la puissance du r dépend de la taille d’effet (d) et de la taille de l’échantillon

Question 16

Q

Dans le cas du coefficient de corrélation, comment estimons nous la taille d’effet?

Answer

A

La taille d’effet = corrélation : d = p (corrélation attendue (soit la corrélation de la population))

Question 17

Q

Comment calculer la puissance?

Answer

A

Comme pour le test t, on utilise une table de puissance et calculons delta

Question 18

Q

Qu’est-ce que la puissance?

Answer

A

C’est la probabilité de démontrer ce qu’ont veut démontrer. On peut l’estimer avec la statistique delta

Question 19

Q

Quelle est la différence entre les différentes corrélation?

Answer

A

En fait, le calcul du r est le même. Tout ce qui va changer c’est comment on fait le test d’inférence

Question 20

Q

Quelles sont les 3 caractéristiques nécessaire afin que le coefficient de corrélation de Pearson fonctionne bien?

Answer

A

La relation entre les variables doit être linéaire
Les variables ont des échelles continues
Les données respectent les postulats : D’homogénéité des variance et de normalité de distribution d’échantillonnage.

Question 21

Q

Qui suis-je?

Je suis la mesure de corrélation la plus utilisée

Answer

A

Le coefficient de corrélation de Pearson

Question 22

Q

Qu’est-ce que la mesure de corrélation?

Answer

A

C’est un indice du lien entre deux variables représentant au moins des niveau ordonnés de la mesure.

Variable ordinale : Ex échelle de likert

Ex : Score de dépression 40 est plus gros que 20

Question 23

Q

Qu’est-ce que la mesure d’association?

Answer

A

Elle s’applique même si différentes valeurs de la variable ne représentent pas une diminution ou une augmentation ordonnée d’une certaine quantité.

Variable catégorielle : Ex : Échec/réussite, Libérale/conservateur. Données non ordinales

Question 24

Q

Quelles sont les conditions d’utilisation de la corrélation bisérielle de point rpb?

Answer

A

Variables dichotomique. En fait, le coefficient de corrélation bisérielle de point concerne la situation dans laquelle une des deux variables est dichotomique
Non respect de la distribution normale (car détient seulement 2 valeurs)
Variables continue
S’utilise partout où les corrélations de r de Pearson sont utilisés

Question 25

Q

Que représente a) la pente de la droit de régression et b) l’O,O dans rpb?

Answer

A

a) La pente c’est la différence entre les moyennes des 2 groupes
b) Ex : Y moyen du groupe 0. (ex: Le poid moyen des hommes)

Question 26

Q

Qu’est-ce qui nous permet de transformer la corrélation bisérielle en t?

Answer

A

Il y a une relation importante en rpb et t.

Question 27

Q

Dans la formule du rpb-carré, que représente le t?

Answer

A

t est la valeur du test-t de la différence entre les moyenne pour deux échantillons indépendants de tailles inégales (dl - n1+n2-2 ou N-2)

Question 28

Q

Avec rpb, comment calculer la taille d’effet?

Answer

A

À partir des différences de moyennes

2. À partir de la valeur du coefficient de corrélation rpb car il existe une relation directe entre t et rpb

Question 29

Q

Quelles sont les conditions d’utilisation de la corrélation phi?

Answer

A

La corrélation entre DEUX variables dichotomiques ex: Relation entre le sexe (hommes/femmes) et l’emploi (avec ou sans emploi)
Test khi carré plutôt que test t (car données catégorielles)
On calcule r de la même façon que corrélation de Pearson

Question 30

Q

Vrai ou faux

Le test khi carré avec phi est le même khi carré que pour les tables de contingence?

Question 31

Q

Qu’est-ce que la corrélation bisérielle et tétrachorique?

Answer

A

Ex: Les gens sont victimes de divers niveau d’abus sexuels, et même si tout abus est négatif, certains actes sont plus grave que d’autres. Donc, il y a abus/ non abus, mais il est a des catégories entre.

Donc, ces corrélations prennent en compte cette continuité sous-jacente, ce qui permet d’estimer ce que la corrélation aurait été si la variable avait été normalement distribuée plutôt qu’une dichotomie

Question 32

Q

Vrai ou faux

Le test associé à la corrélation bisérielle et tétrachorique sont généralement moins puissant que les tests des corrélations bisérielle en point rpb et phi

Answer

A

FAUX

Généralement plus puissance

Question 33

Q

Décrivez les données rangées.

Answer

A

Ranger : Associer un rang à des données qui sont en ordre croissant où la plus petit valeur a le rang un et la plus grande valeur le rang n

Consiste à ranger des ensembles de données de mesure lorsqu’on a de sérieuses réserves quant à la nature de l’Échelle de mesure sous-jacente. Dans ce cas, on remplace les scores bruts par des rangs

Question 34

Q

Quelles sont les conditions d’utilisation du rho de Spearman (rs) et le tau de Kendal (T) pour données rangées (données ordinales)?

Answer

A

Le rho de Spearman repose sur le même principe que pour le r de Pearson. On utilise rho sur données ordinales
Le tau de Kendal (T) est un indice similaire au rho, mais il est basé sur le nombre d’inversion de rang lorsque l’on range les données en considérant 2 variables

Question 35

Q

Comment estimé rho et tau?

Answer

A

Des calculs permettent des estimés non paramétriques et conservateur de ces coefficients et l’obtention d’un niveau de signification - ces tests sont moins puissants que les autres tests pour les corrélations, ils s’obtiennent avec la commande NONPAR CORR de SPSS

Question 36

Q

Que permet de calculer le coefficient de concordance de Kendall (W)?

Answer

A

Permet de calculer des accords interjuges lorsqu’il y a plus de deux juges

Question 37

Q

Vrai ou faux?

Les variables dichotomiques peuvent être utilisées dans le calcul des coefficients de corrélation

Question 38

Q

Que faire lorsque la relation étudiée porte sur deux variables dichotomiques?

Answer

A

Un test khi carré

Question 39

Q

Donner un exemple de corrélation bisérielle de point rpb.

Answer

A

Nous cherchons à savoir si le sexe d’un individu influence/prédit son poids (poids en fonction du sexe)

Question 40

Q

Quel test utilise la corrélation bisérielle de point rpb? dl?

Answer

A

Le test t avec N-2 dl

Question 41

Q

Qu’est-ce que la corrélation bisérielle?

Answer

A

C’Est l’équivalent directe de la corrélation bisérielle de point, sauf que, la corrélation bisérielle suppose qu’une distribution normale sous tend la variable dichotomique

Question 42

Q

Qu’est-ce que la corrélation tétrachorique?

Answer

A

L’équivalent directe de phi, mais on suppose qu’une distribution normale sous-tend les deux variables

Question 43

Q

Donner un exemple de corrélation pour donné rangées.

Answer

A

On pourrait demander à des juges de classer des objets par ordre de préférence sous deux conditions différentes et vouloir connaître la corrélation entre es deux ensemble de rangs.

Question 44

Q

Rangez les données suivantes : 5.8.9.12.12.15.16.16.16.17

Answer

A

On donne le rang 1 à la plus petite valeur (5). Les deux valeur suivante (8 et 9) se voient assigner les rangs 2 et 3. On a ensuite deux valeurs égales (12) qui doivent être classées. Si elles n’étaient pas égales, on leur attribuerait les rangs 4 et 5 ; on divise donc la différence pour leur assigner à toutes les deux le rang 4.5. Le sixième nombre (15) reçoit le rang 6. Les trois valeurs suivantes (16) sont égales et correspondent aux rangs 7.8.9 ; comme la moyenne de ces rangs est 8, elles reçoivent toutes les trois le rang 8. La dernière valeur (17) se voit attribuer le rang 10.

Question 45

Q

Quels coefficient de corrélation utilise-t-on pour les données rangées?

Answer

A

Le coefficient de corrélation de spearman (rs)

Question 46

Q

Quelle est la différence entre le coefficient de spearman et le coefficient de kendall?

Answer

A

Spearman considère les rangs comme des scores et calcule la corrélation entre deux ensembles de rangs, kendall base sa statistique sur le nombre d’inversions constatées dans les classements