Cours 5 corrélation Flashcards
Qui suis-je?
Je suis l’indice d’ajustement entre 2 variables
Le coefficient de corrélation r
Qu’est-ce que le r (mathématiquement parlant)?
C’est la covariance entre 2 variables divisé par le produit des écart types
Qu’est-ce que la covariance?
C’est la variance des variable ensemble.
Contrairement à la variance qui est la variance de la variable avec elle même
Vrai ou faux
Dans la formule du r, la covariance ne peut pas être plus grande que le produit des écarts-type?
Vrai
Que représente le r-carré?
Le pourcentage de variance expliquée d’une variable par l’autre
Le coefficient de corrélation est … des échelles de mesure
Le coefficient de corrélation est indépendant des échelles de mesure
Que tient compte le coefficient de corrélation ajusté (radj)? Et pourquoi?
Il tient compte de N et corrige ce biais. Car lorsque l’échantillon est petit, le coefficient de corrélation d’un échantillon (r) est un estimateur biaisé du coefficient de corrélation de la population (p).
Le coefficient de corrélation est un indice …
Standardisé.
Vrai ou faux
La commande SPSS CORRELATION fournit à corrélation ajustée.
FAUX
La commande SPSS CORRELATION ne fournit pas la corrélation ajustée, mais il est facile d’obtenir un r-carré ajusté avec la commande REGRESSION
Vrai ou faux
La corrélation ajusté est toujours plus petite
Vrai
Qui suis-je?
Je suis le meilleur prédicteur linéaire
La droite de régression
À quoi sert la droite de régression?
Permet de faire des prédictions
Vrai ou faux
Il y a autant de point dessus et sous la droite de régression?
Vrai
Dans ^Y = (0.783x) + 73.89, que signifie 0.783?
Donc quand je change une unité de x, ^Y change de 0.783 unité
Dans la corrélation, dequoi dépend la puissance?
Comme pour le test t, la puissance du r dépend de la taille d’effet (d) et de la taille de l’échantillon
Dans le cas du coefficient de corrélation, comment estimons nous la taille d’effet?
La taille d’effet = corrélation : d = p (corrélation attendue (soit la corrélation de la population))
Comment calculer la puissance?
Comme pour le test t, on utilise une table de puissance et calculons delta
Qu’est-ce que la puissance?
C’est la probabilité de démontrer ce qu’ont veut démontrer. On peut l’estimer avec la statistique delta
Quelle est la différence entre les différentes corrélation?
En fait, le calcul du r est le même. Tout ce qui va changer c’est comment on fait le test d’inférence
Quelles sont les 3 caractéristiques nécessaire afin que le coefficient de corrélation de Pearson fonctionne bien?
- La relation entre les variables doit être linéaire
- Les variables ont des échelles continues
- Les données respectent les postulats : D’homogénéité des variance et de normalité de distribution d’échantillonnage.
Qui suis-je?
Je suis la mesure de corrélation la plus utilisée
Le coefficient de corrélation de Pearson
Qu’est-ce que la mesure de corrélation?
C’est un indice du lien entre deux variables représentant au moins des niveau ordonnés de la mesure.
Variable ordinale : Ex échelle de likert
Ex : Score de dépression 40 est plus gros que 20
Qu’est-ce que la mesure d’association?
Elle s’applique même si différentes valeurs de la variable ne représentent pas une diminution ou une augmentation ordonnée d’une certaine quantité.
Variable catégorielle : Ex : Échec/réussite, Libérale/conservateur. Données non ordinales
Quelles sont les conditions d’utilisation de la corrélation bisérielle de point rpb?
- Variables dichotomique. En fait, le coefficient de corrélation bisérielle de point concerne la situation dans laquelle une des deux variables est dichotomique
- Non respect de la distribution normale (car détient seulement 2 valeurs)
- Variables continue
- S’utilise partout où les corrélations de r de Pearson sont utilisés
Que représente a) la pente de la droit de régression et b) l’O,O dans rpb?
a) La pente c’est la différence entre les moyennes des 2 groupes
b) Ex : Y moyen du groupe 0. (ex: Le poid moyen des hommes)
Qu’est-ce qui nous permet de transformer la corrélation bisérielle en t?
Il y a une relation importante en rpb et t.
Dans la formule du rpb-carré, que représente le t?
t est la valeur du test-t de la différence entre les moyenne pour deux échantillons indépendants de tailles inégales (dl - n1+n2-2 ou N-2)
Avec rpb, comment calculer la taille d’effet?
- À partir des différences de moyennes
2. À partir de la valeur du coefficient de corrélation rpb car il existe une relation directe entre t et rpb
Quelles sont les conditions d’utilisation de la corrélation phi?
- La corrélation entre DEUX variables dichotomiques ex: Relation entre le sexe (hommes/femmes) et l’emploi (avec ou sans emploi)
- Test khi carré plutôt que test t (car données catégorielles)
- On calcule r de la même façon que corrélation de Pearson
Vrai ou faux
Le test khi carré avec phi est le même khi carré que pour les tables de contingence?
Vrai
Qu’est-ce que la corrélation bisérielle et tétrachorique?
Ex: Les gens sont victimes de divers niveau d’abus sexuels, et même si tout abus est négatif, certains actes sont plus grave que d’autres. Donc, il y a abus/ non abus, mais il est a des catégories entre.
Donc, ces corrélations prennent en compte cette continuité sous-jacente, ce qui permet d’estimer ce que la corrélation aurait été si la variable avait été normalement distribuée plutôt qu’une dichotomie
Vrai ou faux
Le test associé à la corrélation bisérielle et tétrachorique sont généralement moins puissant que les tests des corrélations bisérielle en point rpb et phi
FAUX
Généralement plus puissance
Décrivez les données rangées.
Ranger : Associer un rang à des données qui sont en ordre croissant où la plus petit valeur a le rang un et la plus grande valeur le rang n
Consiste à ranger des ensembles de données de mesure lorsqu’on a de sérieuses réserves quant à la nature de l’Échelle de mesure sous-jacente. Dans ce cas, on remplace les scores bruts par des rangs
Quelles sont les conditions d’utilisation du rho de Spearman (rs) et le tau de Kendal (T) pour données rangées (données ordinales)?
- Le rho de Spearman repose sur le même principe que pour le r de Pearson. On utilise rho sur données ordinales
- Le tau de Kendal (T) est un indice similaire au rho, mais il est basé sur le nombre d’inversion de rang lorsque l’on range les données en considérant 2 variables
Comment estimé rho et tau?
Des calculs permettent des estimés non paramétriques et conservateur de ces coefficients et l’obtention d’un niveau de signification - ces tests sont moins puissants que les autres tests pour les corrélations, ils s’obtiennent avec la commande NONPAR CORR de SPSS
Que permet de calculer le coefficient de concordance de Kendall (W)?
Permet de calculer des accords interjuges lorsqu’il y a plus de deux juges
Vrai ou faux?
Les variables dichotomiques peuvent être utilisées dans le calcul des coefficients de corrélation
Vrai
Que faire lorsque la relation étudiée porte sur deux variables dichotomiques?
Un test khi carré
Donner un exemple de corrélation bisérielle de point rpb.
Nous cherchons à savoir si le sexe d’un individu influence/prédit son poids (poids en fonction du sexe)
Quel test utilise la corrélation bisérielle de point rpb? dl?
Le test t avec N-2 dl
Qu’est-ce que la corrélation bisérielle?
C’Est l’équivalent directe de la corrélation bisérielle de point, sauf que, la corrélation bisérielle suppose qu’une distribution normale sous tend la variable dichotomique
Qu’est-ce que la corrélation tétrachorique?
L’équivalent directe de phi, mais on suppose qu’une distribution normale sous-tend les deux variables
Donner un exemple de corrélation pour donné rangées.
On pourrait demander à des juges de classer des objets par ordre de préférence sous deux conditions différentes et vouloir connaître la corrélation entre es deux ensemble de rangs.
Rangez les données suivantes : 5.8.9.12.12.15.16.16.16.17
On donne le rang 1 à la plus petite valeur (5). Les deux valeur suivante (8 et 9) se voient assigner les rangs 2 et 3. On a ensuite deux valeurs égales (12) qui doivent être classées. Si elles n’étaient pas égales, on leur attribuerait les rangs 4 et 5 ; on divise donc la différence pour leur assigner à toutes les deux le rang 4.5. Le sixième nombre (15) reçoit le rang 6. Les trois valeurs suivantes (16) sont égales et correspondent aux rangs 7.8.9 ; comme la moyenne de ces rangs est 8, elles reçoivent toutes les trois le rang 8. La dernière valeur (17) se voit attribuer le rang 10.
Quels coefficient de corrélation utilise-t-on pour les données rangées?
Le coefficient de corrélation de spearman (rs)
Quelle est la différence entre le coefficient de spearman et le coefficient de kendall?
Spearman considère les rangs comme des scores et calcule la corrélation entre deux ensembles de rangs, kendall base sa statistique sur le nombre d’inversions constatées dans les classements