Chapitre 7 : la corrélation, mesures d’association entre deux variables Flashcards
Les mesures de corrélations sont utilisées dans quel but?
Les mesures de corrélation sont utilisées pour décrire la relation entre deux variables. Y’a-t-il un lien entre … X et Y?
Qu’est-ce que le coefficient de Pearson?
Se définit comme le rapport de la covariance entre 2 variables sur le produit de leurs écart-types.
Mesure la relation linéaire entre deux variables.
Vrai ou faux, le coefficient de Pearson permet d’établir un lien de causalité (attention), mais regarder comment la variable varie avec l’autre.
Faux.
À quoi sert un nuage de points ?
En quoi il est pertinent avec le coefficient de Pearson (corrélations) ?
- Vérifier la linéarité de la relation
- Détecter les cas aberrants, extrêmes ou spéciaux
- Évite les erreurs
- Peut conduire à l’exclusion d’observations qui n’appartiennent pas à la population de référence
Vrai ou faux, le coefficient de Pearson sera plus élevé en situation d’hétérogénéité.
Vrai, plus la variance entre les scores sont élevés, plus le r le sera aussi
L’hétérogénéité augmente la variance
Expliquez pourquoi le coefficient de Pearson sera plus faible en situation d’homogénéité.
L’homogénéité diminue la variance (étendue plus petite, donc la variance diminue et diminue r aussi).
Vrai ou faux, plus le N est grand plus il y a de variance, donc plus le r risque d’être élevé.
Vrai.
Nommer les 2 causes qui provoque la variation de r (corrélation)?
- Variance du score
- Nombre de personnes dans l’échantillon
Le r est grandement influencé par quoi, excluant les 2 causes ?
Par l’erreur de mesure (fidélité de la mesure)
Qu’est-ce qu’une corrélation vraie?
Corrélation qui aurait été obtenue en absence d’erreur de mesure.
Qu’est-ce qu’une corrélation partielle?
Pour contrôler les effets d’une autre variable qui pourrait jouer dans la relation de la corrélation analysée.
Quels sont les 2 paramètres dont il es possible de faire ressortir avec une corrélation?
Mesure le degré (chiffre) et le sens (signe) d’une relation de deux variables.
Comment interprète-t-on les corrélations (r)?
r = -1
r = 0
r = +1
r = -1 relation linéaire inverse parfaite
r = 0 relation nulle
r = +1 relation linéaire directe parfaite
Le signe du coefficient de corrélation indique quoi?
Indique le sens de la relation
r positif indique une relation linéaire directe
r négatif indique une relation linéaire inverse
r nulle indique une relation linéaire nulle
Quels sont les degrés de corrélation?
Faible : 0.1 < 0.3
Moyenne : 0.3 < 0.5
Élevée : 0.5 < 0.7
Très élevée : 0.7 < 1.0
Comment interprète-t-on un coefficient de corrélation dans une relation curvilinéaire?
La valeur d’un coefficient de corrélation appliqué à une relation curvilinéaire représente la valeur minimale que peut prendre le coefficient de relation curvilinéaire.
Vrai ou faux, le coefficient de corrélation est préférable à la covariance.
Vrai.
Qu’est-ce que la covariance?
La covariance est égale à la moyenne des produits des scores déviations de chacune des variables.
Vrai ou faux, la covariance varie entre -1 à +1.
Faux, n’a pas de limite supérieure ni de limite inférieure (plus vaste que -1 à +1).
Nommez les 4 coefficients de fidélité.
- Fidélité inter-juges
- Méthode test-retest
- Méthode moitié-moitié
- Alpha de Cronbach
Qu’est-ce que le coefficient de fidélité inter-juges?
Les copies sont corrigées par deux correcteurs, les résultats sont corrélés.
Ex : Trois experts ont été sélectionnés pour corriger de manière indépendante votre examen d’analyses de données afin de voir si les résultats sont corrélés.
Qu’est-ce que la méthode test-retest?
Les sujets sont testés, puis retestés, les résultats des deux tests sont corrélés.
Ex : Un test a été administré une nouvelle fois deux semaines plus tard afin de voir si les deux passations sont corrélées.
Qu’est-ce que la méthode moitié-moitié?
Le test est divisés en deux sous-test (partie A et B du PHQ-9), les résultats sont corrélés.
Ex : Le questionnaire a été divisé en deux : d’un côté les 10 premières questions et de l’autre les 10 dernières questions afin de voir si les résultats sont corrélés.
Qu’est-ce que le coefficient Alpha de Cronbach ?
Formule d’approximation de la corrélation moyenne de toutes les permutations moitié-moitié possibles.
Ex : Un indice statistique a été utilisé afin de vérifier la cohérence interne du questionnaire.
Vrai ou faux, une relation nulle (r = 0) n’indique pas nécessairement une absence de relation causale.
Vrai!
Quel est le postulat de la distribution normale bivariée?
Plusieurs paires de variables d’intérêt se distribuent selon une distribution normale bivariée.
2 variables, pour chaque score à la variable X, les gens à la variable Y vont suivre la loi normale (forme de cloche).
Quels sont les caractéristiques de la distribution normale bivariée?
- Pour chacune des valeurs de X, la distribution des valeurs associées de la variable Y suit une distribution normale et vice versa.
- La relation étant linéaire, les moyennes des Y associés aux différentes valeurs de X sont situées sur une droite et vice versa.
- Égalité des variances (homoscédasticité) : la variance des valeurs des Y associées aux valeurs de X sont égales sur tout le continuum des X et vice versa.
À part les corrélations de Pearson, quels sont les autres que l’on retrouve?
- Spearman
- Phi
- Point-bisériale
- Bisériale
- Tétrachorique
Quand utilise-t-on la corrélation de Spearman?
2 variables (X et Y) ordinales (mise en rang).
Quand utilise-t-on la corrélation de Phi?
2 variables dichotomiques dont 1 naturelle (ex. sexe) et l’autre artificielle (ex. maladie).
Quand utilise-t-on la corrélation Point-bisériale?
1 variable continue
1 variable dichotomique naturelle
Quand utilise-t-on la corrélation bisériale?
1 variable continue
1 variable dichotomique artificielle
Quand utilise-t-on la corrélation tétrachorique?
2 variables continues dichotomisées artificiellement