Corrélation et régression simple Flashcards
Quand utilisons-nous la corrélation?
Lorsqu’on veut déterminer le degré de relation (lien bidirectionnel) entre deux variables continues (“VD théoriques”)
*Il n’y a pas de VI ou VD proprement dites (pas cause à effet car les deux en même temps)
Vrai ou faux: il est possible de manipuler les variables dans une corrélation?
Faux, ce sont des variables OBSERVÉES
Qu’est-ce qu’une étude bivariée? VÉRIFIER!!
C’est une étude avec 2 variables
Quand utilisons-nous la régression?
Lorsqu’on désire prédire une variable continue (prédite = critère, VD) à partir d’une autre variable continue (prédicteur, VI)
- Une variable en influence une autre
- Pourrait être reproduit
Quelles sont les différences entre la corrélation et la régression?
Corrélation vs régression:
- 2 variables continues observées VS 1 VD continue observée
- Variables non manipulées par chercheur VS 1 VI continue manipulée par le chercheur
- Étude ne peux pas être répliquée telle quelle VS l’étude peut être répliquée
- Modèle normal bivarié VS Modèle de régression linéaire
- Degré de relation entre X et Y VS prédiction de Y par X
Quels sont d’autres noms de la corrélation?
- Corrélation de Pearson ou bivariée
- Coefficient de corrélation du produit des moments de Pearson
- Corrélation d’ordre zéro
À quel moment de la recherche la corrélation est-elle utilisée?
Autant pour tester des hypothèses que pour des analyses préliminaires ou des analyses psychométriques (test-retest)
Quelle est la différence entre la corrélation et le test t?
C’est le LIEN qui nous intéresse et non la DIFFÉRENCE
À quoi ressemblent les hypothèses de la corrélation?
Bilatéral:
H0: Il n’y a pas de lien entre X et Y
H1: Il y a un lien entre X et Y
Unilatéral:
H0: Il n’y a pas de lien ou lien positifs entre X et Y
H1: Il y a un lien négatif entre X et Y
Que signifie un lien positif vs négatif dans la corrélation?
Positif: lorsque A augmente, B augmente aussi
Négatif: Lorsque A augmente, B diminue
Quels sont les postulats à vérifier pour la corrélation?
- Normalité de la distribution pour les deux variables
2. Linéarité de la relation avec le diagramme de dispersion
Qu’est-ce que le diagramme de dispersion?
Diagramme qui représente chaque individu d’une étude par un point dans un espace bidimensionnel (nuage de point)
Comment est disposé le diagramme de dispersion si il y a régression?
Prédicteur (VI) sur l’axe des abscisses (X)
Critère (VD) sur l’ordonnée (Y)
Le postulat de linéarité de la relation est-il rencontré si le diagramme est curvilinéaire ou poisson?
Non! Pour rencontrer le postulat, le diagramme ne peut révéler un autre type de relation que linéaire
*Car si on essaie de tracer une droite, elle va être nulle (ce qui n’est pas vrai)
Comment calculer la valeur du test r?
Repose sur le concept de la covariance: le degré auquel 2 variables varient ensemble ou “co-varient”
= Tient compte de la variance de chaque variable et de la portion de variance commune aux 2 variables
Que signifie une covariance positive élevée?
Cela signifie que les scores de X supérieurs à la moyenne coïncident avec des scores de Y supérieurs à la moyenne (Vice -versa)
ET, si négatif, les scores de X supérieurs à la moyenne coïncident avec des scores de Y inférieurs à la moyenne
Quel est le problème avec la covariance?
Elle n’est pas facilement interprétable puisqu’elle a comme unité de mesure le produit des unités de mesure propres aux 2 variables
Ex: covariance entre heures d’écran et performance est exprimée et “heures X perfo” DONC peu de sens
Comment faire pour ramener la covariance à un coefficient de corrélation?
On divise la covariance par le produit des écarts-types!
Qu’est-ce que le coefficient de corrélation?
Il exprime le degré de relation bidirectionnelle entre 2 variables et se situe entre -1 et +1
Quel est le barème pour le coefficient de corrélation?
Lien faible: < 0,30
Lien modéré: 0,30 < 0,50
Lien fort: > 0,50
0: Absence de lien
1: Corrélation parfaite
Que signifient le + et le - dans la corrélation de Pearson?
Cela représente le sens du lien!
P: A augmente, B augmente
N: A augmente, B diminue
Pourquoi faut-il montrer que la corrélation est significative à l’aide d’un test t de corrélation peu importe la force de la relation?
Car la signification dépend selon la taille et la puissance
= on teste H0 voulant que la corrélation entre les 2 variables soit égale à 0
Vrai ou faux: on doit présenter le résultat du test t dans notre interprétation de la corrélation?
Faux! Il est uniquement à décider si la corrélation est significative
À quoi correspond le degré de liberté de la corrélation de Pearson et pourquoi?
dl = N - 2 (car on enlève 1 à chaque variable)
Quels sont les 5 éléments à inclure dans l’interprétation de la corrélation de Pearson?
- Notation statistique: r(dl) = -0,48, p < 0,05
- Sens du lien: positif ou négatif
- Force du lien: faible, modéré, fort
- Explication: plus X est élevé, plus Y est faible
- La grandeur de l’effet (% de variance commune)
*Si non-significatif: puissance!! et non sens, force ou grandeur
Quel est un autre nom pour la grandeur de l’Effet de la corrélation?
Le coefficient de détermination
Comment calculons-nous le pourcentage de variance commune (r2)?
En mettens le coefficient r au carré
Comment interprétons-nous le pourcentage de variance commune?
X et Y ont 23,04% de variance commune
Qu’est-ce que les intervalles de confiance (IC 95%) permettent de faire?
Ils permettent d’estimer dans quel intervalle se situe la corrélation 95% du temps
-Pertinent si postulat de normalité non respecté et bootstrap
Quelle est la signification du 0 dans les intervalles de confiance?
Si 0 est compris dans l’intervalle = pas de lien
Si 0 n’est pas compris dans l’intervalle = lien
Qu’est-ce que le coefficient de Spearman?
2 variables ordinales (OU 1 continue et 1 ordinale)