Examen 2 Flashcards
Quel est l’objectif premier de la corrélation?
Quantifier la relation entre deux ou plusieurs mesures (mesurer à quel point les masures varient simultanément)
Quel est l’objectif de la régression linéaire simple?
Prédire une mesure continue qui sera inconnue (variable à expliquer ou critère, au lieu de la VD) à partir de la connaissance d’une autre mesure continue connue (une seule variable explicative ou prédicteurs, au lieu de la variable indépendante).
Régression linéaire simple: Lorsqu’on fait nos calculs sur l’échantillon, la variable à expliquer est _______ et ce qu’on désire c’est d’être capable de la prédire lorsqu’elle sera plus tard _______
connue; inconnue.
Vrai ou faux: Si deux mesures ne sont pas reliées (corrélation non significative), la connaissance d’une mesure ne nous dit rien à propos de l’autre et aucune prédiction n’est possible
Vrai
Vrai ou faux: Si deux mesures sont reliées (corrélation significative), la connaissance d’une mesure nous dit qqch à propos de l’autre et une certaine prédiction est possible.
Vrai
Plus la corrélation est forte, plus la prédiction est _____
précise
Comme la corrélation bivariée, la régression linéaire simple est;
- sensible aux valeurs extrêmes
- basée sur les prémisses d’une relation linéaire homoscédastique entre les deux variables
Avant d’effectuer une régression linéaire simple, il faut s’assurer d’avoir ____________ si on ne veut pas travailler pour rien.
une corrélation bivariée significative
Le calcul de la régression linéaire est basé sur __________, qui est la meilleure droite possible représentant le nuage de points.
La ligne de régression
La ligne de régression nous fournit __________ lorsqu’on connait l’autre mesure.
une estimation d’une mesure
La prédiction d’une valeur Y à partir d’une valeur X connue se fait en calculant _____________
la ligne de régression d’Y sur X dont l’équation générale est la suivante: Y = bX + a
Dans l’équation Y = bX + a (qui calcule la ligne de régression de Y sur X), que représente le a?
a = constante qui est l’ordonnée à l’origine (le point d’intersection entre la droite de régression de Y sur X et l’ordonnée (la valeur de Y lorsque X = 0))
Dans l’équation Y = bX + a (qui calcule la ligne de régression de Y sur X), que représente le b?
b = coefficient de régression non standardisé qui est la pente de la ligne de régression (le taux d’augmentation de Y lorsque X augmente)
Habituellement, par convention, la représentation graphique se fait en plaçant la variable explicative (X) sur l’axe ________ et la variable à expliquer (Y) sur l’axe _______
horizontal; vertical
Lorsque la corrélation est parfaite, les deux lignes de régression (Y sur X et X sur Y) se ______, mais lorsque la corrélation diminue, les deux lignes ______, et ce, jusqu’à une corrélation de 0 où les deux lignes sont _______
superposent; s’écartent; à angle droit
Il existe une relation simple entre le coefficient de corrélation et les ___________
pentes des deux lignes de régression
En multipliant les pentes des deux lignes de régression, nous obtenons le ___________ qui calcule le pourcentage de variance partagé par les deux mesures connues X et Y de l’échantillon
coefficient de corrélation au carré ou coefficient de détermination ou R2
En nous servant du ___________, nous pouvons donc prédire un score brut d’une mesure en connaissant le score brut d’une autre mesure.
coefficient de corrélation (plutôt qu’en faisant une régression linéaire simple)
_________ est la moyenne “quadratique” de ces résidus.
L’erreur standard d’estimation
Qu’est-ce qu’on appelle le résidu?
l’écart entre les valeurs prédites et les valeurs réelles.