La régression linéaire simple Flashcards
Dans la formule de la régression linéaire, à quoi correcpond les variables a et b?
(y= a+bx)
b: coefficient de régression (non standardisé)
a: l’ordonnée à l’origine
Vrai ou faux? La régression simple permet de prédire ou estimer la position inconnue d’une observation de la variable Y à partir de ce qu’on sait quant à la position de X.
Vrai!
Qui suis-je? Dans une distribution représentée par un nuage de points, droite qui passe le plus proche des points.
Droite de régression ou droite des moindres carrés.
Quelle est la formule pour trouver l’ordonnée à l’origine?
𝑎=𝑦̅−𝑏𝑥̅
Vrai ou faux? Il serait possible de faire une prédiction pour x=13 même si les valeurs observées sont entre 1 et 6.
Vrai. Une droite couvre généralement toutes les valeurs de 𝑥. On peut donc obtenir une prévision pour des valeurs inférieures à la plus petite valeur observée et aussi pour des valeurs supérieures à la plus grande valeur observée.
Vrai ou faux? Il est possible de calculer un coefficient de régression standardisé à partir d’un coefficient de corrélation,
Faux; Il est possible d’obtenir un coefficient de régression non-standardisé.
À quel moment peut-on calculer le coefficient de régression à partir du coefficient de corrélation?
Ce calcul est possible lorsque nous connaissons l’écart-type de x et l’écart-type de y. En effet, la formule est: b= rxy* (sy/sx)
Vrai ou faux? Si le coefficient de corrélation 𝑟𝑋𝑌=0, le coefficient de régression 𝑏=0.
Vrai. Ces deux concepts sont liés.
Calculez le coefficient de régression à partir des informations suivantes;
* rxy= 0,42
* sx= 3
* sy= 3
b= 0,42
Lorsque les écarts types sont égaux, le coefficient de régression est égal au coefficient de corrélation.
Vrai ou faux? Quand les écarts-types de x et y sont égaux, le coefficient de régression b est égal au coefficient de corrélation rxy.
Vrai
Vrai ou faux? L’ordonnée à l’origine peut s’obtenir en ne connaissant que les moyennes 𝑥̅ et 𝑦̅ et le coefficient de régression 𝑏.
Vrai. La formule est:
a= y-bx
y barre et x barre car moyenne (je peux ink pas l’écrire dememe ici)
Qu’est-ce que l’erreur de prédiction?
L’erreur de prédiction 𝑒i représente la différence entre la valeur prédite 𝑦̂𝑖 pour l’observation 𝑖 et la véritable valeur 𝑦𝑖 de cette même observation.
Vrai ou faux? Dans l’erreur de prédiction, yi représente la valeur obtenue à l’aide de l’équation de la droite.
Faux; yi est la valeur observée (celle qu’on a obtenu réellement, la valeur brute).
Vrai ou faux? Dans un graphique de nuage de points, l’erreur de résidu correspond à l’écart vertical entre la valeur observée (yi) et la droite.
Vrai
Quelle est la somme des erreurs de résidus pour n’importe quelle équation de droite?
0
Que veut-on dire lorsqu’il est question d’une droite “des moindres carrés”?
Pour obtenir cette droite, on a minimiser la somme des résidus au carré.
Vrai ou faux? Le coefficient de régression standardisé 𝛽 est identique au coefficient de corrélation 𝑟𝑋𝑌 (𝛽=𝑟𝑋𝑌 ).
Vrai
Vrai ou faux? L’ordonnée à l’origine standardisée 𝛽0 est toujours égale à 0 (𝛽0=0).
Vrai; comme les variables sont standardisées, les moyennes 𝑥̅ et 𝑦̅ sont égales à 0.
Mise en situation: On veut prédire le niveau de productivité (Y) selon le nb de cafés consommés (X). Comment ai-je consommé de cafés si mon niveau de productivité est une valeur sur l’ordonnée à l’origine?
0 café.
Vrai ou faux? Lorsque la corrélation est négative, le coefficient de régression est négatif aussi.
Vrai; Le coefficient de régression prend toujours le signe de la corrélation.
Qui suis-je? J’indique dans quelle mesure les valeurs de la variable Y changent en fonction de chaque changement de valeurs de X.
Le coefficient de régression (b)
1- Pourquoi la régression linéaire est calculée avec des valeurs non-standardisées?
2- Comment arrive-t’on à calculer la régression linéaire en valeurs non-standardisées si on se base sur la corrélation, qui elle est standardisée?
1- Parce qu’on l’utilise pour prédire la valeur de la variable Y (à partir de X) en valeur brute et non en valeur standardisée.
2- Le rapport sy/sx dans le calcul du coefficient de régression est une correction arithmétique qui permet d’exprimer la corrélation en valeurs brutes (non-standardisées).
Une valeur positive de l’ordonnée à l’origine (a) implique que, lorsque X est à zéro, la valeur de Y est plus ________ que zéro.
grande
Vrai ou faux? Une valeur nulle de l’ordonnée à l’origine implique que, lorsque X est à zéro, la valeur de Y est elle aussi égale à zéro.
Vrai; une valeur nulle de a=0.
Quelle est l’équation de la droite de régression linéaire?
y= a+ bx
Vrai ou faux? Lorsque la prédiction de y à partir de x est parfaitement juste, la quantité d’erreurs de prédiction e est égale à zéro.
Vrai
Vrai ou faux? Lorsque e est positive, nous avons fait une erreur de sous-estimation.
Faux; nous avons fait une erreur de surestimation.
Vrai ou faux? La droite des moindres carrés est expliquée par la somme des sous-estimations qui est égale à la somme des surestimations.
Vrai; la pente de la régression est à la bonne place lorsqu’elle est à la moyenne des erreurs d’estimation.
Vrai ou faux? Plus la corrélation est élevée, plus petites sont les erreurs d’estimation.
Vrai; on peut s’imaginer un nuage de points. Quand les points sont plus près de la droite, la corrélation est plus forte. La distance verticale entre y^i et yi est plus petite (donc erreur d’estimation plus petite).
Calculer l’erreur type si rxy= 0,44
sy= 2,6
2,33
Quelle est la formule pour prédire la valeur de y à partir de valeurs standardisées?
y= B0+Bx