La régression linéaire simple Flashcards

1
Q

Dans la formule de la régression linéaire, à quoi correcpond les variables a et b?
(y= a+bx)

A

b: coefficient de régression (non standardisé)
a: l’ordonnée à l’origine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vrai ou faux? La régression simple permet de prédire ou estimer la position inconnue d’une observation de la variable Y à partir de ce qu’on sait quant à la position de X.

A

Vrai!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qui suis-je? Dans une distribution représentée par un nuage de points, droite qui passe le plus proche des points.

A

Droite de régression ou droite des moindres carrés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la formule pour trouver l’ordonnée à l’origine?

A

𝑎=𝑦̅−𝑏𝑥̅

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou faux? Il serait possible de faire une prédiction pour x=13 même si les valeurs observées sont entre 1 et 6.

A

Vrai. Une droite couvre généralement toutes les valeurs de 𝑥. On peut donc obtenir une prévision pour des valeurs inférieures à la plus petite valeur observée et aussi pour des valeurs supérieures à la plus grande valeur observée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux? Il est possible de calculer un coefficient de régression standardisé à partir d’un coefficient de corrélation,

A

Faux; Il est possible d’obtenir un coefficient de régression non-standardisé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

À quel moment peut-on calculer le coefficient de régression à partir du coefficient de corrélation?

A

Ce calcul est possible lorsque nous connaissons l’écart-type de x et l’écart-type de y. En effet, la formule est: b= rxy* (sy/sx)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrai ou faux? Si le coefficient de corrélation 𝑟𝑋𝑌=0, le coefficient de régression 𝑏=0.

A

Vrai. Ces deux concepts sont liés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Calculez le coefficient de régression à partir des informations suivantes;
* rxy= 0,42
* sx= 3
* sy= 3

A

b= 0,42
Lorsque les écarts types sont égaux, le coefficient de régression est égal au coefficient de corrélation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vrai ou faux? Quand les écarts-types de x et y sont égaux, le coefficient de régression b est égal au coefficient de corrélation rxy.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vrai ou faux? L’ordonnée à l’origine peut s’obtenir en ne connaissant que les moyennes 𝑥̅ et 𝑦̅ et le coefficient de régression 𝑏.

A

Vrai. La formule est:
a= y-bx

y barre et x barre car moyenne (je peux ink pas l’écrire dememe ici)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que l’erreur de prédiction?

A

L’erreur de prédiction 𝑒i représente la différence entre la valeur prédite 𝑦̂𝑖 pour l’observation 𝑖 et la véritable valeur 𝑦𝑖 de cette même observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux? Dans l’erreur de prédiction, yi représente la valeur obtenue à l’aide de l’équation de la droite.

A

Faux; yi est la valeur observée (celle qu’on a obtenu réellement, la valeur brute).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux? Dans un graphique de nuage de points, l’erreur de résidu correspond à l’écart vertical entre la valeur observée (yi) et la droite.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la somme des erreurs de résidus pour n’importe quelle équation de droite?

A

0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que veut-on dire lorsqu’il est question d’une droite “des moindres carrés”?

A

Pour obtenir cette droite, on a minimiser la somme des résidus au carré.

17
Q

Vrai ou faux? Le coefficient de régression standardisé 𝛽 est identique au coefficient de corrélation 𝑟𝑋𝑌 (𝛽=𝑟𝑋𝑌 ).

A

Vrai

18
Q

Vrai ou faux? L’ordonnée à l’origine standardisée 𝛽0 est toujours égale à 0 (𝛽0=0).

A

Vrai; comme les variables sont standardisées, les moyennes 𝑥̅ et 𝑦̅ sont égales à 0.

19
Q

Mise en situation: On veut prédire le niveau de productivité (Y) selon le nb de cafés consommés (X). Comment ai-je consommé de cafés si mon niveau de productivité est une valeur sur l’ordonnée à l’origine?

A

0 café.

20
Q

Vrai ou faux? Lorsque la corrélation est négative, le coefficient de régression est négatif aussi.

A

Vrai; Le coefficient de régression prend toujours le signe de la corrélation.

21
Q

Qui suis-je? J’indique dans quelle mesure les valeurs de la variable Y changent en fonction de chaque changement de valeurs de X.

A

Le coefficient de régression (b)

22
Q

1- Pourquoi la régression linéaire est calculée avec des valeurs non-standardisées?
2- Comment arrive-t’on à calculer la régression linéaire en valeurs non-standardisées si on se base sur la corrélation, qui elle est standardisée?

A

1- Parce qu’on l’utilise pour prédire la valeur de la variable Y (à partir de X) en valeur brute et non en valeur standardisée.
2- Le rapport sy/sx dans le calcul du coefficient de régression est une correction arithmétique qui permet d’exprimer la corrélation en valeurs brutes (non-standardisées).

23
Q

Une valeur positive de l’ordonnée à l’origine (a) implique que, lorsque X est à zéro, la valeur de Y est plus ________ que zéro.

A

grande

24
Q

Vrai ou faux? Une valeur nulle de l’ordonnée à l’origine implique que, lorsque X est à zéro, la valeur de Y est elle aussi égale à zéro.

A

Vrai; une valeur nulle de a=0.

25
Q

Quelle est l’équation de la droite de régression linéaire?

A

y= a+ bx

26
Q

Vrai ou faux? Lorsque la prédiction de y à partir de x est parfaitement juste, la quantité d’erreurs de prédiction e est égale à zéro.

A

Vrai

27
Q

Vrai ou faux? Lorsque e est positive, nous avons fait une erreur de sous-estimation.

A

Faux; nous avons fait une erreur de surestimation.

28
Q

Vrai ou faux? La droite des moindres carrés est expliquée par la somme des sous-estimations qui est égale à la somme des surestimations.

A

Vrai; la pente de la régression est à la bonne place lorsqu’elle est à la moyenne des erreurs d’estimation.

29
Q

Vrai ou faux? Plus la corrélation est élevée, plus petites sont les erreurs d’estimation.

A

Vrai; on peut s’imaginer un nuage de points. Quand les points sont plus près de la droite, la corrélation est plus forte. La distance verticale entre y^i et yi est plus petite (donc erreur d’estimation plus petite).

30
Q

Calculer l’erreur type si rxy= 0,44
sy= 2,6

A

2,33

31
Q

Quelle est la formule pour prédire la valeur de y à partir de valeurs standardisées?

A

y= B0+Bx