QM - Linear regression Flashcards
Formule : Yi = β1.Xi + b0 (+e)
Donne les formules des elements suivants
Y
Beta (b1)
Slope (b0)
e
Y
X
b1 (Beta) = Cov x,y / variance de x. avec X la variable
indépendante.
b0 = Yi - b1.Xi
Attention a ne pas confondre avec la formule de la correlation et du Beta dans PM.
Que minimise la droite de regression linéaire ?
Les écarts entre chaque points et la moyenne
Avec un Beta de 4, comment évolue la valeur de la variable dépendante en cas d’augmentation de la valeur de la variable indépendante de +5.
+20
Qu’est-ce que b1 et b0 ?
b1 : Beta c’est la pente
b0 : intercept term
Donnez les significations de SSE, SSR, et SST et trés simplement comment sont ils reliés.
SSE : Sum of squared errors. Differences les observations et les predicted values
SSR : Regression sum of squares. Differences entre la moyenne et les predicted values
SST : Total sum of squares. Differences entre le a moyenne et les observations
SSR : Partie de la variation de Y expliquée par X
SSE : Partie de la variation de Y non expliquée par X
SST = SSR + SSE
Coefficient de determination R^2
R^2 = SSR/SST.
ou
r = R donc r^2 = R^2
Le coefficient de determination correspond au % de la variation de Y (variable déprenante) expliquée par la variation de X (variable indépendante).
Formules (Cas d’une régression linéaire simple)
MSR
MSE
Tests d’hypotheses sur régression linéaire :
- Fc
- b1 (Slope coefficient)
Les deux test permettent de statuer sur b1 (slope coefficient).
MSR = SSR/1 = SSR
MSE = SSE/ n-2
Rappel : SSE et SSR sont données, on ne connaît pas les formules.
F-stat = MSR/MSE
Il s’agit d’un one tail test.
T-stat = (b1 - b)/std.
Il s’agit d’un two-tailed test.
ddof n - 2
On peut utiliser Z pour calculer les valeurs critiques si
l’échantillon est suffisamment grand
Test d’hypothèse en regression linéaire :
Sur quels elements le test d’hypothèse sur regression linéaire peut porter ? Preciser s’il s’agit d’un one or two tailed test.
b1
Donner les valeurs des valeurs critiques à 99%, 95%, 90% de la loi normale Z.
2,58
1,96
1,65
Quels sont les 4 règles pour qu’un modèle de regression linéaire soit dit valide ?
- Relation linéaire entre Y et X
- Variance égale de l’erreur résiduelle (Homoskedasticity de e)
- Indépendance de l’erreur résiduelle (e)
- Distribution normale de l’erreur résiduelle (e)
Intervalle de confiance de Yi.
[ Yi - tc.Std ; Yi + tc.Std ]
On peut utiliser les valeurs critiques de Z si l’échantillon est suffisamment grand.
(La std est celle de la variable indépendante x)
One of the 4 assumptions to asses the linear regression as valid is “Linear relationship between X and Y”
What happened if the relationship isn’t linear ?
3 possibilités :
Log - Lin Model : Y log et X linear
Lin - Log Model : Y linear et X log
Log - Log Model : Y log et X log
Si on a “Model of a relative change (log) in the independent variable and an absolute change (lin) in the dependent variable” alors on a un Log-Lin Model.
Donnez 3 exemples de cas de regression linéaire en précisant la variable indepdenante et déprenante.
.