TD 7 - Introduction de la régression multiple et propriétés des vecteurs aléatoires. Flashcards
Rappel : SCT, SCE & SCR.
SCT = ∑ (yn - Ÿ)² SCE = ∑ (^yn - ^Ÿ)² SCR = ∑^Ƹn²
R²
R²=Var emp ^y / Var emp y
R²=SCE/SCT
R²=(SCT-SCR)/SCT
R²=1-(SCR/SCT)
Avec :
SCT = ∑ (yn - Ÿ)²
SCE = ∑ (^yn - ^Ÿ)²
SCR = ∑^Ƹn²
⚠️Il faut toujours une constante pour calculer R².
Relation entre R² et SCR
R²=1-(SCR/SCT)
Si SCR est petit, on enlève peu au R² et le modèle est meilleur. On essaie donc de le minimiser.
⚠️Il faut toujours une constante pour calculer R².
Ecrire le problème des MCO pour un modèle y=a+bx
On cherche les estimateurs de a et b tel que
Min ∑ (y-(a+bx))²
² : Car on veut minimiser une distance et les Ƹ peuvent être négatifs.
Impact d’ajouter des variables sur le SCR.
Il ↓ et donc le R²↑ et le modèle devient meilleur.
Deux modèles a et b avec SCRa>SCRb
Que peut-on dire sur R²a et R²b ?
Si SCRa>SCRb alors R²a<R²b.
⚠️Il faut toujours une constante pour calculer R².
¨R²
“R carré barre”
R² ajusté d’une régression.
¨R² = 1 - [ N-1/N-(p+1) ] x [SCR/SCT]
¨R² = 1 - [ N-1/N-(p+1) ] x [1-R²]
Avec :
p : nombre de variables.
p+1 : nombre de paramètres.
N : nombre d’observations.
Si R²a<R²b ➾ ¨R²a ? ¨R²b ?
Pas de lien entre R²aune régression.
¨R² = 1 - [ N-1/N-(p+1) ] x [1-R²]
Si [1-R²] ↓ → [ N-1/N-(p+1) ] peut ↑.