Mini test 3 Flashcards
Qu’est-ce que la régression multiple ?
Extension de la régression simple pour les cas où nous avons plusieurs variables explicatives continues
La régression multiple est tout indiquée pour les cas où la variable d’intérêt (Y) est …
influencée par
plusieurs choses en même temps
Qu’est ce que β1 ?
β1 est la pente partielle pour la variable X1
Le changement en Y par unité de X1 en gardant la valeur de toutes les autres variables constantes
Qu’est-ce que εi ?
Résidu associé à la i ème observation
Comment sont estimés les paramètres de la régression multiple ?
Méthode des moindres carrés
Pentes partielles
Vrai ou faux, On estime autant de pentes partielles qu’il y a de variables dans le modèle + l’ordonnée à l’origine.
Vrai
Comment est fait le test d’hypothèse du modèle entier ?
En comparant les ratio de MSRégression / MSRésidus à une distribution de F
Comment tester chacune des pentes ?
Stratégie 1 : comparer l’ajustement, test de F partiel
Stratégie 2 : Test de
Qu’est-ce que le test de F partiel ?
Différence de variance / Variance des résidu
Quelle stratégie pour tester les pentes est la plus flexible ?
Test de F, car on peut enlever des groupes de variables entiers
Est-ce que le R2 peut être utilisé dans la régression multiple ?
Non, Le R2 ne peut PAS être utilisé pour comparer des modèles ayant un nombre différent de paramètres
Comment savoir quelles variables dans un modèle a un grand effet ?
Pente standardisée
En modélisant les variables centrées-réduites
Comment calculer la pente standardisée ?
bj = bj (Sxj/Sy)
Quelles sont les 5 assomptions de la régression multiple ?
- Normalité
- Homogénéité de la variance
- Indépendance
- X est fixe
- Les variables prédictives ne sont pas corrélées entre-elles (colinéarité).
Comment peut être valider les modèles ?
Levier
Résidus
Influence (distance de Cook > 1)
Quelle est l’étape la plus importante de la modélisation ?
Validation des résidus
Quand est-ce que se produit la colinéarité ?
Ce phénomène se produit lorsque des variables explicatives sont corrélées entre elles
Quels sont les impacts de la colinéarité ?
Les estimés de paramètres sont instables
Les intervalles de confiance sont gonflés
Comment quantifier la colinéarité ?
Tolérance : 1 - R2 d’une régression entre une variable et les autres variables explicatives. Plus la tolérance est grande, plus cette variable est indépendante des autres.
VIF (variance inflation factor) = 1 / Tolerance. Plus le VIF est élevé, plus cette variable ajoute de l’instabilité au modèle à cause de sa colinéarité avec les
autres.
Quelles sont les options à la colinéarité ?
Omettre du modèle les variables qui sont fortement corrélées avec celles
déjà dans le modèle.
Baser l’analyse sur les axes d’une ACP.