Cours 3 Flashcards
Définir corrélation partielle.
Définition : degré de liaison entre deux variables (y, x) tout en gardant constante l’effet d’une ou plusieurs autres sur les deux variables comparées.
Donner l’équation d’un coefficient partiel.
Y~X1+X2 – Y~X1 -> ResidusY|X1 = RY|X1 – RY|X1~X2 = b2 – Y~X2 -> ResidusY|X2 = RY|X2 – RY|X2~X1 = b1
Donner les usages de la régression linéaire multiple.
– Estimer la contribution relative de deux ou plusieurs variables explicatives à la variation d’une variable à expliquer afin d’améliorer notre capacité prédictive (c.-à-d., réduire l‘SCE)
Prédiction
– Mieux comprendre l’importance relative de ces différents facteurs pour
expliquer la variation de notre processus ou notre patron d’intérêt.
Compréhension
Nommer des façons d’obtenir la valeur des coefficients partiels.
- Calcul matriciel (programmes d’ordinateur)
- Système de m équations à m inconnues (calcul manuel; algèbre linéaire)
N.B. Les calculs fournissent :
– les coefficients bj correspondant aux variables brutes,
– mais aussi les coefficients centrés-réduits b’j
Pourquoi est-il une bonne habitude de centrer réduire les coefficients de régression?
- Les prédicteurs peuvent varier en termes d’unités et de variance
- Cela peut rendre difficile la comparaison de l’influence relative ou de l’importance des différents prédicteurs dans votre modèle de régression multiple
Nommer les façons de centrer-réduire les coefficients de régression.
- Centrez et réduisez (normalisez ou «scale») vos prédicteurs avant d’ajuster le modèle
## Coefficients bruts…
mod1
Expliquer la différence entre R^2 et R^2 ajusté.
- R2 non-ajusté : mesure la proportion de variance dans y expliquée par toutes les variables explicatives (xi).
- R2 ajusté : mesure la part de la variance expliquée par les variables explicatives en tenant compte des degrés de liberté respectifs du numérateur et du dénominateur du test F. Prévient le sur-ajustement (« overfitting »).
Compléter la phrase.
Pour un test de signification de la régression linéaire multiple, on rejette Ho lorsque…
F≥F(α,m,n−m−1)
Quel test statistique est utilisé pour déterminer la signification des coefficients de régression?
Un test T
Quelles tables sont utiles pour résumer les régressions multiples?
Les tables ANOVA.
Différencier la régression linéaire multiple de la régression linéaire simple.
La régression linéaire multiple compte PLUSIEURS variables explicatives.
Vrai ou faux.
Contrairement, à la régression linéaire simple, la régression linéaire multiple peut avoir des variables semi-quantitatives.
Faux. Les variables sont quantitatives.
Expliquer la supposition de la linéarité dans le cas d’une régression linéaire multiple
Linéarité des relations entre y et chacune des variables explicatives xj.
Compléter la phrase.
Les variables explicatives doivent ne pas être ________.
CORRÉLÉES
Expliquer la supposition de la normalité dans le cas d’une régression linéaire multiple.
En général, la variable dépendante y doit être normale, mais pas nécessairement les variables explicatives xj.