Régression multiple Flashcards
Quel est le but de la régression multiple?
Évaluer le degré de relation entre plusieurs prédicteurs et la VD
Combien de variables y-a-t-il en régression multiple?
Au moins 2 VI/prédicteurs et 1 VD/critère
Comment sont les VI en régression multiple?
D’échelle continue ou nominale dichotomique (dummy/factice)
Comment est la VD en régression multiple?
Continue!!!
*Si dichotomique = régression logistique (pas dans cours)
Que se passe-t-il lorsqu’on ajoute des variables prédictives?
On augmente la précision de l’estimation de la VD en diminuant la variance inexpliquée
Quelles sont les deux étapes principales de la régression multiple?
- Déterminer la variance expliquée par l’ensemble des VI (R et R2)
- Déterminer quels sont les prédicteurs significatifs
Quelle est l’équation de la régression linéaire SIMPLE?
Ŷ= a + bX
Ŷ: VD critère prédite
X: prédicteur
b: pente de la droite de régression
a: ordonnée à l’origine
Qu’est-ce qu’un résidu dans la droite de régression?
Distance entre point (score observé) et ligne (score prédit): Y - Ŷ
Quelle est l’équation de la régression multiple?
Ŷ = a + b1X1 + b2X2 + … +bpXp
p: nombre de prédicteurs
**Inclure pente et X de chaque prédicteur
Comment est formulée l’hypothèse de la régression multiple?
H1: Au moins 1 B diffère de zéro
H0: Aucun B diffère de zéro
*Mais possible d’en faire une pour chaque prédicteur (ex: la faible proximité est liée à un plus grand degré d’insatisfaction conjugale)
En sciences humaines, environ combien de % maximum est expliqué par un prédicteur?
30-40%
Quels sont les postulats à vérifier pour la régression multiple?
1.Taille de l’échantillon
2. Absence de multicolinéarité
3. Normalité des résidus
4. Absence de valeur extrême multivariée
5. Homoscédasticité et linéarité des résidus
Comment vérifie-t-on le postulat de la taille de l’échantillon?
Taille doit être suffisante pour le nombre de prédicteurs (p)
-Calcul dans G*power à priori
OU
-N > 20 x p (tabarchnick et fidel)
Comment vérifie-t-on le postulat de l’absence de multicolinéarité et de singularité?
Dans le tableau de corrélations dans SPSS:
s’assurer que les VI ne sont pas trop corrélées entre elles (r plus petit que 0,7)
-Rapporter la plus basse et la plus haute (montre que tous en dessous de 0,7)
*absence de singularité (PAS r = 1)
**Solution: éliminer une variable si 2 sont trop semblables
Comment vérifie-t-on le postulat de normalité des résidus?
APRÈS L’ANALYSE!
Crée variable ZRES_ pendant l’analyse et faire normalité après