Régression multiple Flashcards

1
Q

Quel est le but de la régression multiple?

A

Évaluer le degré de relation entre plusieurs prédicteurs et la VD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Combien de variables y-a-t-il en régression multiple?

A

Au moins 2 VI/prédicteurs et 1 VD/critère

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment sont les VI en régression multiple?

A

D’échelle continue ou nominale dichotomique (dummy/factice)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment est la VD en régression multiple?

A

Continue!!!

*Si dichotomique = régression logistique (pas dans cours)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que se passe-t-il lorsqu’on ajoute des variables prédictives?

A

On augmente la précision de l’estimation de la VD en diminuant la variance inexpliquée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les deux étapes principales de la régression multiple?

A
  1. Déterminer la variance expliquée par l’ensemble des VI (R et R2)
  2. Déterminer quels sont les prédicteurs significatifs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est l’équation de la régression linéaire SIMPLE?

A

Ŷ= a + bX

Ŷ: VD critère prédite
X: prédicteur
b: pente de la droite de régression
a: ordonnée à l’origine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’un résidu dans la droite de régression?

A

Distance entre point (score observé) et ligne (score prédit): Y - Ŷ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est l’équation de la régression multiple?

A

Ŷ = a + b1X1 + b2X2 + … +bpXp

p: nombre de prédicteurs

**Inclure pente et X de chaque prédicteur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment est formulée l’hypothèse de la régression multiple?

A

H1: Au moins 1 B diffère de zéro
H0: Aucun B diffère de zéro

*Mais possible d’en faire une pour chaque prédicteur (ex: la faible proximité est liée à un plus grand degré d’insatisfaction conjugale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En sciences humaines, environ combien de % maximum est expliqué par un prédicteur?

A

30-40%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les postulats à vérifier pour la régression multiple?

A

1.Taille de l’échantillon
2. Absence de multicolinéarité
3. Normalité des résidus
4. Absence de valeur extrême multivariée
5. Homoscédasticité et linéarité des résidus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment vérifie-t-on le postulat de la taille de l’échantillon?

A

Taille doit être suffisante pour le nombre de prédicteurs (p)

-Calcul dans G*power à priori
OU
-N > 20 x p (tabarchnick et fidel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment vérifie-t-on le postulat de l’absence de multicolinéarité et de singularité?

A

Dans le tableau de corrélations dans SPSS:
s’assurer que les VI ne sont pas trop corrélées entre elles (r plus petit que 0,7)
-Rapporter la plus basse et la plus haute (montre que tous en dessous de 0,7)

*absence de singularité (PAS r = 1)

**Solution: éliminer une variable si 2 sont trop semblables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment vérifie-t-on le postulat de normalité des résidus?

A

APRÈS L’ANALYSE!
Crée variable ZRES_ pendant l’analyse et faire normalité après

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment vérifie-t-on le postulat de l’absence de valeur extrême multivariée?

A

Pour s’assurer qu’il n’y a pas de valeurs extrêmes:

Convention: Distance de Cook (VI et VD)
-S’assurer que valeur MAX < 1 (si plus grande, tester sans car peut changer l’analyse)

SINON faire les deux:
-Résidus standardisés (VD: s’assurer que min et max dépasse pas 3)
-Bras de levier (VI: s’assurer que MAX < 3(p+1)/N)

17
Q

Comment vérifie-t-on le postulat d’homoscédasticité et linéarité des résidus?

A

Vérifie que la relation entre VD prédite et résidus est linéaire et égale tout au long de la droite

*À l’aide d’un diagramme, on cherche un biscuit au chocolat des résidus standardisés (ZRESID) autour des scores prédits standardisés (ZPRED)

17
Q

Comment vérifie-t-on le postulat d’homoscédasticité et linéarité des résidus?

A

Vérifie que la relation entre VD prédite et résidus est linéaire et égale tout au long de la droite

*À l’aide d’un diagramme, on cherche un biscuit au chocolat des résidus standardisés (ZRESID) autour des scores prédits standardisés (ZPRED)

18
Q

En quoi consiste le R?

A

Coefficient de corrélation multiple (pas utile)

19
Q

En quoi consiste le R2?

A

Coefficient de détermination (R2): exprime le % de variance expliquée par l’ensemble des prédicteurs
*R2 ajusté est moins biaisé = prioriser

*5% de variation bien en psycho

20
Q

À quoi sert le test F dans la régression multiple?

A

Teste H0 omnibus (tous les B = 0): permet de déterminer si la variance expliquée par VI est supérieure à la variance inexpliquée

*Si au moins 1 B diffère de 0 = rejet H0
**On interprète pas le F

21
Q

À quoi sert le test t dans la régression multiple?

A

Tester la signification (p < 0,05) de chaque prédicteur
*Utilise B standardisé pour l’interprétation

22
Q

Que faisons-nous après avoir déterminé les prédicteurs significatifs de la régression multiple?

A

Il faut calculer le % de variance unique de chaque prédicteur sig:
-Taille de l’effet: trouver la corrélation semi-partielle et mettre au carré (sr2)

23
Q

Sur quoi repose la décision statistique de l’analyse de régression (globalement)?

A

Sur le test F!! Si significatif = au moins 1 prédicteur qui diffère de 0 (rejet H0)

24
Q

Que devons-nous inclure dans la rédaction de la régression multiple?

A

-Notation F: F(ddl) = 123, p < 0,005
-R2aj = 0,123 (12% de variance expliqué)
-Coefficients de régression de X (B = 123, p < 0,001, sr2 = 123)
*rapporte aussi b et p des prédicteurs non significatifs mais pas sr2

25
Q

Vrai ou faux: les prédicteurs prédisent le critère?

A

FAUX!! Ce n’est pas une causalité, c’est un lien DONC peut dire qu’associé ou relié

26
Q

Que signifie un bêta négatif?

A

Signifie que la relation va dans le sens contraire

27
Q

En quoi consiste la régression multiple standard?

A

-Les variables sont entrées simultanément dans l’analyse
-Permet de connaître % de variance UNIQUE (sr2) de chaque VI = sait la contribution de chaque VI

28
Q

En quoi consiste la régression multiple hiérarchique (séquentielle)?

A

Variables sont entrées selon un ordre prédéterminé par le chercheur:
a) Variables contrôles puis variables à l’étude OU
b) Variables plus importantes puis secondaires OU
c) Variables documentées puis nouvelle variable

**Permet de voir le % de variance expliqué ajouté par la 2e VI

29
Q

En quoi consiste la régression multiple statistique?

A

SPSS décide de l’ordre d’entrée des données sur la base des données (par sélection, par élimination, pas à pas)

*Plus en exploratoire
**Minimum 40 participants par VI