COURS 11: La régression linéaire Flashcards

1
Q

Quelle est la différence entre la corrélation et la régression?

A

Corrélation : établir la relation entre 2 variables
Régression: Prédire la valeur d’une variable (Y) à partir d’une autre variable (X)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

V/F Lors de la régression, un lien de causalité est établi entre la valeur X et Y.

A

FAUX

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Lors de la régression, quel nom donne-t-on à la variable dépendante et indépendante?

A

VI: Variable prédictrice (X)
VD: Variable prédite (Y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

V/F La variable prédictrice peut devenir la variable prédite et vise-versa

A

Vrai, puisqu’elles ne sont pas causales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Sur quoi repose la qualité de la prédiction d’une régression?

A

La force de la relation linéaire (avec une corrélation parfaite, on aurait une prédiction parfaite).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

V/F La droite de régression n’est pas la droite qui permet de faire la meilleure prédiction de Y à partir de X.

A

Faux, c’est la droite qui permet la meilleure prédiciton

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La droite de régression ……. l’erreur et passe par un ……. de points.

A
  1. Minimise
  2. Maximum
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

V/F La droite de régression passe par la moyenne des points du diagramme de dispersion.

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

V/F Il existe une infinité de droite de régression pour un nuage de points.

A

FAUX, il existe une infinité de droites, mais seulement une seule droite de régression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Donne l’équation de régression

A

Ŷ=bx + a

Ŷ: valeur de Y prédite
X: valeur du prédicteur (connu)
b: pente de la droite de régression (coefficient de régression)
a: ordonnée à l’origine (constante)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Donne 2 propriété de la droit tracée par l’équation de régression.

A
  1. Minimise les distances entre la droite et les points
  2. Permet la meilleure prédiction de Ŷ à partir de X
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

V/F Avec la régression linéaire multiple, il y aurait plusieurs prédicteurs, tandis qu’avec la régression linéaire simple il n’y a qu’un seul prédicteur.

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

V/F Même avec une corrélation parfaite, le Ŷ diffèrera du Y réel.

A

FAUX, il sera identique (aucune erreur). En absence d’une corrélation parfaite, les Y réels seront en dessous ou au dessus de la droite de régression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Donne la formule qui donne l’erreur de prédiction.

A

Erreur de prédiction = Y - Ŷ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

V/F L’erreur de prédiction peut aussi être appelée résidu

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

En régression, on cherche la droite qui …… les résidus.

A

minimise

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Lors du calcul de la droite, on cherche à minimiser Σ(Y-Ŷ)^2. Pourquoi met-ton la somme des différence au carré?

A

Pour ne pas avoir une somme de 0, ce qui produirait si on additionnait seulement les écarts par rapport à la moyenne.

18
Q

Comment calcule-t-on le b de la droite de régression/ le coefficient de régression?

A

b= COVxy/Sx^2

19
Q

Quelle est la différence entre la formule du coefficient de régression et celle du coefficient de corrélation?

A

1.Régression : divisée par Sx^2
2. Corrélation: divisé par Sx * Sy

20
Q

Comment calcule-t-on le a de la droite de régression?

A

a= Y-bx

21
Q

Quelle est la signification de l’ordonnée à l’origine (dans certains contextes)?

A

Utile lorsqu’on veut connaître le niveau de base d’une valeur. Ex: si on prédit le temps de réaction avec alcool, l’ordonnée à l’origine indique le temps de réaction SANS alcool.

  • Attention, l’ordonnée à l’origine n’a pas toujours de signification particulière.
22
Q

Qu’elle est la signification du coefficient de régression (b)?

A

Le nombre d’unités de changement de Ŷ en fonction d’UNE unité de X.

23
Q

Que signifie β?

A

Le coefficient de régression STANDARDISÉ. En régression simple, β = r (coefficient de corrélation). Changement Ŷ de en fonction d’un écart-type.

24
Q

Pourquoi utiliser β au lieu de b?

A
  • Indépendant de l’échelle de mesure
  • Utile pour comparer l’importance relative de différents β (plusieurs variables prédictrices en régression multiple).
25
Q

Quel est le meilleur indice de la qualité de la prédiction?

A

r^2: plus r^2 est grand, meilleure est la prédiction.

26
Q

Que signifie r^2/ p^2 dans une régression linéaire simple?

A

r^2= % de la variance de Y qui est prédite par X

27
Q

Sur quoi le test d’hypothèses de régression est faite?

A

Sur r^2. Si la corrélation est significative, la régression l’est nécessairement.

28
Q

V/F Si un r^2 est significatif, le b l’est nécessairement.

A

Vrai

29
Q

Avec quel test vérifions-nous l’hypothèse r^2 ≠ 0?

A

Test F

30
Q

V/F Lors d’un test F sur r^2, on utilise la même logique de celle de l’ANOVAM soit un rapport de variances.

A

VRAI

31
Q

Que compare-t-on dans le test F sur r^2?

A

Variabilité de Y attribuable à X VS variabilité de Y non attribuable à X. Si X explique un % suffisant de la variance de Y, on conclu que X permet de prédire Y dans la population.

32
Q

Donne les formules et la signification des différentes sommes de carrés de la démarche inférentielle de la régression.

A
  • SCy: Variation totale de Y = Σ(Y-Ȳ)^2
  • SCŶ: Variation de Y expliquée par X = Σ(Ŷ-Ȳ)^2
  • SCrésiduelle: Variation de Y non expliquée par X = Σ(Y-Ŷ)^2
33
Q

V/F Dans un test avec une droite de régression, le degré de liberté résiduell est toujours égal à 1.

A

FAUX, c’est le degré de liberté de régression qui est toujours égal à 1.

34
Q

Quelle est la formule du r^2?

A

r^2= SCrégression/ Sctotal

35
Q

Donne les formules du CMrégression, CMrésiduel et du F dans une démarche inférentielle de régression.

A

CMrégression = SCrégression/ dlrégression
CMrésiduelle= SCrésiduelle/ dlrésiduelle
F= CMrégression/ CMrésiduelle

36
Q

Quels test SPSS effectue lors du test de la pente?

A
  1. Test F pour vérifier r^2≠o
  2. Test t pour vérifier b≠0
37
Q

V/F Lors d’une régression simple (un seul prédicteur), les résultats des 2 test de la pente sont identiques.

A

VRAI, le test t n’est utile que pour la régression multiple.

38
Q

Donne les hypothèses statistiques de la démarche inférentielle sur la régression (H0 et H1).

A

H0: p^2 = 0
H1: p^2 ≠ 0
MÊMES QUE POUR CORRÉLATION, on vérifie la présence d’une relation linéaire.

39
Q

V/F Lors de la démarche inférentielle sur la régression, il est possible de poser des hypothèses statistiques unilatéral et bilatéral.

A

FAUX, pas question de uni-bilatéral (comme avec ANOVA)

40
Q

Effectue l’étape 3 de la démarche inférentielle sur régression linéaire simple.

A

Étape 3: Préciser le modèle utilisé et effectuer l’analyse
a) Choix du test utilisé: Régression linéaire simple
b) Conditions d’utilisation:
* n est suffisament grand (n>20)
* Variables sur une échelle intervalle ou ratio
* Relation linéaire entre les 2 variables
* Homogénéité des variances
* Variables distribuées normalement
c) Distribution d’échantillonnage du F de fisher avec 1 dl au numérateur et (n-2) dl au dénominateur
d) Calculs du r^2, du Fobs et trouvr valeur de F associée à au a (Fcritique)

41
Q

Lors de la démarche inférentielle sur régression linéaire simple sur SPSS, où trouve-t-on ces variables?
* Le r
* le r^2
* les dl
* Fobs
* p du F (sig)
* a
* b
* β
* t
* p du t (sig)

A

Tableau: Corrélation OU Récapitulatif des modèles
* Le r: Corrélation de pearson, rendement / BDI OU 1/R (n’indique pas la direction)

Tableau: récapitulaif des modèles
* le r^2 : 1/ R-deux

Tableau: ANOVA
* les dl: 1 Régression/ ddl (régression) ET 1 de Student/ ddl (résidu)
* Fobs: 1/ F
* p du F (sig): 1/Sig

Tableau: Coefficient
* a: Constante/ B
* b: BDI/ B
* β: BDI / Bêta
* t: BDI/ t
* p du t sig : BDI/ sig

Vraiment pas claire, ouvre tes notes… LOL