Semaine 14 : La régression Flashcards

1
Q

À quoi nous sert la régression?

A

À prédire la valeur d’une variable (Y) avec une autre (X).

Soit qu’on prédit X par rapport à Y; ou on prédit Y par rapport à X.

**On ne saura jamais quelle variable influence l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vrai ou faux? La régression linéaire et la corrélation sont fréquemment rencontrées conjointement.

A

Vrai. Ainsi, si on ne trouve pas de corrélation significative entre 2 variables et qu’on fait une régression, on va se rendre compte qu’il n’est pas possible de prédire la variable Y à partir de X.

L’inverse est vrai aussi, si on trouve une corrélation significative entre 2 variables, on va aussi être capable de prédire la variable Y à partir de X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Sur quoi repose la qualité de la prédiction?

A

La qualité de la prédiction repose sur la force de la relation linéaire entre les 2 variables.

Plus la corrélation entre les variables est élevée, plus il sera facile de prédire une variable à partir de l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

À quoi sert la droite de régression?

A

La droite permet d’effectuer la meilleure prédiction de Y à partir de X.

Elle minimise l’erreur de prédiction et passe par un maximum de points.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou faux? La droite de régression passe par la moyenne des points du diagramme de dispersion.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que l’erreur de prédiction (résidu)?

A

C’est la différence entre le Y réel (observé) et le Y prédit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou faux? En régression, on cherche la droite qui minimise les erreurs de prédiction ou résidus. Autrement dit, on vise à minimiser les écarts entre les valeurs observées et les valeurs prédites.

A

Vrai.

On cherche à minimiser la somme de carrés des écarts entre les valeurs observées et les valeurs prédites.

Somme des différences au carré –> Pour ne pas avoir une somme de 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrai ou faux? On souhaite que la somme de carrés soit la plus grande possible.

A

Faux. On souhaite que la somme de carrés soit la plus PETITE possible!

Plus elle est petite, plus les points sont près de la droite, meilleure est la prédiction (on fait moins d’erreurs).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est l’équation de régression?

A

^Y = bX + a

b = Pente de la droite de régression (coefficient de régression)

a = Ordonnée à l’origine (valeur de ^Y quand X = 0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que représente la pente (ou coefficient de régression)?

A

La valeur de b est le nombre d’unités de changement de ^Y en fonction d’un changement d’une unité de X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la différence entre la variable “b” et “β”?

A

β = Lorsqu’on a standardisé nos données (scores Z) avant d’appliquer notre droite de régression, on attribue au coefficient de régression standardisé la variable β (pour le différencier du coefficient de régression non standardisé : b)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Pourquoi utiliser un coefficient de régression standardisé (β)?

A
  1. Indépendant de l’échelle de mesure
  2. Représente le changement de ^Y en fonction du changement d’un ÉCART-TYPE (plutôt que d’une unité) de X
  3. Utile pour comparer l’importance relative de différents β
    (ex : Prédire la note à l’examen en fonction du nb d’heures d’études (X1), du niveau de stress (X2) et du nombre d’heures de sommeil (X3)).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

En régression simple, comment trouve-t-on la valeur de β?

A

En régression simple, β = r

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux? Plus r^2 est petit, plus la prédiction est bonne.

A

Faux. Plus r^2 est grand (plus la corrélation est forte), plus la prédiction est bonne (moins de chance d’erreurs de prédiction).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

À quoi sert le test d’hypothèse sur la régression (test inférentiel)?

A

À déterminer si la prédiction de ^Y par X est généralisable à la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que peut-on conclure par rapport à la valeur de b si on obtient un r significatif?

A

Un r significatif indique automatiquement que b n’est pas égal à 0.

Une pente de 0 (b = 0) –> Ligne horizontale plate

17
Q

Vrai ou faux? Si la corrélation est significative, la régression l’est nécessairement.

A

Vrai.

18
Q

Quel test doit-on utiliser pour vérifier si r^2 n’est pas égal à 0 dans la population?

A

Il faut effectuer un test F.

19
Q

Comme dans l’ANOVA, on utilise les sommes de carrés dans la démarche inférentielle (avec les régressions). Quels sommes de carrés sont utilisées et à quoi correspondent-elles?

A
  1. SCtotale —> Variation totale de Y
  2. SCrégression —> Variation de Y expliquée par X
  3. SCrésiduelle —> Variation de Y non expliquée par X
20
Q

Dans la démarche inférentielle (avec régression), quel calcul permet de trouver la valeur de r^2?

A

SCrégression / SCtotale