La régression linéaire simple Flashcards

1
Q

Que voulons nous établir avec la corrélation?

A

Nous voulons établir la relation entre 2 variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que voulons nous établir avec la régression?

A

Nous voulons prédire la valeur d’une variable sur une autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’est VI?

A

C’est X : Variable prédictrice

Ex: Nb de cigarette

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que VD

A

C’est Y : La variable prédite

Ex: Espérance de vie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Y a-t-il un lien de causalité dans la régression?

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que faut-il vérifier avant de voir si une variable peut prédire l’autre?

A

On doit vérifier si les 2 variables sont corrélées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dans la régression, sur quoi repose la qualité de prédiction?

A

Sur la force de la relation linéaire entre 2 variables. Plus la corrélation entre les variables est élevée, plus il sera facile de prédire une variable à partir de l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que permet la droite de régression?

A
  1. Elle permet d’effectuer une meilleure prédiction de Y (variable prédite : VD) à partir de X (variable prédictrice : VI)
  2. La droite minimise l’erreur de prédiction et passe par un maximum de point
  3. Elle passe par la moyenne des points du diagramme de dispersion
  4. Avec une corrélation parfait, chaque Y prédit sera identique au Y réel.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qui ferait en sorte qu’il n’y ait aucun erreur de prédiction?

A

Si chaque Y prédit est identique au Y réel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que l’erreur de prédiction?

A

C’est la différence entre le Y réel et le Y prédit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

En régression, on cherche la droite qui … les erreurs de …

Autrement dit, on vise à … les écarts entre les … et les …

A

En régression, on cherche la droite qui minimise les erreurs de prédiction.

Autrement dit, on vise à minimiser les écarts entre les valeurs observées et les valeurs prédites.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans la régression, on cherche à minimiser la somme des différences au carré. Mais pourquoi la somme des différences au carré?

A

Pour ne pas avoir une somme de 0 (ce qui arrivera si on additione des écarts positifs et négatifs)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux

Plus la somme des carré est grande, plus les points sont près de la droites, donc meilleure est la prédiction et moins on fait d’erreur.

A

Faux

Plus la somme des carré est petite, plus les points sont près de la droite, meilleure est la prédiction et on fait moins d’erreur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est l’équation de la régression?

A

Y(prédit) = bX + a

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quel est le b dans l’équation de régression?

A

C’Est la pente de la droite de régression, MAIS c’est aussi le COEFFICIENT DE RÉGRESSION

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que fait-on pour trouver la droite qui offre la meilleure prédiction de Y pour une valeur de X?

A

On cherche les valeurs de a et b qui donneront la fonction linéaire la mieux ajustée. On cherche les valeur de b et de a qui minimise la somme des différences au carré

17
Q

Quelle est la signification de l’ordonnée à l’origine?

A
  1. Savoir le niveau de base

Ex: à quel résultat puis-je m’attendre si un étudiant n’a pas étudié du tout?

a = .43 Donc 43%

18
Q

À quoi peut servir b (ou r)?

A

La valeur de b est le nombre d’unité de changement de Y(prédit) en fonction d’un changement d’une unité de X.

Ex: On cherche à prédire le revenue annuel d’un individu à partir du nombre d’années de scolarité

b = 5000

Si le nb d’années de scolarité augmentait d’un point, quel serait le changement sur le revenu : = 5000

19
Q

Quel coefficient de régression utilise-t-on lorsqu’on parle de données standardisées?

A

bêta p

Pour le distinguer du coefficient de régression non standardisé b

20
Q

Pourquoi utiliser un coefficient de régression standardisé bêta?

A
  1. Indépendant de l’échelle de mesure
  2. Représente le changement de Yprédit en fonction du changement d’un écart type de X
  3. Utile pour comparer l’importance relative de différents B

En régression simple B = r

21
Q

Que signifie le fait que r2 est grand?

A

Plus r2 est grand (plus la corrélation est forte), plus la prédiction est bonne (moins de chance d’erreurs de prédiction)

22
Q

r2 =?

A

Pourcentage de variance de y qui est prédite par X

23
Q

Que détermine le test d’hypothèse sur la régression?

A

Détermine sir la prédiction de Y par C est généralisable à la population

24
Q

Sur quoi est effectué le test inférentiel? Sur quoi est-ce équivalent

A

r2

En régression simple, le résultat est toutefois équivalent à celui qui serait obtenu en faisant le test sur le r ou le b

25
Q

Que signifie le fait que r est significatif?

A

indique automatiquement que b n’est pas égale à 0

26
Q

Vrai ou faux

Si la corrélation est significative, la régression l’est nécessairement

A

VRAI

27
Q

Comment vérifier que r2 n’est pas égale à 0?

A

On fait un test F. On utilise la même logique que celle de l’ANOVA –> rapport de variance

28
Q

Comment savoir si notre test est uni ou bi avec la régression?

A

Comment pour l’ANOVA, il n’est pas question d’uni ou bi

29
Q

Faite la 3e étape de la démarche inférentielle

A

a) Choix du teste: Régression linéaire simple
b) Conditions d’utilisation a) le n est suffisament grand( plus grand ou égale à 20) ; b) les 2 variables sont sur une échelle intervalle ou ratio ; c) il y a une relation linéaire entre les 2 variables ; d) homogénéité des variances ; e) variables sont distribuées normalement
c) Distribution d’échantillonngae du F de Fisher avec 1 dl (TOUJOURS 1) au numérateur et Xdl au dénominateur (n-2)

30
Q

Écriver l’étape 4

A

Fobs (1, n-2) … > ou < Fcrit (1, n-2) = …. Rejet ou non H0

31
Q

Écriver l’étape 5

A
  1. On conclut que l’humeur dépressive permet de prédire 10% de la variance du rendement de travail (r2 = .10)
  2. Si on accepte H0, on aurait dit que l’humeur dépressive ne permet pas de prédir la variance du rendement au travail