Cours1 Flashcards

1
Q

Qu’est-ce une régression linéaire?

A

La régression linéaire représente un modèle statistique avec lequel on peut prédire la valeur de la variable dépendante (variable réponse; y) à l’aide des variables indépendantes (variables prédictives; x).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

La régression linéaire est estimée à partir de :

a. La population
b. L’échantillon

A

b. L’échantillon
La pente B1 et l’ordonnée à l’origine B0 de la population sont inconnues, cependant nous pouvons estimer leur valeur à partir de l’échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Donner la formule exprimant la régression linéaire de la POPULATION.

A

Y= Bo + B1x + E

Dans ce cas, E est la lettre grecque epsilon .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que représente Epsilon dans la formule exprimant la régression linéaire de la POPULATION.

A

Epsilon représente une erreur inconnue (on ne peut pas l’estimer).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Donner la formule exprimant la régression linéaire ESTIMÉE de la population.

A

^y = b0+ b1x

Lorsqu’on parle d’une droite estimée à partir de l’échantillon la variable dépendante est y-chapeau.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Expliquer la technique de minimisation qui sert à tracer la meilleure droite possible.

A

La technique ce nomme: le principe des moindres carrés ordinaires (MCO). Il s’agit de minimiser les écarts verticaux (minimiser les résidus: e). sum(e)^2
À noter: il ne faut pas confondre e avec E (Epsilon).

MCO sert à minimiser les sommes des carrés d’écarts dans une seule direction.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou faux

La variable réponse est mesurée avec une plus grande précision que la variable explicative.

A

Faux
On suppose que la variable explicative x est mesurée avec une grande précision (plus que y) parce qu’elle est contrôlée (non-aléatoire).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Expliquer le partitionnement de la dispersion et y inclure les équations associées à chacune des parties mentionnées.

A

1) La dispersion résiduelle
2) La dispersion expliquée
3) La dispersion totale

1) la dispersion résiduelle représente la distance se trouvant entre la droite et le point.
yi-yi.chapeau

2) la dispersion expliquée est la distance qui sépare la moyenne de la variable réponse (y) et la droite.
yi. chapeau-y.barre

3) La dispersion totale est la somme de 1) et 2).
yi-y.barre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Définir SCT, SCE et SCR et expliquer de quelle façon elles sont reliées.

A

SCR: somme des carrés expliquée par la RÉGRESSION
SCE: somme des carrés des résidus: ERREUR
SCT: Somme de carrés totaux
SCR+SCE=SCT

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vrai ou faux

Plus que SCR augmente, r^2 (coefficient de détermination) diminue.

A

Faux
r^2= SCR/SCT r^2=SCR/(SCR+SCE)
Ainsi, plus que la somme des carrés expliquée par la régression augmente, plus que r^2 augmente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vrai ou faux

Un r^2 faible suggère une SCE élevée.

A

Vrai

Une SCE élevée sous-entend un ensemble de points très dispersé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Définir le coefficient de détermination: r^2.

A

Le coefficient de détermination r^2 mesure la proportion de la variation
de y expliquée par x.
Il est égal au carré du coefficient de corrélation linéaire entre x et y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquer la régression linéaire Type 2/ la régression orthogonale/régression par axe MAJEUR: AM

A

La régression linéaire de type 2 s’applique lorsque x et y sont des variables aléatoires.
Y~X; X~Y
Dans ce cas, le principe MCO n’est plus valide. Il faut minimiser les carrés des écarts perpendiculairement à la courbe.

La régression linéaire de type 2 s’applique lorsque les deux variables aléatoires en présence ont été mesurées avec la même erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Définir un modèle statistique.

A

Une description des relations entre variables (i.e.,les x et y) et donc, entre des processus et des patrons naturels.

Un modèle est une abstraction d’un système réel afin d’en améliorer sa compréhension ou d’en prévoir le comportement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly