Cours 3 Flashcards

1
Q

Définir corrélation partielle.

A

Définition : degré de liaison entre deux variables (y, x) tout en gardant constante l’effet d’une ou plusieurs autres sur les deux variables comparées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Donner l’équation d’un coefficient partiel.

A
Y~X1+X2
– Y~X1 -> ResidusY|X1 = RY|X1
– RY|X1~X2 = b2
– Y~X2 -> ResidusY|X2 = RY|X2
– RY|X2~X1 = b1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Donner les usages de la régression linéaire multiple.

A

– Estimer la contribution relative de deux ou plusieurs variables explicatives à la variation d’une variable à expliquer afin d’améliorer notre capacité prédictive (c.-à-d., réduire l‘SCE)
Prédiction

– Mieux comprendre l’importance relative de ces différents facteurs pour
expliquer la variation de notre processus ou notre patron d’intérêt.
Compréhension

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nommer des façons d’obtenir la valeur des coefficients partiels.

A
  1. Calcul matriciel (programmes d’ordinateur)
  2. Système de m équations à m inconnues (calcul manuel; algèbre linéaire)

N.B. Les calculs fournissent :
– les coefficients bj correspondant aux variables brutes,
– mais aussi les coefficients centrés-réduits b’j

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi est-il une bonne habitude de centrer réduire les coefficients de régression?

A
  • Les prédicteurs peuvent varier en termes d’unités et de variance
  • Cela peut rendre difficile la comparaison de l’influence relative ou de l’importance des différents prédicteurs dans votre modèle de régression multiple
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Nommer les façons de centrer-réduire les coefficients de régression.

A
  1. Centrez et réduisez (normalisez ou «scale») vos prédicteurs avant d’ajuster le modèle
    ## Coefficients bruts…
    mod1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Expliquer la différence entre R^2 et R^2 ajusté.

A
  • R2 non-ajusté : mesure la proportion de variance dans y expliquée par toutes les variables explicatives (xi).
  • R2 ajusté : mesure la part de la variance expliquée par les variables explicatives en tenant compte des degrés de liberté respectifs du numérateur et du dénominateur du test F. Prévient le sur-ajustement (« overfitting »).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Compléter la phrase.

Pour un test de signification de la régression linéaire multiple, on rejette Ho lorsque…

A

F≥F(α,m,n−m−1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel test statistique est utilisé pour déterminer la signification des coefficients de régression?

A

Un test T

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles tables sont utiles pour résumer les régressions multiples?

A

Les tables ANOVA.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Différencier la régression linéaire multiple de la régression linéaire simple.

A

La régression linéaire multiple compte PLUSIEURS variables explicatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou faux.
Contrairement, à la régression linéaire simple, la régression linéaire multiple peut avoir des variables semi-quantitatives.

A

Faux. Les variables sont quantitatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquer la supposition de la linéarité dans le cas d’une régression linéaire multiple

A

Linéarité des relations entre y et chacune des variables explicatives xj.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Compléter la phrase.

Les variables explicatives doivent ne pas être ________.

A

CORRÉLÉES

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Expliquer la supposition de la normalité dans le cas d’une régression linéaire multiple.

A

En général, la variable dépendante y doit être normale, mais pas nécessairement les variables explicatives xj.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Compléter la phrase.

En général, il n’est pas souhaitable d’avoir une corrélation entre deux variables prédictives supérieure à ___.

A

0.7

Sinon, le risque est que le signe des coefficients de régression change!

17
Q

Donner la formule de la régression polynomiale quadratique.

A

y-chapeau= bo+b1x1 + b2x2 + epsilon

18
Q

Comment respectons le principe des moindres carrés en situation de régression linéaire simple?

A

Le plan est ajusté selon le principe des moindres carrés où les sommes des carrés
des erreurs d’estimation de la variable dépendante sont minimisées.

19
Q

Comment se nomment les variables b1 b2 b3… bm dans l’équation d’une régression linéaire multiple?

A

Des coefficients de régression partielle